네트워크 동질성 현상의 알고리즘적 측면

네트워크 동질성 현상의 알고리즘적 측면

초록

이 논문은 그래프의 부분 색칠을 완전 색칠로 확장하면서 “행복한” 정점·간선을 최대화하는 두 문제, MHV와 MHE를 정의한다. 색상 수 k가 2일 때는 다항시간 해결이 가능하지만, k≥3이면 NP‑hard임을 증명한다. 또한 MHV에 대해 𝟏⁄k 혹은 Ω(Δ⁻³) 중 큰 값을 보장하는 근사 알고리즘을, MHE에 대해서는 1/2‑근사 알고리즘을 제시한다.

상세 분석

본 연구는 사회·생물 네트워크에서 관찰되는 “동질성 현상”(homophily)을 정량화하기 위해, 그래프 G=(V,E)에 부분 색칠 c:V→{1,…,k}가 주어졌을 때 남은 정점을 어떻게 색칠할 것인가에 초점을 맞춘다. 정점 v가 자신의 모든 이웃과 동일한 색을 가질 경우 ‘행복한 정점’이라 정의하고, 간선 uv가 동일 색을 가질 때 ‘행복한 간선’이라 정의한다. 두 최적화 목표는 각각 행복한 정점 수를 최대로 하는 MHV(Maximum Happy Vertices)와 행복한 간선 수를 최대로 하는 MHE(Maximum Happy Edges)이다.

먼저 k=2인 경우를 분석한다. 이때는 각 정점이 두 색 중 하나만을 선택하므로, 행복한 정점·간선 조건을 만족시키는 제약이 이분 그래프의 절단 문제와 동형임을 보인다. 구체적으로, MHV는 “모든 정점이 같은 색을 갖는 연결 성분을 최대화”하는 문제로 변환되며, 이는 최소 절단(min‑cut) 알고리즘을 이용해 다항시간에 해결할 수 있다. MHE 역시 동일 색을 공유하는 간선 수를 최대화하는 것이므로, 두 색 사이의 절단을 최소화하는 문제와 동일하게 풀 수 있다.

k≥3일 때는 복잡도가 급격히 상승한다. 저자들은 3‑색 정점 색칠 문제와의 귀환을 통해 MHV와 MHE가 NP‑hard임을 증명한다. 특히, MHV는 “각 정점이 자신과 이웃의 색을 일치시키는지 여부”를 판단해야 하므로, 부분 색칠을 완전 색칠로 확장하는 과정에서 SAT‑인스턴스와 동등한 제약을 만들 수 있다. MHE 역시 간선 수준에서 동일 색을 맞추는 선택이 조합적으로 폭발하기 때문에, k≥3에서는 다항시간 알고리즘이 존재하지 않음이 보인다.

근사 알고리즘 측면에서, MHV에 대해 저자들은 두 가지 전략을 제시한다. 첫 번째는 무작위 색 할당을 이용해 기대값이 1/k 배가 되는 간단한 알고리즘이며, 두 번째는 그래프의 최대 차수 Δ에 의존하는 Ω(Δ⁻³) 비율을 보장하는 탐욕적 방법이다. 두 비율 중 큰 값을 선택함으로써, 고밀도 그래프(Δ가 작을 때)에서는 Δ⁻³ 비율이, 색 수가 적을 때는 1/k 비율이 우세하게 된다. MHE에 대해서는 모든 정점을 임의로 두 색 중 하나에 배정한 뒤, 각 색 클래스 내부의 간선 수를 계산해 더 큰 쪽을 선택하는 1/2‑근사 알고리즘을 제시한다. 이는 기대값이 전체 간선 수의 절반 이상임을 보이는 간단한 확률적 분석에 기반한다.

이 논문의 주요 공헌은 동질성 현상을 정량화하는 새로운 최적화 문제를 정의하고, 그 복잡도 경계를 명확히 제시한 점이다. 특히, k=2일 때는 기존의 절단·흐름 이론을 활용해 정확한 해를 구할 수 있음을 보였으며, k≥3에서는 근사 알고리즘을 통해 실용적인 해법을 제공한다. 또한, Δ에 대한 의존성을 명시함으로써, 실제 네트워크(대부분 희소 그래프)에서 적용 가능한 성능 보장을 제공한다는 점에서 이론적·실용적 의의가 크다.