슬래시닷 동물원 부정적 연결을 활용한 소셜 네트워크 분석
초록
본 논문은 Slashdot 사이트의 “Zoo” 기능에서 수집한 78 000명 이상의 사용자 간 친구·적대 관계(양·음의 서명된 엣지)를 이용해, 전통적인 양의 가중치만을 다루는 네트워크 분석 기법을 확장한다. 서명된 클러스터링 계수, 서명된 중심성·인기도 지표, 서명된 거리·유사도 측정 등을 정의하고, 이들을 통해 인기 없는 사용자 탐지와 링크 서명 예측 실험을 수행한다. 특히 “적의 적은 친구다”라는 곱셈 전이성을 검증하고, 행렬 곱을 기반으로 한 효율적인 알고리즘이 기존 방법보다 우수함을 보인다.
상세 분석
이 연구는 소셜 네트워크 분석에서 부정적 관계를 정량화하는 방법론적 공백을 메우는 데 중점을 둔다. 먼저 저자들은 Slashdot Zoo 데이터셋을 정밀히 기술한다. 전체 77 985개의 노드와 510 157개의 방향성 서명 엣지(친구 +1, 적 ‑1)로 구성된 이 그래프는 평균 차수 6.5, 파워‑law 형태의 차수 분포, 그리고 6의 지름과 3의 반지름을 보이는 작은 세계(small‑world) 특성을 가진다.
핵심 기여는 ‘곱셈 전이성(multiplicative transitivity)’ 개념이다. 두 인접 엣지의 부호를 곱한 값이 세 번째 엣지의 부호와 일치한다는 가정은 “적의 적은 친구다”라는 사회학적 직관을 수학적으로 구현한다. 이를 검증하기 위해 서명된 클러스터링 계수 Cₛ(G)를 정의한다. 기존 무부호 클러스터링 계수는 삼각형 형성 비율을 나타내지만, 서명된 버전은 삼각형 내 부호 곱의 평균을 고려한다. 식 Cₛ(G)=‖A∘A²‖₁/‖|A|²‖₁ 로 표현되며, 여기서 A는 서명 인접 행렬, ∘는 원소별 곱, ‖·‖₁은 모든 원소의 합이다. 실험 결과, Slashdot 그래프의 서명 클러스터링 계수는 2.44%이며, 무부호 대비 상대값은 76.4%에 달한다. 이는 무작위 그래프에 비해 상당히 높은 전이성을 의미한다.
노드 수준에서는 서명된 인기도(popularity)와 중심성(centrality) 지표를 제안한다. 인기도는 들어오는 긍정·부정 엣지의 차이(친구 − 적)로 정의되고, 중심성은 전이성을 반영한 행렬 거듭제곱(Aⁿ) 기반의 스코어를 사용한다. 이들 지표를 ‘불인기 사용자’를 식별하는 기준으로 활용했을 때, 전통적인 단순 차수 기반 방법보다 정밀도와 재현율이 현저히 개선된다.
링크 수준에서는 서명된 거리와 유사도 측정을 고안한다. 특히 저자들은 A², A³ 등 고차 행렬을 이용해 두 노드 사이에 존재할 수 있는 부호‑가중 경로의 총합을 계산하고, 이를 기반으로 서명 예측 모델을 구축한다. 로지스틱 회귀와 비교했을 때, 행렬 곱 기반의 예측은 AUC 0.84로 기존 PageRank‑기반 신뢰 모델(0.71)보다 우수했다.
알고리즘적 측면에서 가장 큰 장점은 행렬 연산을 활용함으로써 대규모 그래프에도 효율적으로 적용 가능하다는 점이다. Sparse matrix 라이브러리를 이용해 A²·v 형태의 벡터 연산을 수행하면 메모리 사용량을 최소화하면서도 O(|E|) 수준의 복잡도로 트라이앵글 기반 전이성을 계산할 수 있다. 이는 기존 삼각형 열거 방식이 O(|V|³)에 가까운 비용을 요구하는 것과 대비된다.
결론적으로, 이 논문은 부정적 엣지를 포함한 서명 그래프에 대한 전반적인 분석 프레임워크를 제공한다. 서명된 클러스터링, 중심성, 거리·유사도 등 다양한 메트릭을 일관된 행렬 기반 접근법으로 정의하고, 실제 데이터에 적용해 전이성 가설을 실증함으로써 소셜 네트워크 연구에 새로운 도구를 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기