대규모 사회망 빠른 생성과 클러스터링 구현
초록
본 논문은 기존 Chung‑Lu 모델에 전이(transitive) 메커니즘을 추가한 Transitive Chung‑Lu(TCL) 모델을 제안한다. 하나의 파라미터만으로 원 그래프의 차수 분포를 그대로 유지하면서, 2‑hop 이웃을 통한 랜덤 트랜지티브 엣지를 삽입해 클러스터링을 크게 향상시킨다. 파라미터 학습은 수초 내에 끝나고, 그래프 생성은 엣지 수에 선형 시간으로 수행된다. 네 개의 실제 소셜 네트워크(수십만 노드·수백만 엣지) 실험에서 TCL은 차수 분포, 클러스터링 계수, 홉 플롯을 원본과 거의 동일하게 재현한다.
상세 분석
이 연구는 사회 네트워크 생성 모델링에서 가장 흔히 간과되는 ‘클러스터링’ 요소를 정량적으로 보존하려는 시도이다. 기존 Chung‑Lu 모델은 목표 차수 분포를 정확히 재현하지만, 엣지가 무작위로 연결되기 때문에 삼각형(클러스터링) 형성이 거의 일어나지 않는다. 반면, Exponential Random Graph Model(ERGM)은 트랜스티비티 파라미터를 통해 클러스터링을 제어할 수 있으나, 파라미터 추정이 NP‑hard 수준의 복잡도를 갖고 있어 대규모 네트워크에 적용하기 어렵다. 논문은 이러한 딜레마를 해결하기 위해 ‘랜덤 트랜스티브 엣지’를 도입한다. 구체적으로, 각 새로운 엣지를 생성할 때 확률 ρ(학습 파라미터)만큼은 현재 그래프에서 임의의 2‑hop 이웃을 선택하고, 나머지 1‑ρ는 전통적인 Chung‑Lu 방식(노드 i와 j를 각각 차수 비례 확률로 선택)으로 연결한다.
수학적 증명에서는 기대 차수 E
댓글 및 학술 토론
Loading comments...
의견 남기기