소셜 네트워크 그룹 진화 추적 방법
초록
본 논문은 장기간에 걸친 소셜 네트워크 데이터를 시간 프레임으로 분할하여 형성된 템포럴 네트워크에서, 커뮤니티(그룹)의 변화를 체계적으로 추적하고 기록하기 위한 새로운 알고리즘인 GED(Group Evolution Discovery)를 제안한다. GED는 그룹 간의 포함 관계와 멤버십 변동을 정량화하는 지표를 기반으로, 생성, 소멸, 성장, 축소, 합병, 분할 등 여섯 가지 기본 진화 이벤트를 자동으로 식별한다. 실험을 통해 기존 방법보다 높은 정확도와 효율성을 입증하였다.
상세 분석
GED 알고리즘은 먼저 입력된 템포럴 소셜 네트워크를 일정한 길이의 스냅샷(시간 프레임)으로 나눈다. 각 스냅샷에서 커뮤니티 탐지 기법(예: CPM, Louvain 등)을 적용해 그룹 집합을 도출하고, 이후 인접 프레임 사이의 그룹 매핑을 수행한다. 핵심 매핑 단계에서는 두 그룹 Gᵢ(t)와 Gⱼ(t+1) 사이의 포함 비율을 측정하는 두 가지 지표, 즉 “포함도”(inclusion)와 “포함 역비”(inverse inclusion)를 정의한다. 포함도는 Gᵢ의 멤버 중 Gⱼ에 속하는 비율을, 포함 역비는 그 반대를 나타낸다. 이 두 값이 사전에 설정된 임계값 α, β를 동시에 초과하면 Gᵢ와 Gⱼ는 연속적인 동일 그룹으로 간주한다.
그렇지 않은 경우, GED는 포함도와 역비의 조합을 분석해 여섯 가지 진화 이벤트를 구분한다. 예를 들어, Gᵢ가 높은 포함도를 보이지만 Gⱼ가 낮은 역비를 보이면 Gᵢ가 축소된 것으로 판단하고, 반대로 Gⱼ가 높은 역비를 보이면 Gᵢ가 성장한 것으로 분류한다. 두 개 이상의 그룹이 동일한 Gⱼ에 높은 포함도를 보이면 합병 이벤트가, 하나의 그룹이 여러 Gⱼ에 분산되면 분할 이벤트가 발생한다. 또한, 새로운 그룹이 어느 기존 그룹에도 충분히 포함되지 않을 경우 생성, 반대로 기존 그룹이 다음 프레임에 전혀 매핑되지 않으면 소멸으로 정의한다.
GED는 이러한 이벤트 식별 과정을 전체 시간 축에 걸쳐 반복함으로써, 각 그룹의 전체 진화 궤적을 재구성한다. 알고리즘의 복잡도는 그룹 매핑 단계에서 O(|Gₜ|·|Gₜ₊₁|)이며, 실제 대규모 데이터셋(수십만 노드, 수천 스냅샷)에서도 효율적으로 동작한다는 실험 결과가 제시된다. 또한, α와 β 임계값을 조정함으로써 민감도와 특이도를 유연하게 조절할 수 있어, 다양한 도메인(예: 온라인 포럼, 기업 협업 네트워크)에서 적용 가능하다.
댓글 및 학술 토론
Loading comments...
의견 남기기