배치 커널 SOM과 라플라시안 기반 방법을 활용한 사회망 분석
본 논문은 그래프 라플라시안으로부터 정의된 커널을 이용해 배치형 자기조직화 지도(Batch SOM)를 적용하고, 이를 전통적인 스펙트럴 클러스터링과 결합해 중세 프랑스 농업 계약 네트워크의 공동체 구조를 탐색한다. 완전 공동체(perfect community)와 리치클럽, 중심 정점을 함께 시각화함으로써 복합적인 사회적 관계를 효과적으로 파악한다.
저자: Romain Boulet (IMT), Bertr, Jouve (IMT)
본 논문은 대규모 그래프, 특히 사회망 분석에 필요한 공동체 탐지를 위해 라플라시안 행렬을 중심으로 한 두 가지 방법을 제안하고, 이를 실제 중세 프랑스 농업 계약 네트워크에 적용한다.
첫 번째 단계에서는 ‘완전 공동체(perfect community)’라는 엄격한 정의를 도입한다. 비가중 그래프에서 완전 공동체는 최소 두 정점으로 이루어진 완전 서브그래프이며, 모든 정점이 외부와 동일한 이웃 집합을 공유한다. 라플라시안의 영 고유값과 그에 대응하는 고유벡터의 영 좌표를 조사함으로써 이러한 완전 공동체를 효율적으로 식별한다. 이 방법은 수학적으로 명확하고, 시각적으로는 각 공동체를 원형 glyph로 표현해 직관적인 이해를 돕는다. 그러나 실제 사회망에서는 전체 정점의 일부분만이 완전 공동체에 포함되며, 중요한 매개 정점이나 작은 규모의 교차 집단이 누락되는 단점이 있다.
두 번째 단계에서는 라플라시안을 정규화하고, 차원을 확장한 커널을 구성한다. 구체적으로, 라플라시안 L에 정규화 파라미터 α를 도입해 (I+αL)⁻¹ 형태의 커널 K를 정의하고, 이를 고차원 힐베르트 공간에 매핑한다. 이렇게 얻은 커널은 정점 간의 전이 확산을 반영하면서, 스펙트럴 클러스터링이 제공하는 선형 구분을 넘어 비선형적인 군집 구조를 포착한다.
이 커널을 입력으로 배치형 자기조직화 지도(Batch SOM)를 학습한다. 배치 SOM은 전체 데이터셋을 한 번에 업데이트함으로써 토포로지를 보존하고, 2차원 격자 위에 정점을 군집화한다. 결과적으로, 완전 공동체가 포착하지 못한 미세한 구조와 정점 간 연속적인 거리 관계가 격자상의 위치에 반영된다. 또한, SOM은 군집 간의 연관성을 시각적으로 드러내어, 공동체 간의 상호작용을 파악하기에 유용하다.
논문은 그래프 컷 최소화 문제를 라플라시안 고유벡터로 완화하는 전통적 스펙트럴 클러스터링과 비교한다. 전통적 방법은 p개의 가장 작은 고유값에 대응하는 고유벡터를 사용해 정점을 p차원 공간에 매핑하고, 이후 k‑means 등으로 이산화한다. 반면, 커널 SOM은 비선형 변환을 통해 더 부드러운 경계와 복합적인 군집 형태를 제공한다.
또한, 고차원 중심성 지표(정점 차수, betweenness)를 활용해 ‘리치클럽(rich‑club)’과 ‘중심 정점(central vertex)’을 정의한다. 리치클럽은 차수가 높은 정점들로 이루어진 고밀도 서브그래프이며, 중심 정점은 betweenness가 높은 정점들이다. 이 두 요소를 완전 공동체와 함께 시각화함으로써, 전체 그래프의 90 % 이상을 포괄하는 종합적인 구조를 얻는다. 특히, 리치클럽과 중심 정점은 각각 하나의 glyph로 표시하고, 이들 간의 연결은 단순화된 엣지로 나타내어 복잡성을 낮추면서도 핵심 관계를 유지한다.
실험 대상은 13세기 프랑스 농업 계약에서 추출한 약 500개의 정점과 수천 개의 가중 엣지로 구성된 사회망이다. 라플라시안 기반 완전 공동체 탐지는 전체 정점의 약 35 %만을 설명했으며, 대부분이 작은 규모의 서브그래프였다. 반면, 커널 SOM을 적용한 후 리치클럽과 중심 정점을 추가하면, 전체 정점의 92 %가 어느 형태로든 군집에 포함되었다. 결과 군집은 역사학자들의 기존 문헌과 일치했으며, 특히 기존 분석에서 간과되었던 중간 매개자와 교차 집단이 새로운 공동체로 드러났다.
결론적으로, 라플라시안 기반 커널을 이용한 배치 SOM은 전통적 스펙트럴 클러스터링의 수학적 엄밀함과 완전 공동체의 직관적 시각화를 보완하면서, 복합적인 사회망 구조를 효과적으로 탐색·시각화하는 강력한 도구임을 입증한다. 향후 연구에서는 동적 네트워크와 다중 레이어 그래프에 대한 확장 및 파라미터 자동 튜닝 기법을 제시할 수 있다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기