중세 사회 네트워크 분석 커널 SOM과 클러스터링 기법

중세 사회 네트워크 분석 커널 SOM과 클러스터링 기법
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 13세기 남프랑스 지역의 중세 계약 데이터를 기반으로 615명의 인물과 4193개의 관계를 가진 가중 그래프를 구축하고, 스펙트럴 클러스터링, 커널 k‑means, 그리고 커널 SOM을 이용해 정밀한 군집화와 시각화를 수행한다. 각 방법의 군집 품질을 q‑modularity 지표로 비교하고, 커널 SOM이 가장 높은 모듈러리와 의미 있는 지리·시대 구분을 제공함을 보인다.

상세 분석

이 연구는 복합 네트워크 분석에 대한 전형적인 파이프라인을 제시한다. 먼저, 1260‑1340년 사이에 체결된 약 1000건의 농업 계약을 디지털화하여 인물‑인물 간의 거래 횟수를 가중치로 하는 무방향 그래프를 만든다. 그래프는 615개의 정점과 4193개의 간선으로 구성되며, 각 간선의 가중치는 두 인물 사이에 존재하는 계약 수를 의미한다.

클러스터링 단계에서는 두 가지 주요 접근법을 비교한다. 첫 번째는 라플라시안 행렬의 고유벡터를 이용하는 전통적 스펙트럴 클러스터링이며, 두 번째는 라플라시안에 열역학적 확산 커널 (K_{\beta}=e^{-\beta L}) 을 적용한 커널 k‑means이다. 스펙트럴 클러스터링은 가장 작은 p개의 고유벡터만 사용해 차원을 축소하고 k‑means를 수행한다. 그러나 고유값이 작을수록 해당 고유벡터가 그래프 구조에 더 중요한 정보를 담고 있음에도 불구하고, 기존 방법은 모든 고유벡터에 동일 가중치를 부여한다는 한계가 있다. 이를 보완하기 위해 확산 커널을 도입하면 라플라시안의 전체 스펙트럼을 활용하면서도 β 파라미터를 통해 스무딩 정도를 조절할 수 있다.

두 방법 모두 50개의 군집으로 분할한 뒤 q‑modularity (Q=\sum_{j}(e_j-a_j^2)) 를 계산하였다. 스펙트럴 클러스터링은 Q=0.4195, 커널 k‑means는 Q=0.4246을 기록했으며, 두 경우 모두 대형 군집이 전체 정점의 절반 이상을 차지하는 등 군집의 불균형 문제가 드러났다.

다음 단계에서는 군집화와 동시에 그래프 레이아웃을 제공하는 커널 SOM을 적용한다. 배치 방식의 SOM을 7×7 격자(총 49개의 뉴런) 위에 구현하고, 각 정점을 확산 커널에 의해 정의된 RKHS에 매핑한 뒤 SOM 학습을 수행한다. 결과적으로 35개의 군집이 도출되었으며, q‑modularity는 0.551로 기존 방법들을 크게 앞섰다. 또한, U‑matrix를 통해 군집 간 거리와 내부 응집도를 시각화함으로써, 지도 상에서 세 개의 주요 영역(좌상, 우상, 우하)으로 명확히 구분되는 구조를 확인했다.

지리적·시대적 해석을 위해 각 군집의 평균 계약 연도와 표준편차, 그리고 해당 인물들의 거주지 분포를 분석하였다. 좌상 영역은 가장 오래된 계약(평균 연도 약 1270년)과 작은 마을 Divilhac 에 집중돼 있었으며, 우상 영역은 가장 최근(평균 연도 약 1330년)와 다른 마을 St Julien 3에 속한 인물들이 모여 있었다. 이러한 패턴은 세대 교체와 지역 간 연결 고리가 네트워크 구조에 어떻게 반영되는지를 보여준다.

마지막으로, SOM 격자를 기반으로 힘‑지향 레이아웃 알고리즘을 적용해 전체 그래프를 시각화하였다. 이 과정에서 핵심 인물 Pierre Fornie 와 Aliquier 가족이 서로 다른 군집을 연결하는 ‘브릿지’ 역할을 수행함을 확인했다. 이는 데이터 정제와 역사적 해석에 중요한 단서를 제공한다. 전체적으로, 커널 SOM은 군집 품질, 시각적 해석 가능성, 그리고 도메인 전문가와의 협업 효율성 측면에서 기존 스펙트럴·커널 k‑means 방법을 능가한다는 결론을 얻었다.


댓글 및 학술 토론

Loading comments...

의견 남기기