일관된 인접 행렬 스펙트럴 임베딩을 이용한 확률 블록 모델 군집화
본 논문은 확률 블록 모델(SBM)에서 생성된 그래프의 노드 블록 멤버십을 추정하기 위해, 인접 행렬의 저차원 SVD 기반 임베딩을 수행하고, 얻어진 벡터들을 평균 제곱 오차를 최소화하는 K‑means 군집화에 적용한다. 저자들은 이 절차가 방향성 및 무방향성 그래프 모두에 대해 노드의 잘못된 할당 비율이 n→∞ 일 때 0으로 수렴함을 수학적으로 증명하고, 블록 수가 서서히 증가하는 경우에도 일관성을 유지함을 보인다. 또한 알고리즘의 계산 복잡…
저자: Daniel L. Sussman, Minh Tang, Donniell E. Fishkind
본 논문은 확률 블록 모델(Stochastic Block Model, SBM)로부터 생성된 그래프에서 노드의 블록 멤버십을 정확히 추정하기 위한 새로운 방법론을 제시한다. 연구 배경으로는 네트워크 분석이 신경과학, 사회학, 생물학 등 다양한 분야에서 핵심 도구가 되고 있으며, 그래프의 군집화는 커뮤니티 탐지와 구조 이해에 필수적이라는 점을 들었다. 기존의 군집화 기법은 물리‑공학적 직관에 기반하거나, 모듈러티 기반 최적화, 베이지안 추정 등 통계적 접근을 사용했지만, 대부분 계산 복잡도가 높거나 이론적 일관성을 보장하지 못했다.
저자들은 이러한 한계를 극복하기 위해, 랜덤 닷 프로덕트 그래프(Random Dot Product Graph, RDPG) 모델을 동기화한다. RDPG는 각 노드가 d 차원의 잠재 벡터를 갖고, 두 노드 사이의 연결 확률이 해당 벡터들의 내적으로 정의되는 모델이다. SBM은 특수한 경우로, 같은 블록에 속한 노드들은 동일한 잠재 벡터를 공유한다는 점에서 RDPG와 일치한다. 이를 바탕으로, 인접 행렬 A에 대해 특이값 분해(A = UΣVᵀ)를 수행하고, 앞 d개의 특이벡터와 특이값의 제곱근을 이용해 스케일된 임베딩 X̂ = UΣ^{1/2}, Ŷ = VΣ^{1/2}를 만든다. 이 과정을 “스케일된 인접 스펙트럴 임베딩(scaled adjacency spectral embedding)”이라 부른다.
임베딩 단계에서 두 가지 형태가 제시된다. 하나는 스케일된 버전(X̂, Ŷ)이며, 다른 하나는 스케일되지 않은 버전(U, V)이다. 스케일된 버전은 RDPG의 잠재 위치 추정에 직접 대응하고, 스케일되지 않은 버전은 행렬 A 자체의 저차원 구조를 보존한다. 저자들은 이후 두 버전 모두에 대해 동일한 군집화 절차를 적용할 수 있음을 보인다.
군집화는 평균 제곱 오차(MSE) 최소화 문제로 정식화된다. 즉, 임베딩된 행렬 Z(=U|V 또는 X̂|Ŷ)의 각 행을 K개의 클러스터 중심 ψ_i에 할당하는 함수 τ를 찾아
\
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기