모듈러티 기반 커뮤니티 탐지의 다중 위상 현상
초록
본 논문은 모듈러티와 엔트로피를 동시에 고려하는 mod‑bp 알고리즘의 온도 T와 최대 그룹 수 q에 따른 위상 전이를 체계적으로 분석한다. 새로운 군집 구분 지표를 도입해 실제 유효 그룹 수 \hat{q}를 추정하고, 합성·실제 네트워크에서 \hat{q}=1부터 q까지 다양한 위상이 존재함을 실험적으로 확인한다. 이를 통해 mod‑bp 사용 시 최적 온도 선택과 결과 해석 방법을 제시한다.
상세 분석
mod‑bp 알고리즘은 모듈러티 Q를 에너지 E=−mQ로 정의하고, 온도 T (β=1/T)에서 Gibbs 분포 P({t})∝e^{−βE}를 샘플링한다. Belief Propagation(BP) 메시지 ψ_{i→k}(t)를 반복 업데이트해 수렴하면 각 노드 i에 대한 마진 ψ_i(t)를 얻고, argmax_t ψ_i(t)로 최종 군집을 할당한다. 기존 연구(Zhang‑Moore, 2014)는 온도에 따라 파라메트릭, 복구, 스핀글라스의 세 가지 전이만을 보고했지만, 본 연구는 q개의 잠재 그룹을 지정했을 때 실제로는 q+1개의 위상이 나타날 수 있음을 보인다. 핵심은 “군집 간 거리” d_{kl}= (1/N)∑_i (ψ_i(k)−ψ_i(l))^2 를 정의하고, 특정 임계값 d_min 이하이면 그룹 k와 l을 퇴화(degenerate) 로 간주한다는 점이다. 이때 유효 그룹 수 \hat{q}는 퇴화되지 않은 그룹의 개수이며, φ 매핑을 통해 실제 할당을 \hat{t}_i = φ(argmax_t ψ_i(t)) 로 재정의한다.
온도 변화에 따라 d_{kl}는 급격히 감소하는 전이점을 보이며, 이는 전통적인 물리학에서의 2차 상전이와 유사하다. 저온에서는 여러 그룹이 명확히 구분되어 \hat{q}=q에 가까우나, 온도가 상승하면 일부 그룹이 퇴화해 \hat{q}가 감소하고, 최종적으로 파라메트릭 위상에서는 모든 그룹이 동등해져 \hat{q}=1이 된다. 또한, 스핀글라스 위상에서는 BP가 수렴하지 않아 알고리즘이 실패한다.
이론적 임계 온도 T와 T_R은 각각 구성 모델과 확률적 블록 모델(SBM)에서 유도되며, T≈
댓글 및 학술 토론
Loading comments...
의견 남기기