대규모 네트워크를 위한 효율적인 스토캐스틱 블록 모델 추론 알고리즘

본 논문은 대규모 그래프에서 스토캐스틱 블록 모델(SBM)을 추론하기 위한 두 가지 방법을 제시한다. 하나는 최적화된 마코프 체인 몬테카를로(MCMC) 기법으로, 빠른 혼합 시간과 메타안정 상태에 대한 낮은 민감도를 보인다. 다른 하나는 거의 선형 시간 복잡도 O(N log²N)을 갖는 탐욕적 병합 휴리스틱으로, 정확한 MCMC와 거의 구별되지 않는 결과를 제공한다. 두 방법 모두 특정 구조(예: 동질 커뮤니티)에 편향되지 않으며, 블록 수와 …

저자: Tiago P. Peixoto

대규모 네트워크를 위한 효율적인 스토캐스틱 블록 모델 추론 알고리즘
본 논문은 스토캐스틱 블록 모델(SBM)의 파라미터와 블록 할당을 대규모 네트워크에서 효율적으로 추정하기 위한 두 가지 알고리즘을 제시한다. 서론에서는 SBM이 커뮤니티 탐지, bipartite 구조, core‑periphery 등 다양한 네트워크 패턴을 포괄하는 일반적인 생성 모델임을 강조하고, 기존 방법들의 계산 복잡도와 블록 수에 대한 의존성 문제를 지적한다. II절에서는 SBM과 그 변형인 degree‑corrected SBM의 수학적 정의를 제시한다. 블록 수 B가 고정된 상황에서 로그우도는 마이크로캐노니컬 엔트로피 S({e_{rs}},{n_r})와 동등하며, 이를 최소화하는 것이 최적 파티션을 찾는 목표가 된다. 그러나 S는 B에 대해 단조 감소하므로, B 자체를 선택하려면 MDL(최소 설명 길이)이나 Bayesian model selection과 같은 별도의 모델 선택 절차가 필요함을 언급한다. III절에서는 MCMC 기반 추론을 상세히 설명한다. 기본적인 무작위 이동 방식은 제안 확률이 1/B이므로 B가 클수록 효율이 떨어진다. 이를 개선하기 위해 저자는 이웃 블록 정보를 활용한 제안 분포 p(r→s|t)=e_{ts}+γ e_t+γ B 를 도입한다. 여기서 t는 무작위 선택된 이웃의 블록이며, γ는 제안 분포의 균형을 조절한다. 이 제안은 상세히 균형 조건을 만족하도록 Metropolis‑Hastings 수용 확률 a= min{exp(−βΔS)·

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기