시간 네트워크에서 변곡점 탐지와 위치 파악: 확률 블록 모델 활용

본 논문은 시간에 따라 변화하는 복잡계 네트워크에서 구조적 변화를 정량적으로 탐지하고 그 시점을 정확히 파악하는 방법을 제시한다. 기존 연구인 Peel‑Clauset이 제안한 일반화 계층적 무작위 그래프(GHRG) 기반 변곡점 탐지 프레임워크는 네트워크 재구성 모델로 GHRG를 사용했으며, 이는 계층적 커뮤니티 구조를 잘 포착하지만, 비계층적이거나 핵심‑주변(core‑periphery) 형태, 혹은 이분산(assortative/ disassortative) 구조를 표현하는 데 한계가 있었다. 이를 보완하고자 저자들은 확률 블록 모델(SBM)과 그 변형인 degree‑corrected SBM(DC‑SBM)을 파라미터화된 모델 후보군으로 도입한다. SBM은 노드들을 K개의 블록으로 할당하고, 블록 간 연결 확률 Q_rs를 파라미터화한다. 일반 SBM는 블록 내·외부 연결 확률만을 고려해 고도 차수 차이를 무시하는 경향이 있다. 반면 DC‑SBM은 각 노드의 기대 차수 θ_u 를 도입해, 연결 확률을 Q_rs·θ_u·θ_v 로 조정함으로써 차수 이질성을 보정한다. 이러한 보정은 특히 희소 네트워크나 고차수 노드가 존재하는 경우 블록 구분의 정확도를 크게 향상시킨다. 모델 파라미터 추정은 베이지안 메시지 전달(belief propagation) 기반의 변형 EM 알고리즘을 사용한다. 각 노드 u는 이웃 v를 제외한 상태에서 블록 r에 속할 확률 ψ_{u→v}^r 를 전송하고, 이를 반복적으로 업데이트한다. 업데이트 식은 (3)~(6)에 명시된 바와 같이, 현재 추정된 n_r와 Q_rs를 이용해 메시지를 재계산하고, 메시지로부터 블록 할당 확률 ψ_u^r 를 얻는다. 비연결 쌍에 대해서는 ψ_{u→v}^r ≈ ψ_u^r 로 근사함으로써 연산 복잡도를 O(N+M)으로 낮춘다. 파라미터 n_r와 Q_rs는 (8)·(9)식에 따라 메시지로부터 직접 추정한다. 블록 수 K는 모델 선택 기준으로 최소 설명 길이(MDL)를 사용한다. 각 K에 대해 위의 파라미터 추정 과정을 수행하고, 최종적으로 블록 할당을 결정한 뒤(가장 확률이 높은 블록 선택) MDL 식(10)을 계산한다. MDL은 데이터에 대한 엔트로피와 모델 복잡도(파라미터 수)를 모두 고려하므로, 과적합을 방지하고 적절한 K를 선택한다. 변곡점 탐지는 슬라이딩 윈도우(폭 w)를 이용한다. 윈도우 안의 t_0,…,t_{w‑1} 시점 네트워크를 모두 합쳐 가중치 네트워크 A

시간 네트워크에서 변곡점 탐지와 위치 파악: 확률 블록 모델 활용

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기