대규모 블록 모델 그래프에서 개인화 페이지랭크를 활용한 표적 샘플링
본 논문은 개인화 페이지랭크(PPR)를 이용해 거대한 네트워크에서 씨드 노드와 같은 블록에 속한 소규모 커뮤니티를 효율적으로 샘플링하는 이론적 근거와 실험을 제공한다. 특히, DC‑SBM 하에서 PPR이 고차수 노드에 편향되는 현상을 분석하고, 차수 정규화를 통한 보정 방법을 제시하여 일관성을 증명한다.
저자: Fan Chen, Yini Zhang, Karl Rohe
본 연구는 대규모 네트워크에서 전체 그래프를 수집하거나 유지하는 것이 비용적으로 어려운 상황에서, 특정 씨드 노드 주변의 작은 커뮤니티를 효율적으로 샘플링하기 위한 통계적 이론과 실용적 알고리즘을 제시한다. 핵심 도구는 개인화 페이지랭크(Personalized PageRank, 이하 PPR)이며, 이는 씨드 노드에서 시작해 일정 확률 α 로 재시작하고, 나머지 1−α 확률로 인접 노드로 이동하는 개인화 랜덤 워크의 정 stationary distribution으로 정의된다. PPR 벡터는 각 노드가 샘플에 포함될 확률을 나타내며, 높은 값일수록 씨드와의 구조적·연결적 근접성을 의미한다.
연구는 차수 보정 확률적 블록 모델(DC‑SBM)을 기본 가정으로 삼는다. DC‑SBM은 K개의 블록이 존재하고, 각 블록 내·외부 연결 확률이 블록 간 연결 행렬 B 에 의해 결정되며, 개별 노드의 차수는 노드별 파라미터 θ_i 로 조정된다. 이 모델 하에서 PPR 값을 정확히 해석하면, (i) 개인화 랜덤 워크가 어느 블록 k 에 도달할 확률 π_k, (ii) 해당 블록 안에서 구체적인 노드 v 가 선택될 조건부 확률이 θ_v (또는 정규화된 차수 d_v)와 비례한다는 두 단계 확률 곱 형태가 된다. 즉,
\
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기