무방향 그래프의 페이지랭크에 대한 새로운 통찰

초록

본 논문은 무방향 그래프에 적용되는 페이지랭크가 특정 개인화 벡터 하에서는 정점의 차수와 정확히 비례함을 증명하고, 일반적인 경우에는 차수 분포와 완전히 일치하지 않음을 보인다. 주요 정리는 페이지랭크와 차수 분포 벡터의 L₁ 거리 상한과 하한을 제공한다.

상세 분석

페이지랭크는 원래 웹과 같이 방향성을 갖는 네트워크에서 각 정점의 중요도를 확률적 흐름 모델로 정의한다. 전통적인 정의에서는 전이 행렬 (P)가 그래프의 인접 관계에 따라 비대칭적으로 구성되고, 개인화 벡터 (v)와 감쇠 인자 (\alpha)를 이용해 고정점 (\pi)를 구한다: (\pi = \alpha P^{\top}\pi + (1-\alpha)v). 무방향 그래프에 이 식을 그대로 적용하면 (P)가 대칭이 되므로 (\pi)는 그래프 라플라시안의 고유벡터와 연관된다. 기존 문헌에서는 “무방향 그래프의 페이지랭크는 정점 차수에 비례한다”는 경험적 사실이 자주 인용되지만, 그 근거는 개인화 벡터가 정규화된 차수 분포와 동일할 때만 엄밀히 성립한다는 점이 간과된다.

논문은 먼저 개인화 벡터를 (v = d / |d|_1) (여기서 (d)는 정점 차수 벡터)로 설정하면, 고정점 (\pi)가 정확히 (d / |d|_1)와 동일함을 증명한다. 이는 전이 행렬이 대칭이고, (\alpha)가 어떤 값이든 (\pi)가 정규화된 차수 분포와 일치한다는 강력한 결과다. 그러나 실제 응용에서는 개인화 벡터가 균등하거나 다른 외부 정보에 기반하는 경우가 많다. 이러한 일반적인 상황에서 저자들은 (\pi)와 차수 분포 (d/|d|_1) 사이의 차이를 L₁ 노름으로 측정하고, 다음과 같은 경계식을 제시한다: