페이지랭크와 영속동형학을 이용한 빠르고 확장 가능한 복합 네트워크 기술자

본 논문은 그래프의 페이지랭크 값을 연속적인 스칼라 함수로 활용하고, 이를 하위‑스타 필터레이션에 적용해 0‑차 영속 다이어그램을 생성한다. 유니온‑파인드 자료구조를 이용해 O(|E|·α(|V|)) 시간에 다이어그램을 얻고, 병목 거리로 그래프 간 유사성을 측정한다. 메쉬 데이터셋에 적용한 실험에서 카테고리별 클러스터링이 성공적으로 이루어졌다.

저자: Mustafa Hajij, Elizabeth Munch, Paul Rosen

페이지랭크와 영속동형학을 이용한 빠르고 확장 가능한 복합 네트워크 기술자
**1. 서론** 그래프 유사도 측정은 패턴 인식·머신러닝 분야에서 핵심 과제이며, 구조적 복잡성을 반영하면서도 계산 효율성을 유지하는 방법이 요구된다. 기존 방법들은 그래 커널, 서브그래프 카운팅, 스펙트럼 기반 거리 등을 사용했지만, 대규모 그래프에 적용하기엔 비용이 높다. 저자들은 페이지랭크라는 전역 중심성 지표와 영속동형학이라는 다중 스케일 토폴로지 요약 기법을 결합해 새로운 그래프 디스크립터를 제안한다. **2. 배경** - *페이지랭크*: 정점 v에 대해 PR(v) = (1‑d)/|V| + d·∑_{u∈N(v)} PR(u)/|N(u)| 로 정의되며, 전력법(power method)이나 분산 알고리즘으로 O(|E|) 혹은 O(p·log n) 시간에 근사 계산 가능하다. - *영속동형학*: 스칼라 함수 f가 정의된 복합체 K에 대해 하위‑스타 필터레이션 φ를 구성하고, 각 단계에서 호몰로지 클래스의 탄생·소멸 시점을 기록해 다이어그램 P_f(K)를 만든다. 0‑차 다이어그램은 연결 컴포넌트의 병합 과정을 나타낸다. **3. 방법론** 1. **함수 정의**: 그래프 G(V,E)에 페이지랭크 PR:V→ℝ 를 계산한다. 2. **필터레이션 구성**: PR 값을 기준으로 정점을 오름차순 정렬하고, 각 정점이 등장할 때 해당 정점과 PR이 더 낮은 인접 간선을 함께 포함하는 하위‑스타 필터레이션을 만든다. 3. **0‑차 영속 다이어그램 계산**: - 초기화: 각 정점을 독립된 집합으로 만든다. - 간선 정렬: 모든 간선 e=(u,v)를 PR(e)=max(PR(u),PR(v)) 기준으로 오름차순 정렬한다. - 순차 처리: 정렬된 간선을 하나씩 검사한다. 두 정점이 서로 다른 집합에 있으면 union‑find를 이용해 병합하고, (max(PR(u),PR(v)), PR(e)) 를 바(bar)로 기록한다. - 병합 규칙: PR 값이 큰 루트를 부모로 삼아 트리 높이를 최소화한다. - 최종적으로 바들의 리스트가 0‑차 영속 다이어그램이 된다. - 시간 복잡도는 정렬 O(|E| log |E|)와 union‑find 연산 O(|E|·α(|V|)) 로, 전체는 거의 선형에 가깝다. 4. **그래프 간 거리**: 두 그래프의 영속 다이어그램 X, Y에 대해 병목 거리 W_∞(X,Y)=inf_η sup_{x∈X}‖x‑η(x)‖_∞ 를 계산한다. 대각선에 무한히 많은 점을 추가해 매칭 가능성을 보장한다. 필요 시 Wasserstein 거리도 사용 가능하다. **4. 실험** - *데이터셋*: (1) 60개의 삼각형 메쉬를 6개 카테고리(고양이, 코끼리, 얼굴, 머리, 말, 사자) 로 구성, (2) 30개의 메쉬를 2개 카테고리(아이 A, 아이 B) 로 구성, (3) 80개의 다양한 동물·인물 메쉬(각 정점 수 약 5만) 로 구성. - *절차*: 각 메쉬에 페이지랭크를 계산하고, 0‑차 영속 다이어그램을 얻은 뒤, 모든 쌍에 대해 병목 거리를 구한다. 거리 행렬을 t‑SNE로 2차원에 투영한다. - *결과*: 동일 카테고리 내 메쉬가 시각적으로 뚜렷한 클러스터를 형성했으며, 특히 형태가 비슷한 말과 고양이 메쉬가 서로 가깝게 배치되는 등 토폴로지적 유사성이 반영되었다. 이는 페이지랭크‑기반 디스크립터가 정점 중심성뿐 아니라 전체 구조를 효과적으로 요약한다는 증거다. **5. 논의 및 한계** - 현재는 0‑차 영속성만 사용했으며, 1‑차·2‑차 영속성을 포함하면 루프·구멍 등 더 복잡한 구조를 포착할 수 있다. - 페이지랭크는 기본적으로 무방향 그래프에 적용했지만, 방향 그래프에 대한 확장은 향후 연구 과제로 제시된다. - 대규모 실세계 네트워크(수백만 정점 이상)에서도 분산 페이지랭크와 병렬 union‑find를 결합하면 충분히 확장 가능하다는 기대가 있다. **6. 결론** 본 연구는 페이지랭크와 영속동형학을 결합해 그래프를 비교하는 새로운 프레임워크를 제시하였다. O(|E|·α(|V|)) 의 거의 선형 시간 복잡도로 0‑차 영속 다이어그램을 생성하고, 병목 거리를 통해 그래프 간 유사성을 정량화한다. 메쉬 데이터셋 실험에서 카테고리별 클러스터링이 성공적으로 나타났으며, 향후 방향 그래프와 고차원 영속성을 포함한 확장이 기대된다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기