정보 이론으로 보는 최소 절단 클러스터링
이 논문은 그래프의 평균 절단(Average‑Cut)과 정규화 절단(Normalized‑Cut)이라는 전통적인 히어리스틱을 정보 병목(Information Bottleneck) 프레임워크와 연결한다. 빠르게 섞이는 그래프에서는 두 절단 비용이 랜덤 워커의 예측 정보 손실률에 근사함을 보이며, 확률적 블록 모델(SBM)로 생성된 그래프에서는 최적 정보‑이론적 파티션과 최소 절단 파티션이 높은 확률로 일치함을 실험적으로 확인한다.
저자: Anil Raj, Chris H. Wiggins
본 논문은 그래프 클러스터링에서 널리 사용되는 최소 절단(Min‑Cut) 방법을 정보 병목(Information Bottleneck, IB) 이론과 연결함으로써, 기존 히어리스틱이 보다 일반적인 원칙에서 유도될 수 있음을 보여준다.
1. **배경 및 문제 정의**
Shi와 Malik(2000)이 제안한 평균 절단(A)과 정규화 절단(N)은 그래프를 K‑partition으로 나눌 때 각각 A=∑_j W(V_j,¯V_j)/ω(V_j) 와 N=∑_j W(V_j,¯V_j)/Ω(V_j) 로 정의된다. 여기서 W는 두 집합 사이의 에지 가중치 합, ω와 Ω는 정점 수와 차수 합을 의미한다. 이러한 비용은 라플라시안 Δ와 결합된 이차 형식 hᵀΔh 로도 표현될 수 있다.
2. **Information Bottleneck 프레임워크**
IB는 데이터 X를 압축하여 클러스터 Z 로 매핑하면서, 관련 변수 Y와의 상호 정보 I
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기