Q클러스터링 특성의 새로운 해석과 한계
초록
본 논문은 Q‑Clustering 계열 중 Max‑Sum과 Single‑Linkage 알고리즘을 공리적 프레임워크 안에서 유일하게 규정한다. Gomory‑Hu 트리를 이용한 Max‑Sum 특성과 최대 스패닝 트리를 이용한 Single‑Linkage 특성을 도입하고, 이들 특성의 부분집합이 어떻게 상호작용하는지를 분석한다. 최종적으로 기존 클러스터링 패러다임 분류에 새로운 항목을 제안한다.
상세 분석
논문은 Q‑Clustering이라는 넓은 클래스 안에서 두 대표 알고리즘, 즉 Max‑Sum과 Single‑Linkage를 공리적 접근법으로 완전하게 규정한다는 점에서 의미가 크다. 먼저 저자들은 Q‑Clustering을 정의할 때, 클러스터링 결과를 그래프 형태의 비용 함수 Q에 매핑하는 방식을 채택한다. 이때 ‘분할 일관성(Partition Consistency)’과 ‘스케일 변환 불변성(Scale Invariance)’ 같은 기본 공리를 채택하고, 추가적으로 두 알고리즘을 구분할 수 있는 특수 공리를 설계한다. Max‑Sum의 경우, Gomory‑Hu 트리라는 최소 컷 트리를 활용해 “모든 두 클러스터 사이의 최소 컷 가중치가 클러스터 내부의 합계와 일치한다”는 특성을 정의한다. 이는 기존에 Max‑Sum이 최소 컷 문제와 동형임을 이용한 직관적 접근이지만, 공리화함으로써 유일성(uniqueness)을 보장한다는 점이 핵심이다. 반면 Single‑Linkage는 최대 스패닝 트리(MST)를 기반으로 “클러스터 간 최소 거리(또는 최대 연결 가중치)가 MST의 해당 간선 가중치와 동일하다”는 공리를 만든다. 이 공리는 MST가 단일 연결성을 보존한다는 성질을 직접 활용한다.
흥미로운 부분은 저자들이 이 두 공리 집합을 부분집합으로 나누어 실험했을 때, 각각의 공리만으로는 알고리즘을 완전히 규정하지 못한다는 점을 실증한다. 예를 들어, ‘분할 일관성’과 ‘스케일 변환 불변성’만으로는 Max‑Sum과 Single‑Linkage를 구별할 수 없으며, Gomory‑Hu 특성 없이도 Max‑Sum을 정의할 수 있는 대안 공리가 존재함을 보인다. 이는 기존 클러스터링 이론에서 “필수적 공리”와 “보조적 공리”의 구분이 명확하지 않음을 시사한다.
마지막으로 논문은 현재 사용 중인 클러스터링 패러다임 분류 체계에 ‘그래프 기반 공리’라는 새로운 카테고리를 추가한다. 이는 트리 구조를 이용한 특성이 알고리즘을 구분하는 데 핵심적 역할을 한다는 점을 강조한다. 전체적으로 이 연구는 Q‑Clustering을 보다 체계적으로 이해하고, 알고리즘 설계 시 어떤 공리를 선택해야 하는지를 명확히 제시함으로써 이론적·실용적 가치를 동시에 제공한다.