분할 대비 직경 비율을 최대로 하는 군집화 알고리즘

초록

본 논문은 군집의 최소 분할값과 최대 직경값의 비율을 최적화하는 새로운 군집화 기준을 제안한다. k=2인 경우 정확 알고리즘을 제시하고, k≥3에서는 문제의 NP‑hard성을 증명한 뒤, 거리 가중치가 삼각 부등식을 만족할 때 2‑근사 알고리즘을 설계한다. 두 알고리즘 모두 O(n³) 시간복잡도를 가지며, 이미지 분할 실험을 통해 기존 Normalized Cut 대비 우수한 성능을 확인한다.

상세 분석

이 논문은 “split‑to‑diameter ratio”라는 새로운 군집 품질 지표를 정의한다. 여기서 split은 클러스터 내부의 한 점과 외부 점 사이 최소 거리이며, diameter는 클러스터 내부 최대 거리이다. 비율을 크게 할수록 클러스터는 내부는 촘촘히, 외부와는 명확히 구분된다는 의미다.
문제는 주어진 완전 가중 그래프 G(V,E)와 군집 수 k에 대해, 각 클러스터 i에 대해 ρ_i = min_split(i) / max_diameter(i) 를 구하고, 전체 ρ = min_i ρ_i 를 최대화하는 것이다. 이 정의는 기존의 최소‑거리, 평균‑거리, 혹은 정규화 컷(Normalized Cut)과는 달리 “내부 응집도와 외부 분리도”를 동시에 고려한다는 점에서 독창적이다.

k=2인 경우, 저자들은 비율 λ를 임의의 값으로 가정하고, λ보다 큰 해가 존재하는지를 판별하는 결정 문제를 만든다. 이를 위해 각 간선 (u,v)에 대해 가중치를 d(u,v)·λ와 비교해 새로운 그래프를 구성하고, 최소 스플릿이 최대 직경보다 λ배 이상인지 확인한다. 이 판별은 “minimum s‑t cut” 혹은 “maximum spanning tree” 기반의 이분 그래프 분할로 변환될 수 있다. 이진 탐색을 통해 최적 λ를 찾으며, 각 탐색 단계마다 O(n³) 시간의 전형적인 흐름(예: Floyd‑Warshall 혹은 전역 최소 컷)으로 해결한다. 따라서 전체 복잡도는 O(n³·log U) (U는 가중치 범위) 이지만, 논문에서는 상수 로그를 무시하고 O(n³)이라 제시한다.

k≥3에 대해서는 문제의 난이도를 증명한다. 저자들은 3‑Partition 혹은 Graph Coloring 문제로부터 다항식 환원을 구성한다. 특히, 각 객체를 서로 다른 색으로 색칠해야 하는 제약을 “split ≥ diameter” 조건으로 변환함으로써, 비율을 1보다 크게 만들 수 있는지 여부가 원래 문제의 해와 동치임을 보인다. 이 과정에서 완전 그래프와 특수한 가중치를 이용해 거리 함수가 삼각 부등식을 만족하도록 설계한다. 따라서 k≥3인 경우는 NP‑hard임이 증명된다.

근사 알고리즘은 거리 가중치가 메트릭(삼각 부등식)임을 전제로 한다. 저자들은 먼저 전체 그래프의 최소 신장 트리(MST)를 구하고, MST를 k개의 서브트리로 끊어 만든다. 각 서브트리는 연결성을 유지하므로 직경은 서브트리 내 가장 긴 경로 길이로 제한된다. 동시에, MST를 끊은 경계 간선들의 가중치는 해당 클러스터 간 최소 split을 하한으로 제공한다. 이때 얻어지는 비율은 최적 비율의 절반 이상임을 수학적으로 증명한다(2‑approximation). 알고리즘의 주요 연산은 MST 구축(O(n²) 혹은 O(n³) 구현)과 k‑1개의 가장 무거운 간선을 제거하는 단계이며, 전체 복잡도는 O(n³)이다.

실험 부분에서는 자연 이미지와 합성 이미지 두 종류에 대해 제안 알고리즘과 Normalized Cut을 비교한다. 평가 지표는 인간이 직접 라벨링한 “ground truth”와의 IoU(Intersection over Union), 그리고 시각적 경계 명료도이다. 결과는 특히 경계가 뚜렷하고 색상 대비가 큰 영역에서 제안 방법이 더 높은 split/diameter 비율을 달성해, 군집 경계가 더 정확하게 잡히는 것을 보여준다. 또한, 알고리즘이 단순히 전역 최소 컷을 수행하는 것이 아니라, 각 클러스터 내부의 직경을 직접 제한함으로써 과도한 내부 분산을 방지한다는 점이 강조된다.

전체적으로 이 논문은 군집 품질을 평가하는 새로운 관점을 제시하고, 이론적 난이도 분석과 실용적인 근사 알고리즘을 동시에 제공한다. 특히 이미지 분할과 같은 비지도 학습 분야에서 “내부 응집도와 외부 분리도”를 동시에 최적화하려는 연구자들에게 유용한 참고 자료가 될 것이다.