다목적 연결: 공간 보존형 계층 군집 전략의 새로운 패러다임
본 논문은 일반화 평균(p‑mean)을 이용해 단일 연결부터 완전 연결까지 연속적으로 전이되는 무한한 계층 군집 전략인 ‘다목적 연결(versatile linkage)’을 제안한다. β‑플렉시블 군집과 달리 변수‑그룹 알고리즘을 적용해 동일 거리에서 발생하는 다중 결합을 동시에 처리함으로써 트리의 비유일성을 해소하고, 새롭게 정의한 ‘트리 균형’과 ‘공간 왜곡’ 지표를 통해 기존 방법들과 비교한다. 실험 결과, 다목적 연결은 공간을 보존하면서도…
저자: Alberto Fern, ez, Sergio Gomez
본 논문은 계층적 군집(agglomerative hierarchical clustering)의 구현 전략을 재조명하고, 기존 방법들의 한계를 보완하는 새로운 프레임워크인 ‘다목적 연결(versatile linkage)’을 제안한다.
1. **서론**에서는 계층적 군집이 거리 행렬을 기반으로 클러스터를 순차적으로 병합하는 과정에서, 거리 정의에 따라 단일 연결(SL), 완전 연결(CL), 평균 연결(AL) 등 다양한 전략이 존재함을 언급한다. 특히, Lance‑Williams 공식에 기반한 β‑플렉시블 군집이 파라미터 β 하나로 무한한 전략을 생성하지만, 거리 행렬을 그대로 유지해야 하고, 근접성 타이 문제로 인해 결과가 비유일적이라는 단점을 지적한다.
2. **β‑플렉시블 군집** 섹션에서는 Lance‑Williams 일반화 식(1)을 소개하고, β 파라미터가 −1≤β≤+1 범위에서 α_ij, β_ii′, β_jj′ 가 어떻게 정의되는지를 상세히 설명한다. 가중치와 비가중치 버전의 차이, 즉 클러스터 전체에 동일 가중치를 부여하는지(가중) 혹은 개별 객체에 동일 가중치를 부여하는지(비가중) 등을 수식(3)–(8)으로 제시한다.
3. **다목적 연결 정의**에서는 일반화 평균(p‑mean)을 이용해 클러스터 간 거리를 재정의한다. 식 (9)에서 Dₚ(X_I,X_J) = (1/|X_I||X_J|)·
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기