고속 탐욕적 서브스페이스 클러스터링 알고리즘
FGSSC는 결측치와 오류가 많이 포함된 고차원 데이터에서 여러 저차원 선형·아핀 서브스페이스를 효과적으로 구분한다. 기존 SSC와 GSSC보다 높은 복원 정확도와 거의 동일한 계산량을 보이며, 얼굴 이미지 데이터셋에서 오분류율을 6~20배 감소시킨다.
저자: Alex, er Petukhov, Inna Kozlov
1. 서론
본 논문은 고차원 데이터가 여러 저차원 선형·아핀 서브스페이스에 분포하고, 이 서브스페이스와 차원, 개수가 사전에 알려지지 않은 상황에서 데이터를 올바르게 군집화하는 문제를 다룬다. 특히 실제 응용에서 흔히 발생하는 결측치(erasures)와 오류(errors)가 섞인 경우에 기존 방법들의 한계가 두드러진다. 이러한 배경에서 저자들은 SSC(Sparse Subspace Clustering)를 기반으로 탐욕적 전략을 도입한 GSSC를 제안했으나, 계산량이 크게 증가한다는 문제점을 지적한다.
2. 문제 설정 및 기존 이론
데이터 행렬 Y∈ℝ^{D×N}를 N개의 벡터 y_i가 K개의 서브스페이스 S_k에 속한다고 가정한다. 각 서브스페이스의 차원 d_k는 알려지지 않으며, 일부 벡터는 서로 교차점에 위치할 수 있다. SSC는 각 y_i를 다른 벡터들의 선형 결합 y_i = Yc_i (c_i,i=0) 형태로 표현하고, ℓ₁ 정규화를 통해 희소한 계수 벡터 c_i를 구한다. 이때 C=
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기