그라스만다인 프록시 융합을 통한 고계수 행렬 완성
초록
본 논문은 관측이 결측된 데이터 열이 여러 저차원 부분공간의 합집합에 가깝다는 가정 하에, 각 열을 완전한 프록시 서브스페이스에 매핑하고 그 서브스페이스들을 그라스만다인 위에서 최적화한다. 코다드 거리와 지오데식 거리 두 가지 손실을 동시에 최소화함으로써 결측 데이터를 효과적으로 클러스터링하고, 저샘플링 상황에서도 기존 방법보다 우수한 복원 성능을 보인다.
상세 분석
고계수 행렬 완성(HRMC)은 저차원 부분공간들의 합집합에 속하는 열들을 가진 행렬에서 결측값을 복원하는 문제로, 전통적인 저계수 행렬 완성(LRMC)이나 서브스페이스 클러스터링(SC)과는 달리 부분관측 데이터 간 거리 측정이 어려워 기존 방법들이 이론적 보장 없이 높은 샘플 복잡도를 요구한다. 논문은 이러한 난점을 해결하기 위해 “프록시 서브스페이스”라는 개념을 도입한다. 각 관측된 열 (x_i)에 대해, 관측된 좌표만을 포함하는 완전한 (r)‑차원 서브스페이스 (U_i)를 초기화하고, 이 서브스페이스가 실제 열의 가능한 완성을 포함하도록 강제한다. 이를 정량화하기 위해 코다드 거리 (d_c(x_i, U_i)=1-\sigma_1^2(X_i^{0\top}U_i))를 사용한다. 여기서 (X_i^0)는 (x_i)의 관측되지 않은 좌표를 0으로 채우고 정규화한 뒤, 남은 자유도를 보완하는 정규 기저를 추가해 만든 행렬이다. 코다드 거리는 실제 거리라기보다 “가능한 완성”과 서브스페이스 간의 정렬 정도를 나타내는 척도이며, (\sigma_1=1)이면 (U_i)가 완전한 복원을 포함한다는 의미다.
다음으로, 서로 다른 프록시 서브스페이스 간의 일관성을 확보하기 위해 그라스만다인 위의 지오데식 거리 (d_g(U_i,U_j)=\sum_{\ell=1}^r \arccos \sigma_\ell(U_i^\top U_j))를 도입한다. 이 항은 동일한 실제 부분공간에 속하는 열들의 프록시가 서로 가까워지도록 유도하며, 클러스터링 단계에서 자연스럽게 서브스페이스가 합쳐지게 만든다. 전체 목적함수는
\
댓글 및 학술 토론
Loading comments...
의견 남기기