SPD 행렬을 위한 랜덤 프로젝션 기반 이미지 분류

본 논문은 대칭 양정정( SPD ) 행렬을 리만 다양체로 모델링한 뒤, 스테인 발산 커널을 이용해 RKHS에 임베딩하고, 무작위 하이퍼플레인을 통해 랜덤 프로젝션 공간으로 변환한다. 이렇게 얻은 벡터 표현은 기존 유클리드 기반 학습기법을 그대로 적용할 수 있으면서도 다양체의 기하 구조를 보존한다. 얼굴 인식, 사람 재식별, 텍스처 분류 실험에서 기존 최첨단 방법들을 능가한다.

저자: Azadeh Alavi, Arnold Wiliem, Kun Zhao

SPD 행렬을 위한 랜덤 프로젝션 기반 이미지 분류
본 논문은 이미지와 비디오의 특징을 공분산 행렬 형태로 표현하고, 이러한 공분산 행렬이 대칭 양정정(Symmetric Positive Definite, SPD) 행렬이라는 점에 주목한다. SPD 행렬은 자체적으로 리만 다양체를 형성하며, 이 다양체 위에서의 거리와 평균 등은 일반적인 유클리드 공간과 다르게 정의된다. 기존 연구에서는 두 가지 주요 접근법이 사용되었다. 첫 번째는 리만 다양체를 접선 공간(Tangent Space)으로 선형화하여 유클리드 기반 알고리즘을 적용하는 방법이다. 이 방법은 구현이 간단하지만, 비선형 구조를 선형 근사로 대체하면서 중요한 판별 정보를 손실할 위험이 있다. 두 번째는 커널 함수를 이용해 SPD 행렬을 재생산 커널 힐베르트 공간(RKHS)으로 매핑하는 방법이다. 이 경우 비선형 구조를 보존할 수 있지만, 기존 유클리드 알고리즘을 그대로 쓰기 위해서는 커널화 과정을 거쳐야 하며, 계산 비용이 크게 증가한다. 이러한 한계를 극복하고자 저자들은 “Random Projection on SPD manifold for Image Classification”(ROSE)이라는 새로운 프레임워크를 제안한다. 핵심 아이디어는 다음과 같다. 1) 스테인 발산(Stein Divergence) 커널을 이용해 SPD 행렬을 RKHS에 암묵적으로 매핑한다. 스테인 발산은 AIRM(Affine Invariant Riemannian Metric)보다 계산이 효율적이며, 커널 형태 K(X,Y)=exp(−σ Jφ(X,Y)) 로 정의된다. 여기서 σ는 양의 정수(½, 3/2,…, (d−1)/2) 범위 내에서 선택한다. 2) Kulis‑Grauman이 제안한 랜덤 프로젝션 기법을 RKHS에 적용한다. 구체적으로, 훈련 샘플 집합에서 평균 μ와 공분산 Σ를 추정하고, 중심극한정리를 이용해 Σ⁻¹ᐟ² · (z − μ) 형태의 가우시안 하이퍼플레인을 생성한다. 이 하이퍼플레인은 실제로는 훈련 샘플들의 커널 값들만을 이용해 계산되며, 고유분해(K=Λ Θ Λᵀ)를 통해 식 (9)‑(11) 로 구현된다. 3) 각 SPD 행렬 X는 위 하이퍼플레인에 투영되어 k 차원의 벡터 f(X) =

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기