고차원 희소 데이터의 효율적 유사도 학습

본 논문은 차원이 매우 크고 데이터가 희소한 상황에서, 순위 기반 삼중항 제약을 만족하도록 유사도 행렬을 학습하는 새로운 방법을 제안한다. 유사도 행렬을 4‑희소(rank‑one) 기본 행렬들의 볼록 조합으로 파라미터화하고, 근사 프랭크‑와프(FW) 알고리즘에 전방·후방(away) 스텝을 결합해 한 번에 두 개의 특성만을 추가·제거한다. 이로써 시간·메모리 복잡도가 데이터 희소도에만 의존하고, 학습된 행렬은 극히 희소해 해석이 용이하며, 실험에…

저자: Kuan Liu, Aurelien Bellet, Fei Sha

본 논문은 차원이 매우 크고 데이터가 희소한 상황에서, 기존의 유사도·거리 메트릭 학습이 직면하는 “\(O(d^2)\) 파라미터 추정” 문제를 근본적으로 해결하고자 한다. 저자는 먼저 문제 정의를 명확히 한다. 입력 데이터는 \(\mathcal X\subset\mathbb R^d\) 에 속하며, 평균 비제로 차원 \(D\) 가 \(d\) 에 비해 매우 작다. 목표는 bilinear similarity \(S_M(x,x')=x^TMx'\) 를 학습하는 것이며, 여기서 \(M\) 은 대칭 PSD 행렬이어야 한다. 학습 데이터는 삼중항 제약 \(\mathcal T=\{(x_t,y_t,z_t)\}_{t=1}^T\) 로 주어지며, 각 제약은 “\(x_t\) 가 \(y_t\) 와는 더 가깝고 \(z_t\) 와는 더 멀다” 라는 순위 정보를 담는다. 이를 수학적으로 표현하면, \(\langle A_t,M\rangle = S_M(x_t,y_t)-S_M(x_t,z_t)\) 가 1 이상이 되도록 하는 것이 목표이며, 만족하지 못할 경우 스무딩 힌지 손실 \(\ell\) 로 패널티를 부여한다. 최적화 문제는 \

고차원 희소 데이터의 효율적 유사도 학습

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기