다중 도메인 시각 매칭을 위한 일반화된 유사도 측정과 딥러닝 통합
본 논문은 서로 다른 영상 도메인 간 매칭을 위해 기존 선형 변환을 확장한 어파인 변환과 마할라노비스 거리·코사인 유사도의 데이터‑드리븐 결합을 제안한다. 이를 유사도 행렬 형태로 정의하고, CNN 기반 특징 추출기에 삽입해 엔드‑투‑엔드 학습이 가능하도록 설계하였다. 사람 재식별 및 다양한 얼굴 검증 실험에서 최첨단 성능을 입증한다.
저자: Liang Lin, Guangrun Wang, Wangmeng Zuo
본 논문은 서로 다른 시각 도메인 간 매칭을 위한 새로운 유사도 측정 방법과 이를 딥러닝 기반 특징 학습과 통합하는 프레임워크를 제안한다. 서론에서는 크로스‑도메인 매칭이 사람 재식별, 정지‑비디오 얼굴 검색, 연령‑불변 얼굴 검증, 스케치‑사진 매칭 등 다양한 응용 분야에서 핵심 문제임을 제시하고, 기존 방법들이 (1) 두 도메인을 동일한 선형 변환으로 투영하고, (2) 투영된 공간에서 유클리드 거리나 내적을 사용한다는 한계를 지적한다. 이러한 한계를 극복하기 위해 저자는 두 가지 주요 개선점을 제시한다. 첫째, 선형 변환을 어파인 변환(LA·x+a, LB·y+b) 로 확장하여 평행이동·전단·스케일 등 복합 변형을 포착한다. 둘째, 마할라노비스 거리와 코사인 유사도를 하나의 행렬 형태로 결합한다. 구체적으로, 두 샘플 x와 y에 대해 다음과 같은 일반화된 유사도 함수를 정의한다.
S(x,y) =
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기