잠재 변수 기반 Fisher 판별 분석

** 본 논문은 전통적인 LDA가 요구하는 인스턴스‑레벨 라벨을 완화하고, 비디오와 같은 bag‑레벨 라벨만으로도 학습이 가능한 ‘잠재 Fisher 판별 분석(LFDA)’ 모델을 제안한다. Gaussian mixture prior와 EM 기반의 교번 최적화를 통해 잠재 라벨을 추정하고, 동시에 차원 축소를 수행한다. MUSK·Corel 데이터와 TRECVID MED11 키프레임 추출 실험에서 기존 방법 대비 경쟁력 있는 성능을 보이며, 특히…

저자: Gang Chen

잠재 변수 기반 Fisher 판별 분석
** 본 논문은 “Latent Fisher Discriminant Analysis”(LFD A)라는 새로운 차원 축소 및 분류 프레임워크를 제안한다. 전통적인 Linear Discriminant Analysis(LDA)는 인스턴스‑레벨 라벨이 반드시 필요하지만, 실제 영상·이미지 분석에서는 비디오 전체에 대한 라벨만 제공되는 경우가 많다(예: 이벤트 검출, 키프레임 추출). 이러한 상황을 해결하기 위해 저자는 bag‑level 라벨만을 이용해 인스턴스의 잠재 라벨을 추정하고, 동시에 투영 행렬을 학습하는 통합 베이지안 모델을 설계하였다. ### 1. 배경 및 관련 연구 LDA는 클래스 간 분산을 최대화하고 클래스 내 분산을 최소화하는 선형 변환을 찾는 방법으로, 고전적인 Fisher Linear Discriminant와 동일하다. 다중 클래스 확장은 \(d-1\) 차원의 서브스페이스를 제공한다. 그러나 LDA는 라벨이 없는 대규모 데이터에 적용하기 어렵다. 최근에는 반지도학습(Transductive SVM, Co‑Training 등)과 그래프 기반 방법이 제안되었지만, 이들 역시 인스턴스‑레벨 라벨을 전제로 한다. 반면, Multiple‑Instance Learning(MIL)에서는 bag‑level 라벨만을 사용한다. MI‑SVM, latent SVM 등은 라벨이 없는 인스턴스를 잠재 변수로 모델링해 최적화한다. ### 2. 모델 정의 데이터는 \(X=\{x_1,\dots,x_n\}\) 로, 각 \(x_i\)는 \(n_i\) 개의 인스턴스를 포함하는 bag이며 라벨 \(l_i\in\{1,\dots,C\}\) 를 가진다. 각 클래스 \(i\)는 \(K\) 개의 가우시안 컴포넌트 \(\{(\pi_{ji},\mu_{ji},\Sigma_{ji})\}_{j=1}^K\) 로 표현한다. 잠재 라벨 \(z\) 는 인스턴스가 어느 클래스·컴포넌트에 속하는지를 나타낸다. 목표 함수는 \

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기