깊은 신경망으로 시선 선택을 학습하는 이미지 추적 모델

본 논문은 인간 시각 시스템을 모방해, 가시화된 시선 데이터를 이용해 객체를 동시에 추적하고 인식하는 이중 경로 모델을 제안한다. 정체성 경로는 심층 제한 볼츠만 머신(RBM)으로 외관을 모델링하고, 제어 경로는 파티클 필터와 가우시안 프로세스 기반 보상 모델을 이용해 최적의 시선(고정점)을 선택한다. 특히 부분 관측 상황과 연속적인 시선 공간에서도 효과적인 학습 방법을 제시한다.

저자: Misha Denil, Loris Bazzani, Hugo Larochelle

깊은 신경망으로 시선 선택을 학습하는 이미지 추적 모델
본 논문은 인간 시각 시스템의 두 주요 경로인 “what”(정체성)와 “where”(제어)를 모델링하여, 시선 데이터를 활용한 객체 추적 및 인식 프레임워크를 제시한다. 전체 구조는 크게 두 부분으로 나뉜다. 1. **정체성 경로 (Ventral Pathway)** - **외관 모델링**: 저해상도 주변부와 고해상도 중심부를 동시에 다루는 foveated 이미지 입력을 (factored) RBM에 공급한다. RBM은 가시 영역의 저차원 특징 h_t 를 추출하고, 사전 학습된 필터 W 를 사용해 효율적인 표현을 만든다. - **다중 고정점 집계**: Δ개의 연속된 시선 정보를 하나의 고차원 은닉층 h

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기