불변 스캐터링 기반 이미지 분류

본 논문은 이미지와 텍스처와 같은 복합 신호를 효과적으로 분류하기 위한 새로운 프레임워크를 제시한다. 핵심 아이디어는 “스캐터링 변환(scattering transform)”이라는 비선형 컨볼루션 네트워크를 이용해 신호를 번역 불변성 및 변형에 대한 Lipschitz 연속성을 동시에 만족하는 표현으로 변환하는 것이다. 1. **스캐터링 연산의 구성** - **웨이브렛 변환**: 입력 이미지 f에 대해 다중 스케일·다중 방향 복소 가우시안 Gabor 웨이브렛 ψ_{j,γ} 를 컨볼루션한다. 이는 고주파·다양한 방향 정보를 추출한다. - **복소 절댓값(modulus) 연산**: 각 웨이브렛 계수에 절댓값을 취해 위상 정보를 제거하고 에너지를 저주파 영역으로 집중시킨다. 복소 웨이브렛을 사용함으로써 절댓값 연산에 의한 특이점(위상 소실) 발생을 최소화한다. - **저역 통과 필터 φ_J 로 평균**: 절댓값 처리된 신호를 스케일 J에 해당하는 저역 필터 φ_J 로 컨볼루션하고, 필요 시 다운샘플링한다. 이 단계에서 번역 불변성이 확보된다. 2. **다중 경로와 고차 스캐터링** - 위 과정을 한 번만 수행하는 것이 1차 스캐터링이며, 절댓값 후 다시 웨이브렛·절댓값·평균을 반복하면 2차, 3차 … m차 스캐터링 계수가 생성된다. 각 경로 p = {(j₁,γ₁), … , (j_m,γ_m)}는 서로 다른 스케일·방향의 연속적인 상호작용을 의미한다. - 고차 계수는 “공동 발생(co-occurrence)” 정보를 담아, 코너·교차점·텍스처 패턴 등 복합 구조를 구분하는 데 유용하다. 3. **수학적 특성** - **계약성**: 스캐터링 연산은 L2 노름에서 계약성을 만족한다(‖S_J f – S_J g‖₂ ≤ ‖f – g‖₂). - **노름 보존**: 적절한 파동렛(δ=0) 선택 시 ‖S_J f‖₂ = ‖f‖₂ 가 된다. - **변형에 대한 Lipschitz 연속성**: 변형 D_τ f(x)=f(x–τ(x))에 대해 ‖S_J D_τ f – S_J f‖₂ ≤ C·‖f‖·‖∇τ‖_∞·log(‖τ‖_∞/‖∇τ‖_∞). 이는 작은 변형이 선형적으로 반영됨을 의미한다. 4. **분류를 위한 저차원 아핀 모델** - 스캐터링 피처는 차원이 매우 크지만, 실제 클래스별 변동은 저차원 서브스페이스에 집중된다. 각 클래스 C_i 를 확률 과정 F_i 로 모델링하고, 스캐터링 변환 S_J F_i 의 평균 μ_i 와 공분산 Σ_i 를 추정한다. - 공분산의 상위 k개의 고유벡터 V_{k,i} 로 정의된 아핀 공간 A_{k,i}=μ_i+V_{k,i} 가 클래스 i 의 저차원 근사 모델이 된다. - PCA를 이용해 μ_i 와 V_{k,i} 를 학습 데이터로부터 효율적으로 추정한다. 샘플 수가 차원에 비해 적어도, 얇은 SVD(복소수) 알고리즘을 사용하면 O(T·K·N) 연산으로 충분히 계산 가능하다. 5. **모델 선택 및 판별 전략** - 입력 이미지 f 에 대해 각 클래스 i 와 차원 k 에 대해 투영 오차 ‖S_J f – P_{A_{k,i}}(S_J f)‖₂² 를 계산한다. - 차원에 대한 페널티 β·k 를 더해, 최소값을 주는 (i*,k*) 를 선택한다: î(f)=argmin_i min_k

불변 스캐터링 기반 이미지 분류

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기