Fourier 각도 정렬 기반 회전 객체 검출 혁신

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 주파수 영역에서 물체의 주된 방향을 추정하고 이를 정렬함으로써, 네크 단계의 방향 불일치와 헤드 단계의 분류‑각도 회귀 충돌을 동시에 해결한다. 제안된 FAAFusion과 FAA‑Head 모듈은 기존 회전 객체 검출 파이프라인에 플러그‑인 방식으로 삽입 가능하며, DOTA‑v1.0/1.5와 HRSC2016에서 각각 78.72%와 72.28%의 mAP를 달성해 최신 최고 성능을 기록한다.

상세 분석

Fourier Angle Alignment(FAA)는 회전 불변성을 갖는 푸리에 변환의 특성을 이용해, 입력 피처 맵을 2차원 FFT로 변환한 뒤 중심을 이동(phase shift)하고, 극좌표(ρ,θ)로 재표현한다. 이후 반경 방향으로 에너지를 적분해 1차원 각도 에너지 분포 Eθ(θ)를 얻고, 최대값을 갖는 θ̂를 물체의 주된 방향으로 추정한다. 이 과정은 저해상도·고주파 정보를 풍부히 담고 있는 저레벨 피처에서 특히 정확하게 동작한다는 점이 핵심이다.

네크 단계에서는 고레벨 피처(Yₗ₊₁)가 의미는 풍부하지만 방향 정보가 흐릿한 저주파 특성을 가지고, 저레벨 피처(Xₗ)는 경계·텍스처 등 고주파 방향 신호가 강하다. 기존 FPN이 단순 덧셈이나 concat으로 두 피처를 결합하면, 서로 다른 주파수 대역의 방향 신호가 혼합돼 각도 회귀 성능이 저하된다. FAAFusion은 저레벨 피처에서 추정한 θ̂를 외부 각도로 사용해 고레벨 피처를 RΔθ(·) 로 회전시킨 뒤, 정렬된 고레벨 피처와 저레벨 피처를 합친다. 이렇게 하면 스케일 간 방향 일관성이 확보돼, 특히 작은 물체나 얇은 선형 객체(예: 항공기, 선박)의 회전 정확도가 크게 향상된다.

헤드 단계에서는 하나의 RoI 피처가 분류(회전 불변)와 회귀(회전 민감) 두 목적을 동시에 수행해야 하는 ‘태스크 충돌’ 문제가 있다. FAA‑Head는 RoI 피처에 대해 동일한 푸리에 기반 각도 추정을 수행하고, θ̂를 0°(canonical)와 정렬한다. 정렬된 피처는 회전에 강건해 분류기에 투입되고, 원본 피처는 회전에 민감한 회귀기에 그대로 사용된다. 두 피처를 element‑wise addition으로 결합함으로써, 분류와 회귀가 서로 방해하지 않으면서도 상호 보완적인 정보를 공유한다.

실험 결과는 ResNet‑50, LSKNet‑S, StripNet‑S 등 서로 다른 백본에 FAAFusion·FAA‑Head를 적용했을 때, DOTA‑v1.0에서 평균 0.68~~1.00%p, DOTA‑v1.5에서 0.37~~2.02%p, HRSC2016에서 1.23~2.17%p의 mAP 상승을 보여준다. 특히 단일 스케일 학습·테스트 환경에서도 78.72%와 72.28%라는 최고 기록을 세웠다.

이 접근법의 장점은 (1) 주파수 도메인에서 방향을 직접 추정함으로써 복잡한 회전‑인식 모듈을 설계할 필요가 없고, (2) 플러그‑인 형태라 기존 파이프라인에 최소한의 코드 변경만으로 적용 가능하며, (3) 계산 비용이 FFT와 간단한 회전 연산에 국한돼 실시간 요구사항을 크게 해치지 않는다. 반면, FFT 연산은 GPU 메모리 사용량을 증가시킬 수 있고, 극좌표 변환 시 샘플링 해상도 선택이 결과에 민감할 수 있다. 또한, 매우 작은 객체나 저대비 상황에서는 스펙트럼 에너지 분포가 흐려져 θ̂ 추정이 부정확해질 가능성이 있다. 향후 연구에서는 다중 스케일 스펙트럼 통합, 학습 가능한 주파수 필터링, 그리고 비선형 회전 변환에 대한 보다 정교한 보정 기법을 도입해 이러한 한계를 보완할 수 있다.

Fourier 각도 정렬 기반 회전 객체 검출 혁신

초록

상세 분석

댓글 및 학술 토론

의견 남기기