학습 가능한 가보르 필터와 주의 메커니즘으로 강화된 수중 음향 분류 모델
읽는 시간: 2 분
...
📝 원문 정보
- Title: Improving Underwater Acoustic Classification Through Learnable Gabor Filter Convolution and Attention Mechanisms
- ArXiv ID: 2512.14714
- 발행일: 2025-12-09
- 저자: Lucas Cesar Ferreira Domingos, Russell Brinkworth, Paulo Eduardo Santos, Karl Sammut
📝 초록 (Abstract)
수중 음향 목표물의 원격 탐지와 분류는 환경 모니터링 및 방위 분야에서 핵심 과제이다. 그러나 선박 방사음 및 환경 잡음의 복합성은 정확한 신호 처리에 큰 난관을 만든다. 최근 머신러닝 기반 접근법이 분류 정확도를 향상시켰지만, 데이터셋 규모의 제한과 실험 설계의 표준화 부족으로 일반화와 견고성이 저하된다. 본 논문은 학습 가능한 가보르 컨볼루션 레이어와 ResNeXt 백본에 squeeze‑and‑excitation 채널 주의 메커니즘을 결합한 GSE ResNeXt 구조를 제안한다. 2차원 적응형 밴드패스 필터인 가보르 필터는 특징 채널을 확장하고, 채널 주의와의 시너지 효과를 통해 학습 안정성과 수렴 속도를 향상시킨다. 세 가지 훈련‑테스트 분할 전략(데이터 누수 방지, 시간적 분리, 계통학적 구분)을 적용해 실험했으며, 이는 데이터 누수와 시간적 겹침이 성능에 미치는 영향을 체계적으로 평가한다. 실험 결과 GSE ResNeXt는 Xception, ResNet, MobileNetV2 등 기존 베이스라인을 지속적으로 앞서며, 초기 레이어에 가보르 컨볼루션을 삽입함으로써 훈련 시간을 최대 62 % 단축하였다. 또한, 훈련‑테스트 집합 간 시간적 분리가 성능에 가장 큰 영향을 미쳐 데이터 양보다 중요함을 확인했다. 이러한 결과는 신호 처리 기법이 데이터가 제한된 수중 음향 분류에서 모델의 신뢰성과 일반화를 크게 향상시킬 수 있음을 시사한다. 향후 연구는 환경 요인에 의한 입력 신호 변형을 완화하는 방안을 모색해야 한다.💡 논문 핵심 해설 (Deep Analysis)
본 연구는 수중 음향 신호 분류라는 특수 분야에 신호 처리와 딥러닝을 융합한 새로운 접근법을 제시한다. 핵심 아이디어는 가보르 필터를 학습 가능한 형태로 구현하여, 전통적인 고정형 필터가 제공하지 못하는 데이터‑특화된 주파수·위상 특성을 자동으로 학습하도록 만든 것이다. 가보르 필터는 2차원 가우시안 함수를 복소 지수와 결합한 형태로, 특정 중심 주파수와 방향성을 갖는 밴드패스 특성을 제공한다. 이를 네트워크 초반 레이어에 삽입하면, 원시 스펙트로그램(또는 멜‑스펙트로그램)에서 잡음과 유사 신호를 효과적으로 억제하고, 목표 음향의 특징적인 주파수 패턴을 강조한다.ResNeXt 백본은 다중 경로 집합(cardinality)을 활용해 표현력을 높이는 구조이며, 여기에 squeeze‑and‑excitat…