다중경로가 존재하는 얕은 해역에서 CNN 기반 수중 음원 위치추정

본 논문은 얕은 해역의 다중경로 환경에서 모터 선박과 같은 광대역 소음원을 정확히 추정하기 위해, 켑스트로그램과 일반화 교차상관(GCC) 특성을 입력으로 사용하는 합성곱 신경망(CNN)을 설계하였다. 제안된 다중태스크 CNN은 범위와 방위(베어링)를 연속값으로 동시에 예측하며, 기존 피크 기반 TDOA 추정 방식보다 높은 정확도와 일반화 능력을 보인다. 실제 해상 실험 데이터를 통해 전통적인 수동 소나 방법 대비 평균 거리 오차가 크게 감소함을…

저자: Eric L. Ferguson, Stefan B. Williams, Craig T. Jin

다중경로가 존재하는 얕은 해역에서 CNN 기반 수중 음원 위치추정
본 논문은 얕은 해역에서 발생하는 다중경로 현상이 수동 음원 위치추정, 특히 시간차(TDOA) 기반 방법의 정확도를 크게 저하시킨다는 점에 주목한다. 전통적인 좁은 대역폭 소나 시스템은 센서 간 간격이 반파장 이하일 때만 유효하고, 다중경로가 존재하면 GCC 함수에 다수의 가짜 피크가 나타나 TDOA 추정이 편향된다. 반면, 켑스트로그램은 직접 경로와 반사 경로 사이의 간격을 quefrency 도메인에서 피크 형태로 드러내어, 다중경로 환경에서도 유용한 정보를 제공한다. 이러한 배경 하에 저자들은 켑스트로그램과 일반화 교차상관(GCC) 두 종류의 특성 맵을 동시에 입력으로 받는 합성곱 신경망(CNN) 구조를 설계하였다. 전체 네트워크는 두 개의 서브네트워크(GCC‑CNN, Cepstral‑CNN)로 구성되며, 각각 1‑D 컨볼루션 레이어 3개와 전결합 레이어 2개를 거쳐 256 차원의 특징 벡터를 추출한다. 이후 두 서브네트워크의 출력 벡터를 연결(concatenate)하고, 다시 전결합 레이어 2개를 통과시켜 범위와 방위(베어링)를 각각 하나의 회귀 뉴런으로 출력한다. 모든 레이어는 ReLU 활성화 함수를 사용하고, 풀링을 배제해 시간‑주파수 해상도를 유지한다. 학습 목표는 예측된 범위와 방위가 실제값과 얼마나 가까운지를 직접 최소화하는 것이며, 이를 위해 극좌표 거리 손실(Ep)와 방위 전용 손실(Eb)을 가중합한 새로운 손실 함수를 도입한다. Ep는 예측과 실제 사이의 유클리드 거리 제곱을, Eb는 방위 차이의 제곱을 나타내며, 두 손실을 α와 1‑α 비율로 조절한다. 이 설계는 방위 예측을 물리적으로 의미 있는 첫 번째 회전 구간에 제한함으로써 네트워크가 불필요한 회전 해석을 피하도록 정규화한다. 데이터는 시드니 대학교 해양 실험에서 수집된 실제 수소폰 배열(3채널, 14 m 간격)과 모터 보트의 통과 기록을 사용한다. 샘플링 주파수는 250 kHz이며, 보트 위치는 DGPS로 0.1 s 간격으로 라벨링된다. 훈련 데이터는 100 k개의 무작위 샘플(범위 균등 분포)과 5 k개의 검증 샘플로 구성하고, 테스트는 9 980개의 라벨링된 샘플, 일반화 검증은 다른 보트와 다른 소음 스펙트럼을 가진 11 714개의 샘플을 사용한다. 전처리 단계에서 켑스트로그램은 84 µs~1.4 ms 구간(31~351 인덱스)만을 선택해 320×3 특성 맵을 만든다. GCC는 두 센서 쌍에 대해 ±9.2 ms 범위 내 4800×2 맵을 계산하고, 파라미터 감소를 위해 480×2로 다운샘플링한다. 네트워크는 TensorFlow 기반으로 구현되었으며, Momentum 옵티마이저(learning rate = 3×10⁻⁹, momentum = 0.9)와 배치 정규화, 50% 드롭아웃을 적용해 학습한다. 실험 결과, Combined‑CNN(케프스트로그램 + GCC) 모델은 평균 거리 오차가 약 5 m로, 기존 알고리즘 기반 TDOA 방법(≈10 m 이상)보다 절반 이하의 오차를 기록했다. 특히 범위가 0–1000 m 구간에서 일관된 정확도를 보였으며, 켑스트로그램 전용 CNN과 GCC 전용 CNN보다 모두 우수했다. 일반화 테스트에서도 다른 보트에 대해 평균 7 m 정도의 오차를 보이며, 훈련 데이터와 다른 소음 특성에도 견고함을 입증했다. 논문의 주요 기여는 다음과 같다. 첫째, 켑스트로그램과 GCC 전체 정보를 활용해 피크 선택에 의존하지 않는 전역적 특성 학습을 구현하였다. 둘째, 범위와 방위를 연속값 회귀로 동시에 예측함으로써 기존 분류 기반 접근법보다 높은 해상도와 정밀도를 제공한다. 셋째, 극좌표 기반 손실 함수를 도입해 방위와 거리 사이의 물리적 관계를 학습 과정에 자연스럽게 반영하였다. 넷째, 실제 해상 실험 데이터를 통해 전통적인 수동 소나 방법 대비 현저한 성능 향상을 입증하였다. 한계점으로는 실험이 특정 3채널, 일정 간격 배열에 국한되어 있어 다른 배열 구성(예: 비선형 배열, 센서 수 증가)에서의 일반화 가능성을 추가 검증이 필요하다. 또한, 학습에 사용된 매우 낮은 학습률과 높은 연산 복잡도는 실시간 적용에 제약을 줄 수 있다. 향후 연구에서는 다양한 배열 형태와 실시간 스트리밍 처리, 멀티‑스펙트럼(저주파·고주파 동시) 입력을 결합한 멀티모달 네트워크 확장, 그리고 전이 학습을 통한 환경 적응성을 탐구할 예정이다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기