해안 해양 상황 인식 SAR 선박 탐지를 위한 무지도 해 육 분할 기반 모델
초록
본 논문은 SAR 영상에서 선박을 검출할 때 해·육 구분 정보를 사전 지식으로 활용하는 새로운 두 단계 검출 프레임워크를 제안한다. 무지도 K‑means 클러스터링으로 인shore·offshore 장면을 구분하고, 인shore 영상에 Otsu 임계값을 적용해 해·육 마스크를 생성한다. 이후 Land Attention Suppression Module(LASM)이 이 마스크를 이용해 특징 맵에서 육지 영역의 attention을 억제함으로써 검출 정확도를 향상시킨다. SSDD 데이터셋 실험에서 mAP50 91.8%를 달성하며 기존 Faster‑RCNN, DCN, Grid‑RCNN 대비 우수한 성능을 보였다.
상세 분석
본 연구는 SAR 기반 선박 탐지에서 가장 큰 문제점 중 하나인 ‘전후 정보(프라이어) 부족’을 해결하기 위해 해·육 구분 정보를 사전 지식으로 도입한다는 점에서 혁신적이다. 기존의 딥러닝 기반 탐지 모델은 대부분 이미지 전체를 동일하게 처리하며, 해안가에 위치한 선박과 육지 배경을 구분하는 데 한계가 있었다. 이를 보완하기 위해 저자들은 두 개의 핵심 모듈, 즉 Unsupervised Land‑Sea Segmentation Module(ULSM)과 Land Attention Suppression Module(LASM)을 설계하였다.
ULSM은 라벨이 없는 SAR 데이터셋에서도 작동하도록 설계되었다. 먼저 ResNet‑50을 이용해 이미지의 고차원 특징을 추출하고, K‑means 클러스터링을 통해 전체 데이터셋을 ‘인shore(해안 근접)’와 ‘오프shore(해양)’ 두 종류의 장면으로 자동 분류한다. 여기서 저자는 인shore 장면이 전체 데이터 대비 상대적으로 적고, 실제 지구 표면에서 해양이 육지보다 넓다는 사실을 이용해 작은 클러스터를 인shore로 정의한다. 이후 인shore 이미지에만 Otsu 이진화 기법을 적용해 해·육 마스크를 생성한다. Otsu 방법은 전역 임계값을 찾아 픽셀 밝기 분포의 클래스 간 분산을 최대화함으로써 해와 육지를 구분한다. 이 과정은 완전 무지도이며, 라벨링 비용을 크게 절감한다.
LASM은 생성된 해·육 마스크를 활용해 특징 맵 수준에서 attention을 조절한다. 구체적으로, ResNet‑50을 통과한 특징 맵을 1×1 컨볼루션으로 256 차원으로 통일한 뒤, 평균 풀링을 통해 7×7×256 형태의 벡터로 변환한다. 이 벡터는 두 개의 Fully Connected 레이어와 Tanh 활성화 함수를 거쳐 ‘land attention suppression weight’를 산출한다. 산출된 가중치는 1‑(mask·λ) 형태로 계산되어, 마스크가 0(육지)인 영역에서는 가중치가 감소하고, 1(해양)인 영역에서는 거의 변하지 않는다. 이렇게 가중화된 특징 맵은 Region Proposal Network(RPN)와 ROI 헤드에 전달되어 최종 객체 후보와 박스 회귀를 수행한다. 이때 육지 영역에 대한 attention이 억제되므로, 오프shore 장면에서의 검출 성능이 크게 향상된다.
실험은 공개 SAR 선박 데이터셋인 SSDD를 사용하였다. 이미지 크기를 512×512로 리사이즈하고, 학습률 0.02, 모멘텀 0.9, 가중치 감쇠 0.001로 12 epoch를 학습하였다. 결과는 mAP와 mAP50, mAP75, mAP_S(소형 선박), mAP_M(중형), mAP_L(대형) 등 다양한 지표에서 기존 Faster‑RCNN, DCN, Grid‑RCNN을 능가하였다. 특히 mAP50이 91.8%로, 두 번째 최고 성능인 DCN(89.8%)보다 2.6%p 상승했으며, 소형 선박에 대한 mAP_S도 63.8%로 높은 점수를 기록했다.
또한 Ablation Study를 통해 K‑means와 Otsu의 결합 효과를 검증하였다. K‑means 없이 전체 데이터에 Otsu만 적용한 경우(mAP 62.2%, mAP50 88.4%)가 제안 모델(mAP 63.5%, mAP50 91.8%)보다 현저히 낮았다. 이는 오프shore 장면에서도 불필요하게 해·육 마스크를 적용하면 대형 선박이 육지로 오인되어 마스크가 부정확해지고, 결국 검출 성능이 저하된다는 것을 의미한다.
요약하면, 본 논문은 (1) 무지도 장면 분류와 해·육 마스크 생성, (2) 마스크 기반 attention 억제라는 두 단계의 혁신적인 접근을 통해 SAR 선박 탐지에서 기존 딥러닝 모델이 갖는 배경 혼동 문제를 효과적으로 해결하였다. 또한 라벨이 부족한 실제 운영 환경에서도 적용 가능하도록 설계된 점이 실용적 가치를 높인다. 향후 연구에서는 보다 정교한 무지도 세그멘테이션 기법이나 멀티스펙트럼 SAR 데이터를 결합해 성능을 더욱 끌어올릴 여지가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기