지진 이미지 의미분할을 위한 초경량 딥러닝 모델
초록
본 논문은 제한된 라벨 데이터만으로도 높은 정확도를 달성할 수 있는 새로운 심층 신경망 구조를 제안한다. 전통적인 팽창(dilated) 컨볼루션을 대체하는 전치(transposed) 잔차 유닛과, 업스케일링 과정을 학습하도록 설계된 디코더를 도입해 Penobscot 3D 데이터셋에서 평균 교차합집합(mIoU) 99% 이상을 기록하였다.
상세 분석
이 연구는 지진 이미지라는 특수한 도메인에 맞춤형으로 설계된 두 가지 네트워크 변형, Danet‑FCN2와 Danet‑FCN3를 소개한다. 핵심 아이디어는 인코더에서 ResNet‑스타일 잔차 블록을 사용해 특징을 추출하고, 디코더에서는 전치 잔차 유닛(transposed residual unit)을 적용해 학습 기반의 업스케일링을 수행한다는 점이다. 기존 FCN‑8/FCN‑16과 U‑Net에서 사용되는 고정된 업샘플링(예: bilinear interpolation)과 달리, 전치 잔차 유닛은 파라미터화된 전치 컨볼루션을 통해 공간 해상도를 복원하면서 동시에 잔차 연결을 유지한다. 이는 정보 흐름을 원활히 하고, 경계선에서 발생하기 쉬운 불연속성을 크게 감소시킨다.
네트워크 설계에서 눈에 띄는 점은 skip connection을 명시적으로 삽입하지 않았다는 것이다. 대신 잔차 블록 자체가 내부 shortcut을 포함하고 있어, 인코더‑디코더 간의 정보 전달을 자연스럽게 구현한다. 이는 파라미터 수와 연산량을 최소화하면서도 U‑Net 수준의 성능을 유지하게 만든다.
데이터 전처리 단계에서는 원본 지진 이미지(값 범위 ‑30 000~33 000)를 0‑255 그레이스케일로 정규화하고, 80×120 및 128×128 크기의 타일로 분할하였다. 타일 기반 학습은 메모리 요구량을 크게 낮추고, 작은 라벨셋(최소 5개 슬라이스)만으로도 모델이 충분히 일반화될 수 있음을 실험적으로 증명한다. 특히, 클래스 2와 3을 병합해 최종 7개의 클래스로 축소함으로써 라벨 불균형 문제를 완화하였다.
실험에서는 제한된 학습 샘플 수(5, 9, 13, 100 슬라이스)와 다양한 타일 크기에 대해 모델을 평가하였다. Danet‑FCN2는 가장 작은 파라미터 규모에도 불구하고 99% 이상의 mIoU를 달성했으며, 학습 속도 역시 FCN‑8, U‑Net 대비 현저히 빠른 것으로 보고되었다. 반면, 파라미터가 더 많은 Danet‑FCN3는 데이터가 충분히 많을 때는 약간 높은 정확도를 보이지만, 데이터가 극히 제한된 상황에서는 과적합 위험이 커졌다.
결과적으로, 전치 잔차 유닛을 활용한 디코더 설계와 잔차 기반 인코더는 지진 이미지와 같이 텍스처 중심의 고해상도 데이터에 적합한 경량 모델을 구현한다는 중요한 교훈을 제공한다. 또한, 라벨링 비용이 높은 지구물리학 분야에서 최소한의 라벨만으로도 실용적인 자동 세분화가 가능함을 입증한다.
댓글 및 학술 토론
Loading comments...
의견 남기기