농촌 도로 추출을 위한 공간·주파수 이중 인코더 네트워크 DSFC‑Net
초록
DSFC‑Net은 CNN과 변형기(Transformer)를 결합한 이중 인코더 구조로, 고해상도 위성영상에서 농촌 도로를 정확히 분리한다. CNN 브랜치는 국부적인 경계와 좁은 도로의 세밀한 디테일을 포착하고, 새롭게 설계된 Spatial‑Frequency Hybrid Transformer(SFT)는 라플라시안 피라미드 기반의 Cross‑Frequency Interaction Attention(CFIA) 모듈을 통해 고·저주파 정보를 분리·상호작용시켜 전역 토폴로지를 학습한다. 두 브랜치의 출력을 Channel Feature Fusion Module(CFFM)이 채널 차원에서 가중치를 재조정해 통합한다. WHU‑RuR+, DeepGlobe, Massachusetts 데이터셋에서 기존 최첨단 방법들을 앞서며, 특히 WHU‑RuR+에서 F1 = 69.93 %, IoU = 53.77 %를 달성하였다.
상세 분석
본 논문은 농촌 지역의 도로 추출이라는 특수한 문제에 초점을 맞추어, 기존 도시 중심의 방법들이 겪는 세 가지 핵심 난관—클래스 내 변동성, 식생에 의한 차단, 그리고 도로 폭의 얇음—을 명확히 정의하고 있다. 이러한 난관을 극복하기 위해 제안된 DSFC‑Net은 두 개의 인코더를 병렬로 운영한다는 점에서 차별화된다.
첫 번째 인코더는 ConvNeXt‑v2 기반의 CNN 구조를 채택해, 작은 수용 영역에서도 고해상도 텍스처와 경계 정보를 효과적으로 추출한다. 이는 토양, 작물, 비포장 도로 등 다양한 배경과의 스펙트럼 혼합을 구분하는 데 유리하다.
두 번째 인코더인 Spatial‑Frequency Hybrid Transformer(SFT)는 기존 Vision Transformer가 저주파에 편향되는 문제를 보완한다. SFT는 입력 피처를 Layer Normalization 후 두 갈래로 분기시키는데, 하나는 Spatial Context Aggregator(SCA)로서 다중 스케일 컨볼루션과 윈도우‑셀프 어텐션을 결합해 장거리 의존성을 포착한다. 다른 하나는 Cross‑Frequency Interaction Attention(CFIA)로, 라플라시안 피라미드(Laplacian Pyramid)를 이용해 고주파(경계·세부)와 저주파(전역 구조)를 명시적으로 분해한다. 이후 두 주파수 스트림을 교차 어텐션으로 결합함으로써, 식생에 가려진 구간에서도 도로의 연속성을 유지하도록 설계되었다.
SFT의 출력은 point‑wise convolution을 거쳐 residual 연결로 원본 피처와 합쳐진다. 이렇게 얻어진 변형기 피처와 CNN 피처는 Channel Feature Fusion Module(CFFM)에서 채널별 중요도를 동적으로 재조정한다. CFFM은 SE‑Block과 유사한 squeeze‑excitation 메커니즘을 확장해, 두 브랜치의 정보가 상호 보완적으로 작용하도록 만든다.
전체 네트워크는 4단계 인코더‑디코더 구조를 갖추며, 각 단계마다 다운샘플링(2×2 stride‑2 convolution)과 업샘플링(전치 컨볼루션)으로 해상도를 복구한다. 최종 세그멘테이션 헤드는 1×1 convolution과 sigmoid를 통해 픽셀‑단위 도로 마스크를 출력한다.
실험에서는 WHU‑RuR+(다국가·다환경 농촌 데이터), DeepGlobe(대규모 위성 이미지), Massachusetts(고해상도 항공 사진) 세 데이터셋을 사용해 기존 ResU‑Net, D‑LinkNet, Swin‑Unet, BT‑RoadNet 등과 비교하였다. 모든 지표(F1, IoU, Precision, Recall)에서 유의미하게 우수했으며, 특히 WHU‑RuR+에서 69.93%의 F1 점수와 53.77%의 IoU를 기록해 좁고 파편화된 도로를 복원하는 능력을 입증했다.
추가적으로, 저자들은 모델의 파라미터 수와 연산량이 기존 Transformer 기반 방법과 비슷하거나 약간 낮은 수준임을 강조한다. 이는 라플라시안 피라미드와 CFIA가 효율적인 주파수 분해·재조합을 가능하게 하기 때문이다. 코드와 학습된 가중치를 공개함으로써 재현 가능성을 높였으며, 향후 농촌 인프라 모니터링 및 정책 수립에 바로 적용할 수 있는 실용성을 보여준다.
댓글 및 학술 토론
Loading comments...
의견 남기기