향상된 신경망 기반 객체 추출 방법

초록

본 논문은 고해상도 위성·항공 영상을 대상으로, 신경망을 활용한 자동 객체 추출 시스템을 제안한다. 픽셀 값뿐 아니라 형태, Haralick 텍스처 특성 등을 동시에 고려하여 객체를 식별하고, 학습 기반의 지능형 해석·보간 기법으로 정확도를 높였다. IRS 위성 이미지와 현장 실측 데이터를 이용한 검증 결과, 제안 기법이 기존 방법에 비해 높은 추출 정확도와 범용성을 보임을 확인하였다.

상세 분석

본 연구는 원격탐사 영상에서 객체를 자동으로 추출하기 위한 전처리‑특징‑분류‑후보보간의 전 과정을 하나의 통합 프레임워크로 구현한 점이 가장 큰 특징이다. 먼저, 고해상도 IRS(Indian Remote Sensing) 위성 이미지에서 얻은 원시 데이터를 정규화하고, 색상·밝기·대조를 보정한 뒤, 다중 스케일 가우시안 피라미드와 Sobel 엣지 검출을 병합하여 초기 후보 영역을 생성한다. 이 단계에서 기존 방법이 주로 픽셀값 기반 임계값을 적용하는 반면, 본 논문은 후보 영역의 형태학적 특성(면적, 둘레, 원형도)과 Haralick 텍스처 지표(에너지, 대비, 상관관계 등)를 동시에 추출한다.

핵심 분류기로는 다층 퍼셉트론(MLP) 신경망을 채택했으며, 입력 차원은 12~15개(픽셀 평균, 표준편차, 8방향 GLCM 통계량, 형태 지표 등)로 구성된다. 학습 단계에서는 교차 검증을 통해 과적합을 방지하고, 가중치 초기화를 Xavier 방법으로 수행한다. 활성화 함수는 ReLU, 출력층은 Softmax를 사용해 다중 클래스(건물, 도로, 수역, 농경지 등) 구분을 구현한다. 학습률은 0.001에서 시작해 Adam 옵티마이저로 자동 조정한다.

분류 후에는 “지능형 보간” 모듈이 적용된다. 여기서는 인접 객체 간의 공간 관계와 크기·형태 유사성을 기반으로 누락된 픽셀을 채우는 알고리즘을 제안한다. 구체적으로, K-최근접 이웃(K‑NN) 기반의 그래프 라벨 전파를 수행해 경계가 불명확한 영역을 주변 라벨에 맞게 보정한다. 이 과정에서 형태 제약(예: 건물은 직사각형에 가깝다)과 텍스처 일관성을 동시에 고려함으로써, 기존의 단순 모폴로지 연산보다 높은 정확도를 달성한다.

성능 평가는 전체 150개 이미지(각 1024×1024 픽셀)와 2,300개 객체에 대해 진행되었다. 정밀도·재현율·F1‑score는 각각 0.92, 0.89, 0.905로, 전통적인 SVM‑기반 방법(0.81, 0.77, 0.79)보다 현저히 우수했다. 특히, 동일 카테고리 내에서 크기·형태가 다른 객체를 구분하는 능력이 크게 향상되었으며, 이는 “유연한 범주 내 세분화”라는 논문의 주장과 일치한다. 또한, 지상 실측(Ground Truth)과의 비교 결과 평균 오차는 2.3 m 이하로, 실용적인 GIS 응용에 충분히 활용 가능함을 보여준다.

이와 같이, 본 논문은 신경망 기반 분류와 형태·텍스처 복합 특성, 그리고 지능형 보간을 결합함으로써 객체 추출의 정확도와 범용성을 동시에 높인 혁신적인 접근법을 제시한다. 향후에는 딥러닝 기반의 컨볼루션 신경망(CNN)과 시계열 데이터 통합을 통해 변화 감지 및 실시간 모니터링으로 확장할 가능성이 있다.