다중클래스 위성영상 분류를 위한 베이지안 트리 앙상블 새로운 접근
초록
본 논문은 Bayesian Additive Regression Trees(BART)를 기반으로 한 다중 클래스 분류기(mBACT)를 제안한다. LANDSAT 5 TM 영상을 이용해 7개의 토지 이용 클래스를 구분하고, 기존의 SVM·CART와 비교해 정확도와 불확실성 측면에서 우수함을 입증한다.
상세 분석
본 연구는 기존의 이진 BART‑prob 모델을 one‑against‑all 전략으로 확장하여 다중 클래스 문제에 적용한 mBACT를 설계하였다. BART는 회귀 트리의 합으로 구성된 비선형 모델이며, 각 트리는 사전 확률을 통해 깊이와 분할 수를 제한하고, MCMC 샘플링으로 사후 분포를 추정한다. 논문에서는 트리 수(𝑛_tree) = 200, 최소 분할점(num cut) = 100, 노드 분산(σ) 등 핵심 하이퍼파라미터를 기본값에 가깝게 설정하고, “keep‑every”와 “nskip”을 이용해 충분한 burn‑in을 확보하였다. 다중 클래스 확장은 각 클래스마다 독립적인 BART‑prob 모델을 학습한 뒤, 테스트 샘플에 대해 가장 높은 클래스 확률을 선택하는 방식으로 구현되었다.
데이터는 LANDSAT 5 TM의 6개 반사밴드(30 m)와 7개의 토지 이용 라벨(건축, 물, 베이, 농경, 초지, 수목, 잡목)으로 구성된 3개 소규모 연구구역(윌프빌, 윈즈도, 켄트빌)에서 추출되었다. 비교 모델로는 R 패키지 ‘e1071’ 기반 다항식 커널 SVM(다항 차수 = 2)과 ‘rpart’ 기반 CART를 사용했으며, 모두 one‑against‑all 방식으로 다중 클래스를 처리하였다.
성능 평가는 전체 정확도, Kappa, 사용자·생산자 정확도, 그리고 클래스별 확률 분포의 신뢰구간을 포함한다. 결과는 mBACT가 평균 정확도 92 % 이상, Kappa 0.88을 기록해 SVM(≈88 %)·CART(≈84 %)보다 우수함을 보여준다. 특히 토지 이용이 복합적인 경계 지역에서 BART 기반 트리 앙상블이 과적합을 방지하고 불확실성을 정량화하는 데 강점을 보였다. 또한, MCMC 샘플링을 통한 사후 불확실성 추정이 기존 결정론적 분류기와 차별화된 신뢰성을 제공한다는 점을 강조한다.
한계점으로는 학습 시간의 증가와 작은 연구구역에 국한된 실험 설계가 있다. 향후 연구에서는 대규모 이미지와 고해상도 밴드(예: Sentinel‑2)를 포함한 확장, 그리고 하이퍼파라미터 자동 튜닝을 통한 효율성 개선이 필요하다. 전반적으로 mBACT는 베이지안 트리 모델을 원격탐사 분야에 성공적으로 도입한 사례로, 불확실성 정량화와 높은 분류 정확도를 동시에 달성한다는 점에서 의미가 크다.
댓글 및 학술 토론
Loading comments...
의견 남기기