프랑스 정사사진과 지형 데이터를 활용한 대규모 건물 변화 탐지 벤치마크
초록
본 논문은 프랑스 국가 지도기관(IGN)에서 제공하는 0.2 m 해상도 정사사진과 건물 벡터 데이터를 결합해, 28개 부서를 아우르는 전국 규모의 건물 변화 탐지 데이터셋 FOTBCD‑Binary(≈28 000쌍)와 인스턴스 레벨 주석을 포함한 FOTBCD‑Instances를 공개한다. 25개 부서는 학습용, 3개 부서는 지리적으로 완전히 격리된 검증·시험용으로 분리했으며, 자동 생성 후 인간 검증 과정을 거쳐 라벨 품질을 확보했다. 또한 HybridSiam‑CD 기반 베이스라인을 이용해 기존 LEVIR‑CD+·WHU‑CD와 교차 평가한 결과, 지리적 다양성이 높은 데이터셋이 다른 지역으로의 일반화에 유리함을 실증하였다.
상세 분석
FOTBCD는 두 가지 핵심 자원을 활용한다. 첫째, BD ORTHO는 프랑스 전역을 0.2 m/pixel 해상도로 커버하는 방사선 보정·정사 보정된 RGB 정사사진이며, 정기적인 항공 촬영 주기로 인해 시계열 이미지가 자연스럽게 확보된다. 둘째, BD TOPO는 건물 풋프린트와 건축 연도, 용도 등 메타데이터를 포함한 국가 수준 벡터 데이터베이스다. 논문은 두 데이터베이스의 시간 차이를 정밀히 정렬하고, 건물 레벨 변화(신축·철거·유지)를 규칙 기반 필터링·휴리스틱·학습 기반 컴포넌트로 추론해 픽셀‑단위 이진 마스크와 인스턴스 폴리곤을 생성한다. 자동 생성 과정에서 발생할 수 있는 라벨 노이즈를 최소화하기 위해 ① 시계열 정합성 검증, ② 토폴로지·시맨틱 검증, ③ AI 기반 이상 탐지, ④ 인간 검증의 4단계 품질 관리 파이프라인을 적용했으며, 이는 검증·시험 셋에만 전수 검증을 수행함으로써 평가 신뢰성을 확보한다.
데이터 스플릿은 부서(프랑스 행정 구역) 단위로 이루어져, 학습 부서와 검증·시험 부서 간에 지리적 겹침이 전혀 없도록 설계되었다. 이는 기존 LEVIR‑CD+가 텍사스 내 20개 지역, WHU‑CD가 뉴질랜드 한 도시만을 포괄하는 지리적 편향을 극복하고, 모델이 지역 특유의 건축 양식·밀도·식생·기후·촬영 조건에 과도히 적합되는 현상을 방지한다.
베이스라인 모델인 HybridSiam‑CD는 사전 학습된 DINOv3‑sat493M ViT와 ResNet‑34를 각각 의미론적·공간적 특징 추출기에 사용하고, 차이 특징을 결합해 변화 맵을 생성한다. ViT는 고정(frozen) 상태로 유지해 파라미터 수를 제한하고, 학습 안정성을 높였다. 동일한 학습 하이퍼파라미터(50 k 스텝, 배치 128, AdamW, Cosine LR 등)를 모든 데이터셋에 적용함으로써 교차 평가의 공정성을 확보했다.
교차 도메인 실험 결과, LEVIR‑CD+와 WHU‑CD에서 학습한 모델이 FOTBCD‑Binary에 적용될 때 IoU가 각각 0.30, 0.34로 크게 감소했으며, 반대로 FOTBCD‑Binary에서 학습한 모델은 WHU‑CD에 0.70, LEVIR‑CD+에 0.30 수준의 성능을 유지했다. 이는 “지리적 다양성 → 일반화 향상”이라는 가설을 실증적으로 뒷받침한다. 또한, 동일 데이터셋 내에서도 부서 간 도메인 차이가 존재함을 보여, 단일 국가 내에서도 지역적 변동성을 고려한 데이터 설계가 필요함을 시사한다.
한계점으로는 (1) 프랑스 본토에 국한된 범위, (2) 건물 변화에만 초점을 맞춘 라벨링(도로·녹지·수변 등 다른 변화 요소는 제외), (3) 자동 생성 라벨의 미세 노이즈가 존재할 가능성 등을 제시한다. 향후 다국가·다대륙 데이터와 멀티클래스·인스턴스 레벨 변화를 포함한 확장 작업이 기대된다.
댓글 및 학술 토론
Loading comments...
의견 남기기