고해상도 LiDAR DEM 파생 이미지로 건조석벽 자동 탐지를 위한 자체지도 교차‑뷰 사전학습
초록
본 연구는 고해상도 LiDAR에서 생성된 디지털고도모델(DEM) 파생 이미지인 다방향 힐쉐이드와 VAT를 활용해, 지식증류 기반 자체지도 학습 프레임워크 DINO‑CV를 설계하였다. 교차‑뷰 불변 특징을 학습함으로써 식생에 가려진 저고도 석벽을 효과적으로 검출하고, 라벨이 10 %만 사용돼도 mIoU 63.8 %를 유지한다. Budj Bim 문화경관에서 68.6 % mIoU를 달성해 데이터가 부족한 고고학·환경 모니터링 분야에 새로운 스케일러블 솔루션을 제시한다.
상세 분석
DINO‑CV는 기존 DINO(knowledge‑distillation 기반 자체지도) 구조를 교차‑뷰 학습에 맞게 변형하였다. 입력으로는 동일 지역을 서로 다른 조명각으로 힐쉐이딩한 다방향 힐쉐이드(MHS)와 지형·음영·개방도 등을 복합한 VAT 두 종류의 파생 이미지를 사용한다. Teacher‑Student 네트워크는 동일 지역의 서로 다른 뷰를 정렬하도록 설계돼, 모델이 “지형의 기하학적 형태”와 “구조적 연속성”을 라벨 없이도 추출하도록 유도한다. 이 과정에서 Momentum Encoder와 EMA(Exponential Moving Average) 기법을 적용해 안정적인 교사 모델을 유지하고, 토큰‑레벨의 CLS 토큰을 통해 전역 특징을, Patch‑level 토큰을 통해 지역 세부 정보를 동시에 학습한다.
전처리 단계에서는 고해상도(≤0.5 m) LiDAR 포인트클라우드에서 Bare‑Earth DEM을 생성하고, 이를 8‑방향 햇빛 각도로 힐쉐이딩한 MHS와, Hillshade, Slope, Positive Openness, Sky‑View Factor 등을 채널별로 결합한 VAT 이미지로 변환한다. 두 뷰는 서로 보완적인 정보를 제공한다. 예를 들어, 조밀한 식생 아래에 숨은 석벽은 VAT의 스키드·오프니스 채널에서 미세한 고도 변화를 강조하고, MHS는 그림자‑하이라이트 대비를 통해 경계선을 부각한다.
학습 후에는 ResNet‑50, Wide‑ResNet‑101, ViT‑Base 등 다양한 백본에 동일한 사전학습 가중치를 전이한다. 라벨이 제한된 상황(전체 라벨의 10 %만 사용)에서도 Fine‑tuning을 수행하면, 기존 완전 지도 방식 대비 평균 5 % 이상 높은 mIoU를 기록한다. 이는 교차‑뷰 자체지도 학습이 “데이터 효율성”을 크게 향상시킨다는 증거다.
실험 결과는 Budj Bim 문화경관(UNESCO 세계유산) 3개 구역에 대해 수행했으며, 테스트 구역에서 평균 mIoU 68.6 %를 달성했다. 특히, 식생이 조밀한 숲지대에서는 기존 힐쉐이드 단일 뷰 기반 모델이 45 % 수준에 머물렀던 반면, DINO‑CV는 62 % 이상의 정확도를 유지했다. 이는 교차‑뷰 학습이 식생‑지형 혼합 잡음에 대한 강인성을 부여한다는 것을 의미한다.
한계점으로는 (1) 고해상도 LiDAR 데이터 자체가 비용이 높아 적용 범위가 제한될 수 있고, (2) 현재는 2‑뷰(MHS, VAT)만 사용했으나, 추가적인 파생 이미지(예: curvature, roughness)와 멀티‑스케일 뷰를 도입하면 성능이 더욱 개선될 가능성이 있다. 또한, 현재는 2‑D 이미지 기반 백본에 국한했으나, 3‑D 포인트 기반 Transformer와 결합하면 지형 구조를 더 정밀히 포착할 수 있을 것으로 기대된다.
전반적으로 DINO‑CV는 고해상도 DEM 파생 이미지의 기하학적·지형학적 정보를 자체지도 방식으로 효율적으로 활용함으로써, 라벨이 부족하고 식생에 가려진 고고학적 구조물 탐지에 새로운 패러다임을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기