저라벨 환경에서 대조학습을 활용한 고광谱 이미지 예측 향상
초록
본 연구는 대조학습 기반 자기지도 학습을 이용해 고광谱 영상의 패치‑레벨 인코더를 사전학습하고, 이를 다중 라벨 및 단일 라벨 분류기에 전이함으로써 라벨이 제한된 상황에서도 기존 완전 지도 학습보다 높은 정확도를 달성한다. 50% 이하의 학습 데이터 감소에도 성능 저하가 거의 없으며, 공간적 특징을 암묵적으로 포착한다는 정성적 결과를 제시한다.
상세 분석
본 논문은 고광谱 원격탐사 이미지 분석에서 라벨 부족 문제를 해결하기 위해 두 단계로 구성된 프레임워크를 제안한다. 첫 번째 단계에서는 대조학습(Contrastive Learning) 기반의 인코더와 프로젝션 헤드를 무라벨 패치에 대해 학습한다. 여기서 사용된 데이터 증강은 스펙트럼 변형, 회전, 크롭 등 다양한 변형을 포함해 동일 패치의 서로 다른 뷰를 생성하고, NT‑Xent와 같은 온‑라인 대조 손실을 최소화한다. 이러한 사전학습은 인코더가 고차원 스펙트럼 구조와 지역적 텍스처를 동시에 인코딩하도록 유도한다. 두 번째 단계에서는 사전학습된 인코더를 고정하거나 미세조정하면서, 다중 라벨 분류기와 단일 라벨 분류기를 각각 학습한다. 다중 라벨 분류기는 패치 내에 존재할 수 있는 여러 지표(예: 토양, 식생, 건물 등)를 동시에 예측하도록 설계되었으며, 시그모이드 활성화와 바이너리 교차 엔트로피 손실을 사용한다. 단일 라벨 분류기는 소프트맥스와 다중 클래스 교차 엔트로피를 적용한다. 중요한 설계 포인트는 인코더와 분류기를 공동 학습할 수 있는 “스트림라인” 아키텍처를 채택함으로써, 사전학습된 특징이 최종 분류 목표에 맞게 재조정될 수 있다는 점이다. 실험은 4개의 공개 고광谱 데이터셋(예: Indian Pines, Pavia University 등)에서 수행되었으며, 라벨 비율을 10%100%까지 변동시켰을 때, 제안 방법은 완전 지도 학습 대비 평균 35%p의 정확도 향상을 보였다. 특히 50% 이하 데이터로 학습했을 때도 성능 격차가 미미했다. 정성적 분석에서는 t‑SNE 시각화를 통해 대조학습 인코더가 클래스 간 경계와 공간적 연속성을 잘 구분하는 임베딩을 형성함을 확인했다. 이는 기존 지도 학습 기반 인코더가 주로 스펙트럼 차이에만 민감한 반면, 대조학습이 공간적 컨텍스트까지 내재화한다는 점을 시사한다. 한계점으로는 대조학습 단계에서의 메모리 요구량이 높아 대규모 데이터셋에 적용 시 GPU 메모리 제약이 발생할 수 있으며, 증강 전략이 도메인에 따라 최적화되지 않을 경우 성능 저하 위험이 있다. 향후 연구에서는 효율적인 메모리 관리 기법과 도메인 특화 증강을 결합한 하이브리드 프레임워크를 탐색하고, 픽셀‑레벨 세분화와 같은 다운스트림 작업에의 확장 가능성을 검증할 필요가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기