노이즈와 도메인 일반화를 위한 자체 앙상블 사후 학습
초록
본 논문은 도메인 일반화(DG) 환경에서 라벨 노이즈가 존재할 때 발생하는 스퓨리어스 특징 확대 문제를 해결하기 위해, 사전 학습된 백본 모델의 중간 층 특징을 활용하는 자체 앙상블 사후 학습(Self‑Ensemble Post Learning, SEPL) 방법을 제안한다. SEPL은 다중 프로빙(classifier) 학습과 크라우드소싱 기반 예측 앙상블을 결합해, 각 층이 포착하는 서로 다른 시각 정보를 효과적으로 통합한다. 라벨 노이즈에 강인하도록 반지도 학습(semi‑supervised) 기법을 적용하고, 실험을 통해 기존 DG 방법 대비 향상된 견고성을 입증한다.
상세 분석
본 연구는 두 가지 핵심 현상을 관찰한다. 첫째, 도메인 이동과 라벨 노이즈가 동시에 존재할 경우, 깊은 층에서 스퓨리어스(거짓) 특징이 확대되어 모델이 비판적 영역이 아닌 배경에 과도하게 집중한다는 ‘스퓨리어스 특징 확대’ 현상이다. 둘째, 동일한 백본(예: ResNet‑50) 내부의 서로 다른 레이어는 이미지의 서로 다른 부분에 주목하는 독립적인 표현을 학습한다는 점이다. 이러한 관찰을 바탕으로 저자는 중간 특징을 그대로 활용하는 ‘프로빙(classifier) 학습’을 도입한다. 구체적으로, 각 레이어의 출력에 선형 프로빙 헤드를 부착하고, 라벨 노이즈가 포함된 데이터에 대해 반지도 학습(예: 고신뢰 샘플은 라벨 그대로, 저신뢰 샘플은 무라벨로 처리)으로 각각을 학습한다. 이렇게 얻어진 다수의 프로빙 모델은 서로 다른 시각 정보를 보유하므로, 최종 예측 단계에서는 Dawid‑Skene 방식의 크라우드소싱 앙상블을 적용해 각 모델의 의견을 통계적으로 결합한다. 이 과정에서 각 모델의 오류 패턴이 상쇄되고, 노이즈에 대한 강인성이 크게 향상된다. 실험에서는 PACS, Office‑Home 등 표준 DG 벤치마크에 25% 라벨 노이즈를 인위적으로 주입한 뒤, 기존 DG 방법(예: CORAL, Model‑Ratatouille)과 비교했을 때 평균 3~5%p의 정확도 상승을 기록한다. 또한, 의료 영상 데이터에 적용했을 때 라벨 불확실성이 높은 상황에서도 진단 정확도가 유지되는 등 실용적 가치를 입증한다. 전체 파이프라인은 백본 재학습 없이 사후에 적용 가능하므로, 기존 모델에 대한 비용 효율적인 업그레이드가 가능하다는 점도 큰 장점이다.
댓글 및 학술 토론
Loading comments...
의견 남기기