합성 실 데이터와 실제 데이터 정렬을 통한 반지도학습 의료 영상 분할
초록
본 논문은 제한된 라벨링 데이터와 대량의 합성 이미지가 존재할 때, 합성‑실제 도메인 간의 특징 격차를 DINOv2 기반 유사도 정렬 손실(SA loss)로 메우고, 소프트 엣지 블렌딩과 EMA 교사 모델을 활용해 효과적인 반지도학습 프레임워크인 SRA‑Seg을 제안한다. 10% 라벨된 실 데이터와 90% 합성 데이터만 사용해 ACDC와 FIVES 데이터셋에서 각각 89.34%와 84.42%의 Dice 점수를 달성하였다.
상세 분석
SRA‑Seg은 기존 반지도학습(SSL) 방법이 합성 데이터와 실 데이터를 동일하게 취급하면서 발생하는 도메인 격차를 근본적으로 해결한다는 점에서 혁신적이다. 핵심은 두 가지 전략이다. 첫째, frozen DINOv2 ViT‑B/16을 이용해 실 이미지와 합성 이미지의 고차원 임베딩을 추출하고, 각 합성 샘플을 가장 가까운 실 샘플에 매핑해 Euclidean 거리 최소화를 목표로 하는 유사도‑정렬(SA) 손실을 도입한다. 이는 특징 공간에서 직접적인 정렬을 수행함으로써, 합성 이미지가 실 이미지와 동일한 의미적 분포를 갖도록 유도한다. 둘째, 기존 Copy‑Paste 기반 BCP와 달리 소프트 엣지 블렌딩을 적용한다. 블렌딩 마스크를 3×3 평균 풀링으로 부드럽게 처리해 경계가 급격히 변하지 않게 함으로써, 모델이 해부학적 경계를 과도하게 학습하는 위험을 감소시킨다. 또한 EMA 교사 모델을 사용해 합성 이미지에 대한 의사 라벨을 생성하고, 이 라벨을 연속적인 확률 맵 형태로 유지함으로써 불확실성을 보존한다. 손실 함수는 Soft‑Dice와 Soft‑Cross‑Entropy를 결합한 Soft‑Segmentation 손실과 SA 손실을 가중치 λ로 결합한 총합으로 구성된다. 학습 과정에서 SA 손실은 frozen feature extractor에만 역전파되지 않으므로, 메인 세그멘테이션 네트워크는 기존 SGD 기반 최적화만으로도 두 목표를 동시에 달성한다. 실험 결과는 5%·10% 라벨 비율에서 기존 SSL(Mean‑Teacher, UA‑MT 등) 및 도메인 적응 기법들을 크게 앞서는 성능을 보여, 합성 데이터가 실 데이터와 동등하거나 그 이상으로 활용될 수 있음을 입증한다. 또한 코드 공개와 함께 재현 가능성을 확보함으로써, 의료 영상 분야에서 합성 데이터 활용에 대한 새로운 패러다임을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기