소량 약한 라벨 뇌 구조 자동 분할 이질성 불확실성 네트워크 활용

본 논문은 의료 영상 분야에서 흔히 가정되는 “대량의 고품질 라벨 데이터 필요”라는 전제를 비판하고, 실제로는 소량의 약한 라벨만으로도 뇌 구조 분할이 충분히 가능함을 실증한다. 연구자는 미국의 대규모 청소년 뇌 발달 연구인 ABCD 코호트에서 9‑10세 연령대의 T1‑weighted MRI 약 4000건을 확보하였다. 이 중 9명의 피험자(벤더당 3명)를 훈련 데이터로 선정하고, 각 피험자에 대해 Freesurfer 6.0이 자동 생성한 라벨을 ‘약한 라벨’로 사용하였다. 라벨링은 뇌의 28개 구조(양측 피질 백질·회백질, 측뇌실, 피질, 시상, 꼬리핵·피질·편도체·해마·누액체 등)를 포함한다. 라벨이 없는 영역은 스킵하고, 기본적인 전처리(스컬 스트립, 정규화)와 함께 좌우 반사, 임의 회전, 강도 스케일링 등 단순 데이터 증강을 적용하였다. 모델 아키텍처는 3D 입력을 2D 평면으로 변환한 뒤, Dense Dilated 블록을 활용한 인코더‑디코더 구조를 채택한다. 각 구조는 독립적인 이진 분류 태스크로 다루어 멀티‑태스크 학습을 수행한다. 클래스 불균형 문제는 focal loss(γ=2)를 기본 손실로 채택해 완화하였다. 핵심 기여는 두 가지 이질성(heteroscedastic) 불확실성 모델링이다. 첫 번째는 기존 Kendall‑Gal 방식으로, 네트워크가 각 voxel에 대해 로그잇의 평균과 분산을 출력한다. 분산은 Monte‑Carlo 샘플링을 통해 손실에 반영되며, 불확실성이 큰 샘플에 대해 손실을 감소시켜 라벨 노이즈에 대한 견고성을 높인다. 두 번째는 논문이 새롭게 제안한 라벨‑플립(label‑flip) 방식이다. 여기서는 각 voxel에 대해 클래스 확률 p와 라벨이 뒤바뀔 확률 q(0~0.5)를 동시에 예측한다. 손실 함수는 L(p, (1−x)·q + x·(1−q)) + L(q, z) 형태로, q가 높을수록 기존 라벨에 대한 신뢰도가 낮아져 라벨 스무딩이 자동으로 적용된다. 이 방식은 closed‑form이며 미분 가능해 학습 효율이 높다. 또한, 스포라딕 오류를 차단하는 추가적인 메커니즘을 도입하였다. 일정 에포크마다 현재 모델이 훈련 세트와 3축(view)에서 일치하지 않으면서 q가 매우 낮은(voxel‑level) 픽셀을 마스크하고, 이후 학습 단계에서 해당 픽셀에 대한 그래디언트를 차단한다. 이는 모델이 확신을 가지고 잘못된 라벨을 학습하는 것을 방지한다. 실험 결과는 세 모델 간 성능 차이를 명확히 보여준다. 기본 모델은 전체 평균 Dice 0.84±0.12를 기록했으며, 학습이 진행될수록 과적합 현상이 관찰되었다. 예측 분산 모델은 평균 Dice 0.85±0.14로 소폭 향상되었고, 25/28 구조에서 통계적으로 유의미한 개선을 보였다. 라벨‑플립 모델은 평균 Dice 0.87±0.11을 달성했으며, 27/28 구조에서 유의미한 향상을 보였다(단 1구조 제외). 특히 작은 구조인 Accumbens와 3rd Ventricle 같은 어려운 영역에서 라벨‑플립 모델이 가장 큰 이득을 제공하였다. 학습 곡선에서도 라벨‑플립 모델은 초기 급격한 성능 상승 후에도 안정적으로 유지되었으며, 기본 모델이 성능 저하를 겪는 시점에서도 지속적인 향상을 보였다. 시각화 결과(그림 4)에서는 라벨‑플립 확률 맵이 높은 영역이 실제 라벨 오류와 일치함을 확인할 수 있었다. 이는 라벨‑플립 맵이 이미지·분할 품질 검증 도구로 활용될 가능성을 시사한다. 결론적으로, 이 연구는 (1) 소량의 약한 라벨만으로도 뇌 구조 자동 분할이 가능함을 입증하고, (2) 이질성 불확실성 모델링, 특히 라벨‑플립 기반 학습이 라벨 노이즈에 강인한 성능을 제공함을 보여준다. 향후 연구에서는 대규모 약한 라벨 데이터에 대한 확장성 검증, 라벨‑플립 맵을 이용한 자동 품질 평가, 그리고 단일 사례(one‑shot) 학습 가능성 탐색이 제안된다.

소량 약한 라벨 뇌 구조 자동 분할 이질성 불확실성 네트워크 활용

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기