데이터 도핑으로 적용기 간극 해소: 이중 도메인 학습을 통한 CT 유도 근접치료 방광 분할
초록
본 연구는 방광을 정확히 분할하기 위해 적용기(와이어) 삽입 여부에 따라 달라지는 CT 영상의 분포 차이를 극복하고자, 적용기 없는(NA) 영상과 적용기 삽입된(WA) 영상을 혼합한 ‘데이터 도핑’ 전략을 제안한다. NA 데이터만으로는 WA 영상의 변형 및 아티팩트를 학습하기 어려우나, 전체 학습 데이터 중 10~30% 정도만 WA 데이터를 포함시키면 모델 성능이 크게 향상되어, 전적으로 WA 데이터만 사용한 경우와 동등한 Dice 0.94, IoU 0.92를 달성한다. 다양한 U‑Net 기반 아키텍처와 3축(축방향) 실험을 통해 이 결과가 일반화 가능함을 확인하였다.
상세 분석
이 논문은 의료 영상 분할에서 흔히 발생하는 공변량 이동(covariate shift) 문제를 ‘데이터 도핑(data‑doping)’이라는 개념으로 접근한다. 적용기 없이 촬영된 CT(NA)와 적용기 삽입 후 촬영된 CT(WA)는 해부학적 변형과 금속 아티팩트라는 두 가지 주요 차이를 보이며, 이는 동일한 블래더 라벨을 가지고 있더라도 이미지 도메인이 크게 달라진다. 저자는 NA 데이터가 풍부하지만 WA 데이터는 매우 제한적인 현실을 반영해, NA와 WA 데이터를 비율을 조절해 혼합함으로써 모델이 두 도메인 모두에 대한 일반화 능력을 갖추게 한다.
핵심 실험은 U‑Net을 기본 모델로 삼아, NA 데이터만 사용했을 때와 WA 데이터를 10 %, 20 %, 30 % 비율로 섞었을 때의 성능 차이를 정량화한 것이다. 결과는 NA만 사용할 경우 Dice가 0.71 수준에 머물렀으나, WA 데이터를 10 %만 추가해도 Dice가 0.88으로 급상승하고, 30 %까지 올리면 0.94에 도달한다. 이는 소량의 목표 도메인 샘플이 모델의 특징 추출 단계에서 중요한 ‘도메인 힌트’를 제공한다는 점을 시사한다.
또한 저자는 U‑Net++, Half‑UNet, DC‑Net, Attention U‑Net, RRDB‑U‑Net 등 다섯 가지 최신 세그멘테이션 아키텍처에 동일한 데이터 도핑 비율을 적용해 일관된 성능 향상을 확인하였다. 모든 모델이 10~30 % WA 데이터 혼합 시 WA 전용 학습과 거의 동일한 Dice와 IoU를 기록했으며, 특히 Attention U‑Net과 RRDB‑U‑Net은 복잡한 아티팩트 영역에서 더 높은 정밀도를 보였다.
평가 지표는 Dice Similarity Coefficient와 Intersection over Union를 사용했으며, 축별(axial, coronal, sagittal) 실험을 통해 3차원 전체 볼륨에서도 일관된 결과를 얻었다. 데이터 도핑이 적용된 모델은 WA 테스트 세트에서 평균 Dice 0.94, IoU 0.92를 달성했으며, 이는 임상에서 방광 용량 및 위치를 정확히 파악해 방사선량 최적화에 직접적인 이점을 제공한다.
이 연구는 (1) NA 데이터만으로는 WA 도메인에 대한 일반화가 불가능함, (2) 최소 10 % 수준의 WA 데이터가 도메인 적응에 충분함, (3) 다양한 네트워크 구조에 적용 가능함을 입증한다. 따라서 데이터가 부족한 의료 분야에서 ‘도메인 간 도핑’ 전략은 비용 효율적인 데이터 증강 방법으로 활용될 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기