프로스테이트 T2‑MRI 자동 분할을 위한 2단계 딥러닝 프레임워크와 데이터 증강 기법

본 논문은 T2‑가중 MRI에서 전립선을 자동으로 분할하기 위해 전역 CNN으로 전립선의 대략적인 위치와 크기를 추정하고, 이를 기반으로 지역 CNN이 고해상도 경계를 정밀하게 delineate하도록 설계하였다. 또한 전립선 형태 모델을 이용한 변형 데이터 증강을 적용해 50장의 제한된 학습 데이터에서 높은 일반화 성능을 달성했으며, PROMISE12 테스트셋에서 평균 Dice 90.6 ± 2.2를 기록하였다.

저자: Davood Karimi, Golnoosh Samei, Yanan Shao

프로스테이트 T2‑MRI 자동 분할을 위한 2단계 딥러닝 프레임워크와 데이터 증강 기법
본 연구는 전립선 T2‑가중 MRI에서 자동으로 정확한 분할을 수행하기 위한 새로운 딥러닝 기반 파이프라인을 제안한다. 전립선은 환자마다 형태·크기·조직 대비가 크게 다르고, 라벨링된 학습 데이터는 제한적이기 때문에 기존의 단일 CNN 접근법은 과적합이나 일반화 실패를 겪기 쉽다. 이를 해결하고자 저자들은 두 개의 별도 CNN을 설계하였다. 첫 번째 단계인 전역(Global) CNN은 전체 3D 이미지(128 × 128 × 72 voxel)를 입력받아 전립선에 대한 소프트 마스크를 출력한다. 이 마스크는 전립선의 무게중심과 대략적인 경계를 제공하며, 이후 전립선 형태 모델을 입자 군집 최적화(Particle Swarm Optimization)로 피팅해 외부 잡음이나 이상치를 제거한다. 이렇게 추정된 중심과 크기를 바탕으로 전립선을 포함하는 볼륨 오브 인터레스트(VOI)를 정의하고, 이를 80 × 80 × 48 voxel 크기로 재샘플링한다. 두 번째 단계인 지역(Local) CNN은 재샘플링된 VOI를 입력으로 받아 고해상도 경계 정보를 학습한다. 전역 단계에서 이미 전립선이 이미지 중앙에 고정되고 크기가 표준화되었기 때문에, 지역 CNN은 얕은 네트워크(d = 3)로도 충분히 정밀한 경계 분할을 수행한다. 두 네트워크 모두 인코더‑디코더 구조에 잔차 모듈과 짧은·긴 스킵 연결을 결합한 U‑Net 스타일을 사용한다. 전역 CNN은 깊이 d = 5로 설계해 넓은 수용 영역을 확보하고, 지역 CNN은 얕은 구조로 파라미터 수를 최소화한다. 데이터 전처리 과정에서는 N4ITK를 이용한 바이어스 보정, 1 mm³ 등방성 리샘플링, 중앙 크롭 또는 제로 패딩을 통한 고정 크기(128 × 128 × 72) 확보, 그리고 평균 0·표준편차 1로 정규화한다. 데이터 증강은 전립선 형태 모델을 기반으로 변위장을 생성해 학습 이미지와 라벨을 변형함으로써 실제 임상에서 나타날 수 있는 다양한 형태 변이를 시뮬레이션한다. 무작위 잡음과 변위도 추가해 네트워크가 지역 최소에 빠지는 것을 방지한다. 학습은 PROMISE12 챌린지 데이터셋(50 train / 30 test)을 사용했으며, 5‑fold 교차 검증을 통해 최적 네트워크 크기·학습률·드롭아웃 비율을 탐색하였다. 교차 검증 결과를 바탕으로 최종 모델을 전체 50장의 학습 데이터에 대해 재학습하고, 테스트 이미지 30장에 적용했다. 결과는 평균 Dice 90.6 ± 2.2로, 기존 모든 방법을 능가한다. 정량적 성능 외에도 생성된 마스크는 매끄럽고 인공적인 아티팩트가 거의 없으며, 후처리는 0.5 임계값 적용 후 반경 2 mm 구형 구조 요소를 이용한 오프닝 연산만으로 충분했다. 이 논문의 주요 기여는 다음과 같다. (1) 전역‑지역 이중 CNN 구조를 도입해 제한된 라벨링 데이터에서도 효과적으로 학습할 수 있게 함, (2) 전립선 형태 모델을 활용한 변형 데이터 증강으로 학습 샘플을 인위적으로 확대, (3) 네트워크 깊이를 단계별로 최적화해 파라미터 효율성을 극대화, (4) 간단한 전처리·후처리만으로도 높은 품질의 마스크를 자동 생성. 이러한 설계 원칙은 전립선 외에도 데이터가 부족한 다른 장기·조직의 의료 영상 분할에 적용 가능할 것으로 기대된다. 다만, 형태 모델이 전립선에 특화돼 있어 새로운 장기에 적용하려면 모델 재구축이 필요하고, 전역 CNN에 전체 3D 볼륨을 투입하는 과정에서 메모리 요구량이 비교적 높다는 점은 실용적인 제한 요소이다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기