확장된 딥 슈퍼비전과 팽창 합성곱을 이용한 3D U‑Net 기반 해마 MRI 분할
본 연구는 3D U‑Net 구조에 팽창 합성곱(dilated convolution)과 딥 슈퍼비전(deep supervision)을 결합한 새로운 네트워크를 제안한다. 저해상도 레이어에 팽창 합성곱을 삽입해 전역 컨텍스트를 확보하고, 디코더 각 단계의 출력을 최종 마스크에 병합함으로써 다중 스케일 정보를 효율적으로 학습한다. MICCAI 2018 Segmentation Decathlon의 해마 데이터셋(263명)에서 10 % 테스트 비율로 평가…
저자: Lukas Folle, Sulaiman Vesal, Nishant Ravikumar
본 논문은 알츠하이머병(AD) 진행과 연관된 해마 부피 감소를 정량화하기 위한 자동화된 MRI 분할 방법을 제안한다. 기존의 수동 분할은 시간 소모가 크고 관찰자 의존성이 높아 임상 현장에서 활용도가 제한적이다. 최근 딥러닝 기반 U‑Net 계열 모델이 의료 영상 분할에서 뛰어난 성능을 보였지만, 전역적인 컨텍스트와 지역적인 세부 정보를 동시에 반영하는 데 한계가 있다. 이를 보완하고자 저자들은 3D U‑Net 구조에 두 가지 핵심 기술을 도입하였다.
첫 번째는 인코더 최하위 레이어에 팽창 합성곱(dilated convolution) 블록을 삽입한 것이다. 네 개의 팽창 합성곱 레이어는 각각 dilation rate를 1, 2, 4, 8로 설정하여 수용 영역을 기하급수적으로 확대한다. 이러한 설계는 해마와 같이 작은 구조물의 미세한 형태 변이를 포착하면서도, 전체 뇌의 전역적인 해부학적 정보를 학습하도록 돕는다.
두 번째는 디코더 각 단계의 출력을 모두 업샘플링하여 최종 마스크에 병합하는 딥 슈퍼비전(deep supervision) 메커니즘이다. 각 디코더 출력이 직접 손실에 기여함으로써 학습 과정에서 다중 스케일 특징이 동시에 최적화된다. 또한 인코더 내부와 디코더‑최종 레이어 사이에 잔차 연결을 적용해 그래디언트 소실을 방지하고, 파라미터 수를 크게 늘리지 않으면서도 학습 안정성을 확보하였다.
데이터는 MICCAI 2018 Segmentation Decathlon에서 제공한 263명의 T1‑weighted MPRAGE MRI 스캔을 사용하였다. 데이터는 이미 해마 영역으로 잘라낸 ROI 형태였으며, Z‑score 정규화를 적용했다. 전체 데이터의 90 %를 9‑fold 교차 검증을 통해 학습·검증에 사용하고, 나머지 10 %를 독립 테스트 셋으로 설정하였다. 학습 손실은 Dice 손실과 Binary Cross‑Entropy 손실을 가중합한 복합 손실을 사용했으며, Adam 옵티마이저(learning rate = 5e‑4)와 500 epoch 학습, 10 epoch마다 검증 손실이 개선되지 않으면 learning rate를 0.1배 감소시키는 스케줄링을 적용하였다. 데이터 증강으로는 좌우·상하 플립과 ±10° 회전이 사용되었으며, 큰 회전 각도는 성능 저하를 초래한다는 실험적 근거를 제시한다.
성능 평가는 Dice Similarity Coefficient(DSC), Jaccard Index(JI), Normalized Surface Distance(NSD, tolerance = 4 mm) 세 지표를 사용하였다. 제안 모델은 테스트 셋에서 DSC = 0.984, JI = 0.882, NSD = 0.790을 기록했으며, 이는 V‑Net(DSC = 0.848, JI = 0.736, NSD = 0.848), 기본 3D U‑Net(DSC = 0.865, JI = 0.740, NSD = 0.860), 그리고 팽창 합성곱을 적용한 3D U‑Net(DSC = 0.879, JI = 0.785, NSD = 0.879)보다 모두 우수하였다. 시각적 결과에서도 제안 모델은 작은 분리 영역과 복잡한 경계면을 정확히 복원했으며, V‑Net이 매끄럽게 처리한 부분에서 발생한 형태 손실을 보완하였다.
결론적으로, 저자들은 팽창 합성곱을 통한 전역 컨텍스트 확보와 딥 슈퍼비전을 통한 다중 스케일 학습이 해마와 같이 구조가 복잡하고 작은 영역의 분할에 효과적임을 입증하였다. 향후 연구에서는 제안 프레임워크를 전체 뇌 볼륨에 적용하고, 다른 뇌 구조 및 다양한 의료 영상 분야로 확장하는 방안을 모색한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기