다중특징 피라미드 U‑Net을 이용한 초음파 심장영상 좌심실 자동 분할
초록
본 논문은 2차원 초음파 심장영상에서 좌심실(LV) 경계선을 자동으로 추출하기 위해, 디레이트된 U‑Net과 Feature Pyramid Network(FPN)를 결합한 MFP‑Unet을 제안한다. 디코더의 모든 레벨에서 추출한 특징맵을 깊이 맞춤 후 고정 해상도로 업샘플링하여 하나의 세그멘테이션 레이어에 입력함으로써 다중 스케일 정보를 동시에 활용한다. 동일 데이터셋에서 기존 U‑Net, Dilated U‑Net, DeepLabv3와 비교했을 때 Dice 0.945, Hausdorff 1.62 mm, Jaccard 0.97, MAD 1.32 mm 등 현저히 우수한 성능을 보였으며, 자동 추출된 부피·면적·길이와 수동 측정값 간의 Bland‑Altman 및 상관분석에서도 높은 일치도를 확인하였다.
상세 분석
MFP‑Unet은 기존 U‑Net 구조의 한계점을 보완하기 위해 두 가지 핵심 아이디어를 도입한다. 첫째, 디코더 단계에서 각 레벨의 특징맵을 별도로 추출하고, 1×1 컨볼루션을 이용해 채널 수를 동일하게 맞춘 뒤, 전 단계에서 사용된 업샘플링 방법과 동일한 해상도로 재조정한다. 이렇게 만든 다중 스케일 특징 스택을 하나의 합성곱 레이어에 입력함으로써, 저해상도이면서 높은 의미 정보를 가진 깊은 특징과 고해상도이면서 세밀한 경계 정보를 동시에 활용한다. 둘째, 전통적인 U‑Net이 마지막 디코더 레이어만을 세그멘테이션에 사용하던 점을 개선하기 위해 FPN(Feture Pyramid Network) 개념을 차용하였다. FPN은 상향 경로와 하향 경로 사이에 lateral connection을 두어, 높은 수준의 의미적 특징을 저해상도 레이어에서 고해상도 레이어로 전달한다. 본 논문에서는 이 과정을 디레이트 컨볼루션(dilated convolution)과 결합해, receptive field를 확대하면서도 파라미터 수를 크게 증가시키지 않는 설계를 채택하였다.
네트워크 학습 과정에서는 데이터 증강(회전, 스케일 변환 등)을 통해 제한된 초음파 이미지 데이터의 다양성을 확보하고, 교차 엔트로피 손실과 Dice 손실을 가중합한 복합 손실 함수를 사용해 경계가 흐릿한 영역에서도 안정적인 학습이 가능하도록 하였다. 평가 지표로는 Dice coefficient, Jaccard index, Hausdorff distance, Mean Absolute Distance를 사용했으며, 특히 HD와 MAD는 경계 정확도를 정량화하는 데 유용하였다. 실험 결과, MFP‑Unet은 기존 U‑Net( Dice ≈ 0.91) 및 Dilated U‑Net( Dice ≈ 0.92)보다 약 3~4%p 높은 Dice를 기록했으며, HD와 MAD에서도 유의미한 개선을 보였다. 또한, 자동으로 추출한 LV 부피·면적·길이에 대해 Bland‑Altman 플롯과 Pearson 상관계수를 분석한 결과, 평균 편차가 0에 가까워 임상적 적용 가능성을 뒷받침한다.
이와 같이 MFP‑Unet은 다중 스케일 특징 통합과 넓은 receptive field 확보를 동시에 달성함으로써, 초음파 영상 특유의 저대비·노이즈·불명확한 경계 문제를 효과적으로 극복한다. 향후 3차원 심장영상이나 다른 장기 초음파 영상에도 동일한 설계를 확장할 수 있는 가능성을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기