전립선 절제술 후 발기부전 예측, MRI는 과연 도움이 될까
초록
본 연구는 전립선암 환자에서 수술 전 MRI가 수술 후 12개월 발기부전 예측에 기여하는지를 평가한다. 임상 변수만을 이용한 베이스라인(Random Forest, AUC 0.663)과 비교해, MRI 기반 손수 만든 해부학적 특징(AUC 0.554) 및 딥러닝 모델(AUC 0.569)은 성능이 낮았다. 임상·영상 융합 모델도 AUC 0.586으로 임상 단독보다 못했다. SHAP 분석은 연령·체중·기저 발기점수 등 임상 변수가 가장 큰 영향을 미쳤으며, 영상 모델의 saliency map은 전립선 및 신경혈관 다발에 집중함을 보여준다. 결론적으로 현재 데이터와 방법론으로는 MRI가 임상 변수만큼의 예측력을 제공하지 못한다.
상세 분석
이 논문은 전립선암 환자 647명을 대상으로 전립선 절제술(RALP) 후 12개월 시점의 발기부전(ED) 발생 여부를 이진 분류 문제로 설정하고, 네 가지 모델링 전략을 체계적으로 비교하였다. 첫 번째 전략은 수술 전 임상 변수(연령, 체중, 흡연·음주 여부, 약물 복용, 동반질환, 기저 발기점수 등)를 활용한 전통적인 머신러닝(Random Forest, Gradient Boosting 등)으로, 가장 높은 AUC 0.663을 기록하며 베이스라인을 제공한다. 두 번째 전략은 MRI에서 직접 추출한 해부학적 특징, 즉 전립선 및 전립선 피막(fascia)의 두께와 부피를 정량화한 후 SVM, 로지스틱 회귀 등으로 학습시켰다. 이 접근법은 AUC 0.554에 그쳐, 임상 베이스라인보다 현저히 낮았다. 세 번째 전략은 2D 슬라이스 기반 딥러닝 모델(ResNet‑18, Vision Transformer, Hybrid ResNet‑ViT)로, 단일 중간 슬라이스부터 12개 연속 슬라이스까지 다양한 입력 구성을 실험하였다. 가장 좋은 성능은 4개의 중간 슬라이스를 사용한 Hybrid‑ViT에서 나타났으며, AUC 0.569로 해부학적 특징 기반 모델을 약간 앞섰다. 그러나 여전히 임상 변수만을 이용한 모델에 미치지 못했다. 네 번째 전략은 임상 변수와 영상 임베딩을 중간 단계에서 결합한 멀티모달 모델이다. 여기서는 영상 임베딩과 임상 임베딩을 동일 차원으로 맞춘 뒤, MLP를 통해 결합하고 최종 분류 헤드를 적용하였다. 이 융합 모델은 AUC 0.586을 기록했지만, 임상 단독 모델보다 개선 효과가 제한적이었다. SHAP 분석 결과, 전체 모델 기여도 중 57.4%가 임상 변수에서, 42.6%가 영상 변수에서 비롯되었으며, 연령·체중·기저 발기점수가 가장 큰 영향력을 보였다. 또한, 가장 성능이 좋은 영상 모델에 대한 saliency map은 전립선 자체와 신경혈관 다발 부위에 높은 주목도를 나타냈다. 이는 모델이 해부학적으로 의미 있는 영역을 활용하고 있음을 시사하지만, 현재 데이터 규모(647명, MRI 스캔 다양성)와 이미지 전처리(2D 제한)로는 충분한 신호를 추출하기 어려웠다. nnU‑Net을 이용한 전립선·피막 자동 분할은 중간 슬라이스에서 Dice 0.965(전립선)·0.738(피막)으로 양호했으나, 피막의 얇고 저대조 특성 때문에 전반적인 해부학적 변이 측정에 한계가 있었다. 전반적으로, MRI가 제공하는 해부학적 정보는 임상 변수와 비교했을 때 예측력에서 부수적 역할에 머물렀으며, 향후 대규모 코호트, 3D 영상 활용, 그리고 전립선 신경혈관 다발을 정밀히 라벨링한 데이터가 필요함을 강조한다.
댓글 및 학술 토론
Loading comments...
의견 남기기