DeepFAN: 변압기 기반 인공지능·방사선 협진으로 폐결절 진단 정확도 혁신

DeepFAN은 Vision Transformer와 3D ResNet, 그래프 컨볼루션 네트워크를 결합한 하이브리드 모델로, 10 000여 개 병리확인 결절을 학습하였다. 내부 테스트에서 AUC 0.939, 임상 MRMC 시험(400명, 3기관)에서는 AUC 0.954를 기록했으며, AI 보조 시 12명의 초급 방사선과 의사의 평균 AUC가 10.9% 상승하고 민감도·특이도·정확도도 유의하게 개선되었다. 전반적인 독자 간 일치도도 ‘보통’ 수준…

저자: Zhenchen Zhu, Ge Hu, Weixiong Tan

DeepFAN: 변압기 기반 인공지능·방사선 협진으로 폐결절 진단 정확도 혁신
본 연구는 폐결절의 악성·양성 판별을 위한 새로운 인공지능 모델 DeepFAN을 제안하고, 이를 대규모 병리확인 데이터와 엄격한 임상 시험을 통해 검증하였다. 기존의 CNN 기반 모델은 지역적 특징에 집중해 전역적인 형태 정보를 충분히 활용하지 못한다는 한계가 있었으며, 대부분의 연구가 임상 적용 검증 없이 종료되었다. 이를 극복하기 위해 DeepFAN은 Vision Transformer(ViT)로 전역 피처를, CAL‑ADL 3D ResNet으로 미세한 국소 피처를, 그리고 그래프 컨볼루션 네트워크(GCN)로 두 피처를 효과적으로 융합한다. 데이터 수집 단계에서는 중국 9개 병원·7개 성에서 11 438개의 병리확인 결절(8 172명)을 확보했으며, 7:1:2 비율로 훈련·검증·내부 테스트 셋을 분할하였다. 악성 결절이 전체의 약 75%를 차지하는 불균형을 고려해 손실 함수와 샘플링 전략을 최적화하였다. 모델은 내부 테스트에서 AUC 0.939(95% CI 0.930‑0.948), 민감도 0.953, 특이도 0.733을 기록했고, 전처리·데이터 증강을 통해 다양한 CT 재구성 파라미터에 대한 강인성을 확보하였다. 일반화 검증을 위해 미국 National Lung Screening Trial(NLST) 데이터셋을 추가로 평가했으며, 악성 비율이 크게 낮은 환경에서도 AUC 0.943, 민감도 0.889, 특이도 0.897을 유지, 실제 임상 현장에 적용 가능한 범용성을 입증하였다. 임상 검증은 다독자·다사례(MRMC) 디자인을 채택, 3개 독립 의료기관(총 400명, 463결절)에서 12명의 1‑5년 차 방사선과 의사가 독립적으로 판독한 후 AI 보조를 받는 두 단계로 진행되었다. AI 보조 전 독자들의 평균 AUC는 0.667(95% CI 0.616‑0.719), 민감도 0.693, 특이도 0.605, 정확도 0.651이었다. AI 보조 후에는 AUC 0.776(95% CI 0.733‑0.819), 민감도 0.769, 특이도 0.731, 정확도 0.751로 각각 10.9%, 7.6%, 12.6%, 10.0% 상승하였다. 통계적으로 유의미한 개선(P<0.001)과 함께, 독자 간 κ값이 0.313에서 0.421로 상승해 진단 일관성이 ‘보통’ 수준으로 향상되었다. 설명가능성 분석에서는 Grad‑CAM 및 SHAP 기법을 활용해 모델이 전역 피처에 더 큰 가중치를 두고 있음을 시각적으로 확인하였다. 이는 결절 주변 폐 조직과 형태적 맥락이 악성 여부 판단에 중요한 역할을 함을 의미한다. 모델의 임상 적용을 위한 규제 승인도 확보했으며(NMPA 승인 번호 20243211932), 실제 현장에서의 활용 가능성을 높였다. 그러나 연구는 몇 가지 제한점을 가진다. 첫째, 데이터가 대형 3차 병원 중심으로 수집돼 1차 진료 현장의 다양성을 충분히 반영하지 못한다. 둘째, AI에 대한 과신 및 신뢰도 관리가 필요하며, 장기 추적 연구가 부족하다. 셋째, 모델이 CT 스캔 프로토콜 변화에 얼마나 민감한지에 대한 정량적 평가가 제한적이다. 향후 연구 방향으로는 보다 다양한 의료기관·인구통계학적 배경을 포함한 멀티센터 데이터베이스 구축, AI·인간 협업 프로토콜 표준화, 그리고 AI 보조 판독 시 방사선과 의사의 의사결정 과정에 대한 심층적인 행동 분석이 제시된다. 이러한 노력이 결합된다면 DeepFAN은 폐결절 진단의 정확도와 효율성을 크게 향상시켜, 불필요한 추적 검사를 감소시키고 환자 불안을 완화하는 데 기여할 것으로 기대된다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기