실시간 의료 영상 분석을 위한 딥러닝 통합 프레임워크

초록

본 논문은 X‑ray, CT, MRI 등 다양한 의료 영상에 대해 U‑Net, EfficientNet, Transformer 기반 모델을 결합하고, 프루닝·양자화·GPU 가속 등 실시간 최적화 기법을 적용한 딥러닝 프레임워크를 제안한다. 공공 벤치마크에서 92 % 이상의 정확도와 91 % 이상의 Dice 점수, 80 ms 미만의 추론 속도를 달성했으며, Grad‑CAM·세그멘테이션 오버레이를 통한 설명 가능성을 제공한다.

상세 요약

이 연구는 의료 영상 진단의 시간적 제약과 인간 판독자의 변동성을 극복하기 위해, 다중 모달리티(흉부 X‑ray, 복부 CT, 뇌 MRI 등)를 동시에 지원하는 통합 딥러닝 파이프라인을 설계하였다. 핵심 아키텍처는 세 가지 흐름으로 구성된다. 첫째, 전통적인 U‑Net 구조를 기반으로 한 고해상도 세그멘테이션 경로는 스킵 연결과 다중 스케일 디코더를 강화해 미세한 병변을 정확히 복원한다. 둘째, EfficientNet‑B4/B5를 활용한 분류 모듈은 복합적인 특징 추출 효율성을 높이며, 파라미터 수 대비 높은 정확도를 유지한다. 셋째, Vision Transformer(ViT)와 Swin‑Transformer를 도입해 전역적인 컨텍스트와 장거리 의존성을 학습함으로써 복잡한 해부학적 구조를 인식한다.

실시간성을 확보하기 위해 모델 프루닝(채널·레이어 수준)과 8‑bit 양자화를 단계별로 적용했으며, TensorRT와 CUDA‑Graph를 이용한 GPU 최적화 파이프라인을 구축하였다. 이러한 최적화는 평균 추론 시간을 80 ms 이하로 낮추면서도, 원본 모델 대비 정확도 손실을 0.5 % 미만으로 억제한다. 또한, Edge TPU와 NVIDIA Jetson 시리즈 같은 경량 하드웨어에서도 동작 가능하도록 모델 크기를 4배 이상 압축하였다.

임상 시스템과의 연동을 위해 DICOM‑Web, HL7‑FHIR 인터페이스를 구현하고, PACS와 EHR에 실시간 결과를 전송한다. 설명 가능성 측면에서는 Grad‑CAM·Layer‑CAM을 이용해 분류 결정 근거를 시각화하고, 세그멘테이션 결과에 투명한 오버레이를 제공함으로써 의사의 신뢰성을 높였다.

실험에서는 NIH ChestX‑ray14, LUNA16, BraTS2021 등 공개 데이터셋을 사용해 교차 검증을 수행했으며, 전체 평균 정확도 93.2 %, Dice 92.4 %를 기록했다. 특히, 복합 다중 모달리티 테스트에서 기존 단일 모델 대비 3–5 %의 성능 향상을 보였다. 한계점으로는 데이터 라벨링 품질에 민감하고, 초고해상도 3D MRI에서 메모리 요구량이 여전히 높다는 점을 들 수 있다. 향후 연구에서는 연속 영상(시퀀스) 처리와 멀티태스크 학습을 결합해 진단 전반을 하나의 모델로 통합하고, 연합 학습(Federated Learning) 기반 개인정보 보호를 강화할 계획이다.

초록

상세 요약

📜 논문 원문 (영문)