2.5D 딥러닝 기반 림프절 검출 혁신
초록
본 연구는 3차원 CT 영상에서 림프절 후보를 100 % 검출한 뒤, 각 후보를 다중 스케일·무작위 변환을 적용한 2.5D 이미지 패치로 변환하고, 이를 이용해 깊은 합성곱 신경망(CNN)으로 최종 양성/음성 확률을 추정한다. 평균화된 확률값을 기준으로 FROC 분석을 수행한 결과, 기존 최고 수준인 52.9 %·60.9 % 대비 매개흉부에서는 70 %/84 % (3 FP·vol⁻¹), 복부에서는 83 %/90 % (3 FP·vol⁻¹)의 민감도를 달성하였다.
상세 분석
이 논문은 림프절( LN ) 검출을 두 단계로 나누는 전형적인 CADe 파이프라인에 딥러닝을 효과적으로 결합한 점이 가장 큰 강점이다. 첫 번째 단계에서는 기존의 SVM·랜덤 포레스트 기반 후보 생성기를 활용해 거의 100 %의 민감도를 확보하고, 이때 발생하는 약 40개의 FP/환자를 그대로 유지한다. 여기서 핵심이 되는 2.5D 표현은 3D VOI(Volume‑of‑Interest)를 정규화된 격자로 재샘플링한 뒤, 중심을 기준으로 축방향(axial), 관상(coronal), 시상(sagittal) 세 장의 단일 슬라이스를 RGB 채널에 매핑한다. 이렇게 하면 2D CNN이 3차원 구조 정보를 손실 없이 학습할 수 있다.
무작위 스케일 변환(N_s = 4), 3 mm 이내의 평행 이동(N_t = 5), 그리고 0‑360° 범위의 회전(N_r = 5)을 조합해 총 N = N_s·N_t·N_r = 100개의 변형된 패치를 생성한다. 이는 데이터 증강 효과를 극대화함과 동시에 과적합을 방지한다는 점에서 기존 2D 이미지 증강 방식과 유사하지만, 3D 공간에서의 물리적 변환을 직접 적용한다는 점이 차별화된다.
CNN 아키텍처는 두 개의 컨볼루션 레이어(필터 수 64, 64), 각각 뒤따르는 맥스 풀링, 로컬 완전 연결 레이어(512), 그리고 DropConnect가 적용된 완전 연결 레이어를 거쳐 2‑클래스 소프트맥스 출력으로 구성된다. DropConnect는 각 연결을 확률적으로 차단함으로써 일반화 성능을 향상시키며, ReLU 활성화 함수를 사용해 학습 속도를 가속화한다. 학습은 NVIDIA GTX TITAN GPU에서 9‑12시간 소요되었으며, 테스트 단계에서는 100개의 변형 패치에 대한 예측을 평균화해 최종 후보 확률 p(x)를 산출한다.
평가에서는 90명의 환자(388개 매개흉부 LN)와 86명의 환자(595개 복부 LN) 데이터를 3‑fold 교차 검증하였다. 후보 생성 단계에서 3208·(매개흉부)와 3484·(복부)의 FP를 음성 샘플로 활용했으며, 양성·음성 비율을 맞추어 학습에 사용하였다. FROC 곡선은 N이 증가함에 따라 급격히 포화되며, N = 100일 때 AUC가 0.942(복부)·0.915(매개흉부)까지 상승한다. 3 FP·vol⁻¹ 기준에서 매개흉부는 p = 7.6×10⁻³, 복부는 p = 2.5×10⁻¹⁴의 통계적 유의성을 보였다. 또한, 매개흉부와 복부 데이터를 합쳐 공동 학습할 경우 매개흉부 민감도가 약 10 % 상승하는 등 데이터 규모와 다양성이 성능에 미치는 영향을 실증하였다.
결과적으로, 2.5D 랜덤 뷰와 깊은 CNN을 결합한 접근법은 기존 3D HAAR 기반 부스팅 방식보다 FP를 크게 감소시키면서 민감도를 크게 끌어올렸다. 이는 고차원 3D CNN이 요구하는 대규모 라벨링 비용을 회피하고, GPU 친화적인 2D CNN 구조를 그대로 활용할 수 있다는 실용적 장점을 제공한다. 향후에는 다기관 데이터셋을 통한 일반화 검증과, 전이 학습·멀티태스크 학습을 통한 더욱 강건한 림프절 검출 시스템 구축이 기대된다.
댓글 및 학술 토론
Loading comments...
의견 남기기