폐 X레이 이미지 딥러닝 차원 축소 기법 비교 연구
초록
본 논문은 일본 방사선학회(JSRT) 공개 데이터베이스를 기반으로 폐 영역 분할, 골음영 제거, t‑SNE 기반 이상치 배제라는 세 가지 차원 축소 기법을 순차적으로 적용한 다섯 종류의 전처리 데이터셋을 구축하고, 동일한 단순 CNN 모델을 2048 × 2048 해상도 이미지에 학습시켜 각 전처리 조합이 폐암 결절 검출 정확도와 학습 효율에 미치는 영향을 정량적으로 평가한다. 결과적으로 모든 전처리를 적용한 데이터셋(데이터셋 #5)이 가장 높은 검증 정확도(≈0.71)와 빠른 학습 수렴을 보이며, 골음영 제거만으로는 정확도 향상이 미미함을 확인하였다.
상세 분석
이 연구는 차원 축소를 두 차원(공간적·통계적)에서 동시에 수행한다는 점에서 의미가 크다. 첫 번째 차원 축소는 폐 영역만을 남기는 분할 단계로, 평균 0.32 ± 0.06의 마스크 비율을 차지해 원본 이미지 대비 약 3.2배의 피처 차원을 감소시킨다. 두 번째 차원 축소는 골음영(BSE) 제거로, 평균 0.15 ± 0.04의 비율을 차지해 추가적으로 약 2배의 차원 감소 효과를 제공한다. 세 번째 차원 축소는 t‑SNE를 이용해 고차원 마스크 데이터를 3차원 임베딩으로 변환한 뒤, 시각적으로 군집을 확인하고 전체 데이터의 5 %에 해당하는 이상치 마스크를 배제한다. 이 과정은 데이터의 내부 변이성(예: 비정상적으로 작은 폐)와 수동 분할 오류(심장 영역이 포함된 경우)를 효과적으로 제거한다는 점에서 특히 주목할 만하다.
CNN 모델은 3개의 합성곱 층과 풀링 층을 기본으로 하는 매우 단순한 구조이며, TensorFlow 1.6 기반으로 NVIDIA Tesla K40c GPU에서 학습되었다. 동일한 하이퍼파라미터(배치 = 32, 학습률 = 0.001, 에포크 = 100)를 모든 데이터셋에 적용했음에도 불구하고, 데이터셋 #5에서는 훈련 정확도가 0.98 ~ 1.0에 근접하면서 검증 정확도는 0.71까지 상승했다. 반면 원본 데이터셋(데이터셋 #01)과 골음영 제거만 적용한 데이터셋(데이터셋 #02)은 훈련 정확도는 높지만 검증 정확도가 각각 0.62와 0.65에 머물렀으며, 과적합 현상이 뚜렷했다. 데이터셋 #04(분할 + 골음영)에서는 검증 정확도가 0.56 이하로 떨어져, 이상치 배제가 차원 축소 단계에서 가장 큰 성능 향상을 가져온다는 결론을 뒷받침한다.
또한, 데이터 불균형(154 대 93)과 작은 샘플 수(총 247장)로 인한 통계적 불안정성이 결과에 영향을 미쳤음이 논문 전반에 걸쳐 언급된다. 저자들은 향후 대규모 공개 CXR 데이터베이스(예: ChestX‑ray14)와 전이 학습, 데이터 증강 기법을 결합하면 현재 관찰된 과적합을 완화하고 일반화 성능을 크게 끌어올릴 수 있을 것으로 전망한다. 마지막으로, 차원 축소와 전처리 파이프라인을 자동화하는 것이 임상 현장에서 실시간 보조 진단 시스템을 구현하는 데 핵심적인 전제조건임을 강조한다.
댓글 및 학술 토론
Loading comments...
의견 남기기