랜덤 포레스트 기반 OOD 탐지로 강화된 폐암 CT 분할
초록
본 연구는 사전학습된 Swin Transformer 인코더에서 추출한 깊은 특징을 활용해 랜덤 포레스트(RF) 분류기로 OOD(Out‑of‑Distribution) CT 스캔을 판별하는 RF‑Deep을 제안한다. 폐암 CT 데이터에 대해 세분화 모델을 미세조정하고, 종양 중심 영역의 다중 스케일 특징을 이용해 OOD 탐지 성능을 평가했으며, 기존 Softmax 기반 방법들을 크게 능가하는 FPR95(18.26%~0.11%)와 AUROC(95.16%~99.89%)를 달성하였다.
상세 분석
RF‑Deep은 크게 네 단계로 구성된다. 첫째, 10,432개의 라벨이 없는 3D CT를 이용해 SimMIM 방식으로 마스크드 이미지 모델링(MIM) 사전학습을 수행한 Swin Transformer 인코더를 기반으로 폐암 세분화 모델을 구축하고, 317개의 라벨링된 폐암 CT에 대해 교차 엔트로피와 Dice 손실을 결합해 미세조정한다. 둘째, 미세조정된 인코더를 고정(freeze)하고, 각 스테이지의 패치 임베딩(Patch Embedding) 및 Swin 블록 출력들을 추출한다. 이때 종양이 예측된 3D 영역을 ROI로 삼아, 해당 영역 내에서 평균 풀링을 적용해 8개의 다중 스케일 특징 벡터를 얻는다. 셋째, 140개의 ID(폐암) 스캔과 442개의 OOD(폐혈전증, COVID‑19, 신장암, 정상 복부) 스캔을 이용해 랜덤 포레스트(1000 트리, 최대 깊이 20, 클래스 가중치 균형)로 이진 분류기를 학습한다. 랜덤 포레스트는 비선형 경계와 특징 간 상호작용을 효과적으로 포착하면서도 해석 가능성을 제공한다는 장점이 있다. 마지막으로 새로운 스캔이 들어오면 동일한 파이프라인으로 특징을 추출하고, 학습된 RF‑Deep이 ID/OOD 점수를 출력한다.
실험 결과는 두드러진 두 가지 인사이트를 제공한다. 첫째, 인코더가 사전학습 단계에서 다양한 해부학적·병리학적 변이를 학습했기 때문에, 동일한 장비·프로토콜에서 발생하는 미세한 intensity shift에도 강인한 특징을 제공한다. 둘째, 전통적인 Softmax‑max, Energy, Entropy 기반 OOD 지표는 모델이 높은 확신을 보이는 경우(예: 비암성 병변이 종양처럼 보이는 경우)에는 거의 구분력을 상실하지만, RF‑Deep은 종양 중심 ROI에 국한된 다중 스케일 특징을 활용함으로써 이러한 오탐을 크게 감소시킨다. SHAP 분석을 통해 초기·중간 스테이지의 특징이 OOD 판별에 가장 크게 기여한다는 점도 확인되었다. 또한, FPR95가 복부 CT(신장암, 정상 췌장)에서 0.11% 이하로 거의 제로에 가까운 수준을 기록, 이는 기존 방법이 6~14% 수준을 보였던 것과 비교해 현저히 우수함을 의미한다.
전체적으로 RF‑Deep은 (1) 사전학습된 트랜스포머 인코더의 표현력을 그대로 활용, (2) 경량의 랜덤 포레스트로 빠른 추론 및 쉬운 배포, (3) 특징 중요도 해석을 통한 임상 신뢰성 제공이라는 세 축을 만족한다. 향후 다중 클래스 OOD 탐지, 다른 장기·질환에 대한 일반화, 그리고 대규모 foundation model과의 연계 연구가 기대된다.
댓글 및 학술 토론
Loading comments...
의견 남기기