불확실성 인식 순서형 딥러닝을 활용한 다중 데이터셋 당뇨망막증 등급화
초록
본 연구는 당뇨망막증(DR) 등급을 순서형으로 모델링하고, 예측 불확실성을 정량화하는 딥러닝 프레임워크를 제안한다. ConvNeXt‑Base 백본에 병변‑쿼리 어텐션 풀링을 결합하고, 증거 기반 Dirichlet 분포를 이용한 순서형 회귀 헤드를 설계하였다. 순서형 증거 손실과 KL‑annealing 정규화를 통해 도메인 이동 상황에서도 캘리브레이션된 신뢰도를 유지한다. APTOS, Messidor‑2, EyePACS 데이터를 혼합 학습한 결과, 정확도 87.6 %와 Kappa 0.94를 달성했으며, 불확실성이 높은 저품질 이미지에 대해 의미 있는 불확실성 지표를 제공한다.
상세 분석
이 논문은 당뇨망막증 등급화 문제를 두 가지 핵심 관점에서 재정의한다. 첫째, DR 단계는 임상적으로 명확한 순서 관계를 가지므로, 전통적인 K‑class 분류보다 순서형 회귀가 더 적합하다. 저자는 각 등급 경계 (k) 에 대해 베르누이 확률 π_k 를 예측하고, 이를 2‑차원 Dirichlet(또는 Beta) 분포로 파라미터화한다. 증거 e_k 는 양의 실수로 제한되어 α_k = e_k + 1 을 형성하고, 기대값 π̂_k = α_{k,1}/(α_{k,0}+α_{k,1}) 을 통해 등급 확률을 복원한다. 이렇게 하면 모델은 “증거”와 “불확실성”(Dirichlet 강도 S_k) 을 동시에 출력할 수 있다.
둘째, 불확실성 추정은 의료 현장에서 필수적인데, 기존 베이지안 드롭아웃이나 앙상블은 추론 비용이 크다. 증거 기반 접근법은 샘플링 없이도 epistemic 불확실성을 정량화한다. 논문은 KL‑annealing 정규화 λ(t) 을 도입해 초기 학습 단계에서는 증거 축적을 허용하고, 학습이 진행될수록 균일 사전 Dir(1) 에 대한 KL 패널티를 강화한다. 이는 도메인 이동(다양한 카메라·조명·인구통계) 상황에서 과신을 억제하고, 캘리브레이션된 신뢰도를 유지한다.
또한, ConvNeXt‑Base 백본의 Stage 2 특징맵(64×64)을 선택해 고해상도 병변 정보를 보존한다. 여기에 “lesion‑query attention pooling”(LQAP) 모듈을 삽입해, N개의 학습 가능한 쿼리가 이미지 토큰에 교차 어텐션을 수행한다. 쿼리 자체에 자기‑어텐션을 적용해 서로 간의 중복을 방지하고, 온도 τ 조정을 통해 어텐션 분포를 샤프하게 만든다. 결과적으로 각 쿼리는 미세 혈관 병변·출혈·경화 등 특정 병변 영역에 집중하게 되며, 시각화된 어텐션 맵은 모델의 설명 가능성을 높인다.
학습 목표는 순서형 증거 손실 L_EDL = ∑_k L_data(π̂_k, t_k) + λ(t)∑_k KL(Dir(α_k)‖Dir(1)) 이며, t_k는 실제 등급에 대한 이진 임계값이다. MixUp·CutMix와 같은 라벨 스무딩 기법을 사용하면 t_k가 연속값이 되며, 손실 함수는 부드러운 목표를 자연스럽게 지원한다. 추가로, 쿼리 다양성 손실 L_div 을 도입해 코사인 유사도가 m 을 초과하는 쌍을 제곱 패널티로 억제함으로써 쿼리의 공간적 커버리지를 확대한다.
실험에서는 APTOS, Messidor‑2, EyePACS 데이터를 통합해 교차‑데이터셋 학습을 수행했으며, 테스트는 각 데이터셋 별로 별도 보류 집합을 사용했다. 결과는 정확도 87.6 %와 Quadratic Weighted Kappa 0.94를 기록했으며, 불확실성 점수 S_k 가 높은 샘플은 시각적으로 저품질·병변이 모호한 경우가 많았다. 이는 모델이 불확실성을 효과적으로 감지하고, 임상 현장에서 “재검토 필요” 사례를 자동으로 표시할 수 있음을 시사한다.
한계점으로는 (1) LQAP 모듈의 쿼리 수와 디코더 깊이에 따라 메모리·연산 비용이 급증한다는 점, (2) 품질 제어 단계에서 설정한 밝기·라플라시안 임계값이 데이터셋마다 최적화 필요함, (3) 외부 기관·다른 국가 데이터에 대한 검증이 부족해 실제 배포 시 성능 변동 가능성이 있다. 향후 연구는 경량화된 어텐션 설계, 도메인 적응을 위한 메타‑학습, 그리고 전향적 임상 시험을 통해 신뢰성 및 실용성을 강화하는 방향으로 진행될 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기