계층적 샘플링 기반 Oculomix: 안저 영상으로 전신질환 예측 향상

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 안저 영상 기반 전신질환 예측에서 기존 이미지‑레벨 CutMix·MixUp이 환자 고유의 임상 정보를 왜곡한다는 문제를 해결하고자, 환자·검사·이미지의 계층 구조를 활용한 Oculomix 샘플링 전략을 제안한다. 동일 검사의 이미지와 동일 환자의 시계열 검사를 각각 제한된 혼합 공간으로 설정하고, 시간 순서를 이용한 순위 손실을 도입해 라벨 혼합의 모호성을 보완한다. 알즈아이(AlzEye) 데이터셋을 이용한 5년 MACE 예측 실험에서 AUROC가 최대 3%p, AUPRC가 4.4%p, 외부 C‑index가 12%p 향상되는 등 일관된 성능 개선을 입증한다.

상세 분석

Oculomix는 기존의 이미지‑레벨 혼합 샘플링이 환자 수준의 임상 변수(연령, 성별, 가족력, 사회경제적 지위 등)를 무시하고 순수히 시각적 특징과 라벨만을 섞는다는 근본적인 한계를 지적한다. 이를 해결하기 위해 두 가지 임상적 사전지식, 즉 ‘검사 레벨(동일 시점에 촬영된 양안 이미지는 동일한 임상 컨텍스트를 공유)’과 ‘환자 레벨(시간이 흐름에 따라 질병 위험이 점진적으로 증가)’을 기반으로 혼합 공간을 계층적으로 제한한다.

검사‑레벨 샘플링: 동일 환자의 동일 검사의 이미지(보통 양안의 중심·말초 시야)만을 혼합 대상으로 삼아, 해당 검사의 라벨과 임상 변수들을 그대로 보존한다. 이는 기존 이미지‑레벨 CutMix·MixUp이 임의의 환자 이미지와 라벨을 섞어 발생하는 ‘환자 특성 오염’을 방지한다.
환자‑레벨 샘플링: 동일 환자의 서로 다른 시점 검사를 혼합하되, 라벨을 직접 선형 결합하는 대신 시간 순서를 이용한 pairwise ranking loss를 적용한다. 이 손실은 “시간이 늦은 검사의 예측 로그잇이 앞선 검사의 로그잇보다 크게 해야 한다”는 마진 기반 제약을 두어, 혼합 이미지가 시간적 진행성을 반영하도록 유도한다. 라벨을 직접 혼합하면 진행성 질환의 연속성을 제대로 표현하지 못하는 모호성이 존재하지만, 순위 손실은 이러한 모호성을 회피하면서도 환자 고유의 진행 패턴을 학습한다.

실험에서는 Vision Transformer (ViT‑Small, ViT‑Base) 모델에 CutMix·MixUp을 적용한 뒤, 세 가지 샘플링 전략(이미지‑레벨, 검사‑레벨, 환자+검사‑레벨)을 비교하였다. 내부 테스트에서 환자+검사‑레벨이 AUROC 67.22% (ViT‑Small)·67.29% (ViT‑Base)로 가장 높았으며, 이미지‑레벨 대비 각각 3.68%p, 3.60%p 상승했다. AUPRC 역시 동일하게 4.4%p 정도 개선되었다. 외부 HYU MACE 데이터셋에서는 C‑index가 12%p 상승하는 등 일반화 능력도 크게 향상되었다.

또한, Ablation Study에서 CutMix·MixUp을 단독으로 적용했을 때도 환자+검사‑레벨이 검사‑레벨보다 더 큰 이득을 보였으며, 두 기법을 동시에 사용할 경우 차이가 더욱 확대되었다. 이는 계층적 샘플링이 혼합 데이터의 다양성을 크게 늘려 과적합을 방지하고, 환자 고유 특성을 보존함으로써 모델이 더 견고한 임상 특징을 학습하게 함을 시사한다.

마지막으로, 직접 라벨을 선형 결합하는 방식(Direct label supervision)과 순위 기반 상대 감독(Relative supervision)을 비교했을 때, 후자가 일관적으로 우수한 성능을 보였다. 이는 시간적 진행성을 반영한 순위 손실이 라벨 혼합의 불확실성을 효과적으로 대체한다는 중요한 교훈을 제공한다.

전반적으로 Oculomix는 안저 기반 전신질환 예측이라는 특수 도메인에 맞춤형 데이터 증강 전략을 제시함으로써, 기존 트랜스포머 기반 모델의 데이터 효율성을 유지하면서도 임상적 타당성을 크게 높인 혁신적인 접근법이라 할 수 있다.

계층적 샘플링 기반 Oculomix: 안저 영상으로 전신질환 예측 향상

초록

상세 분석

댓글 및 학술 토론

의견 남기기