전방 안구 영상 기반 자동 당뇨 스크리닝: 딥러닝·SSL·XAI 통합 연구

전방 안구 영상 기반 자동 당뇨 스크리닝: 딥러닝·SSL·XAI 통합 연구
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 연구는 전통적인 안저 사진 대신 표준 카메라로 촬영 가능한 전방 안구(홍채·공막·결막) 영상을 활용해 당뇨 여부를 자동 분류하는 딥러닝 시스템을 제안한다. SimCLR 기반 자체 지도 학습(SSL)으로 도메인 특화 특징을 사전 학습하고, EfficientNet‑V2‑S에 적용해 98.21%의 F1‑score를 달성하였다. 스펙큘러 반사 제거와 CLAHE 전처리, 자동 데이터 품질 평가·라벨 정정 파이프라인, Grad‑CAM 기반 설명가능 인공지능(XAI) 분석을 통해 모델이 의학적으로 의미 있는 부위(공막 혈관, 홍채 구조, 결막 충혈)에 주목함을 검증하였다.

상세 분석

본 논문은 당뇨병 스크리닝을 안저 사진에 의존하는 기존 패러다임을 탈피하고, 일반 디지털 카메라로도 촬영 가능한 전방 안구 영상을 활용한다는 점에서 임상 현장의 접근성을 크게 높인다. 데이터는 2,640장의 고해상도 전방 안구 사진으로 구성됐으며, 각 환자는 정상, 혈당 조절이 된 당뇨, 조절이 안 된 당뇨 세 그룹으로 라벨링되었다. 초기 라벨링 오류가 65.8%에 달함을 발견하고, 적혈구 색상(Redness), 혈관 밀도(Vessel density), 공막 백색도(Whiteness) 등 세 가지 임상 바이오마커를 정량화한 자동 품질 평가 파이프라인을 구축해 K‑means 군집화로 라벨을 재정비하였다. 이 과정에서 F1‑score가 30.69%에서 88.62%로 급격히 상승했으며, 데이터 정제가 모델 성능에 미치는 영향을 실증적으로 보여준다.

전처리 단계에서는 스펙큘러 반사를 임계값 기반 검출·형태학적 팽창·텔레인 페인팅으로 제거하고, LAB 색공간의 L채널에 CLAHE(clip=2.0, tile=8×8)를 적용해 미세 혈관과 텍스처를 강조한다. 데이터 증강으로는 회전, 색상 변형, 랜덤 크롭 등을 적용해 모델의 일반화 능력을 강화하였다.

모델 아키텍처는 EfficientNet‑V2‑S, Vision Transformer(B/16), Swin‑Transformer‑V2‑Base, ConvNeXt‑Base, ResNet‑50 등 다섯 가지 최신 구조를 비교하였다. 특히 SimCLR 기반 SSL을 도메인 전용 전안부 이미지(라벨이 없는 5,000여 장)에서 사전 학습한 후, 라벨이 있는 데이터로 미세 조정(fine‑tuning)한 EfficientNet‑V2‑S가 가장 우수한 성능을 보였다. SSL 적용 전 ImageNet‑only 초기화 모델은 F1‑score 94.63%에 그쳤으나, SSL 후 98.21%를 기록했으며, 정밀도 97.90%, 재현율 98.55%를 달성했다. 특히 정상군에 대해 100% 정밀도를 보여 불필요한 진료 전환을 최소화한다.

설명가능 인공지능 측면에서는 Grad‑CAM을 활용해 각 클래스별 활성화 영역을 시각화하였다. 정상, 조절당뇨, 비조절당뇨 모두에서 모델이 공막 혈관 형태, 홍채 구조적 변형, 결막 충혈 등 의학적으로 알려진 바이오마커에 집중함을 확인했으며, 50건의 무작위 샘플에 대해 안과 전문의와의 교차 검증에서 94%의 일치율을 기록했다. 이는 모델이 단순한 색상·텍스처가 아닌 실제 병리학적 특징을 학습했음을 의미한다.

연산 효율성도 검토했는데, EfficientNet‑V2‑S는 20.8M 파라미터로 Transformer 계열(86–88M 파라미터)보다 4배 적은 메모리를 사용하면서도 높은 정확도를 유지한다. 따라서 저사양 장비나 모바일 환경에서도 실시간 추론이 가능할 것으로 기대된다.

전체적으로 본 연구는 (1) 전방 안구 영상이라는 새로운 바이오마커 활용, (2) 도메인 특화 SSL을 통한 사전 학습, (3) 자동 데이터 품질 관리·라벨 정정 파이프라인, (4) 광범위한 아키텍처 벤치마크, (5) 임상적 의미를 검증한 XAI 분석이라는 다섯 축을 통합함으로써 당뇨병 스크리닝을 보다 저비용·고접근성으로 전환할 수 있는 실증적 근거를 제공한다. 향후 다기관 외부 검증과 실제 진료 흐름에의 통합 연구가 필요하지만, 현재 결과만으로도 기존 안저 기반 시스템을 대체하거나 보완할 충분한 잠재력을 보여준다.


댓글 및 학술 토론

Loading comments...

의견 남기기