다중작업 학습 기반 BCC 진단 AI와 이중 설명 시스템
초록
본 연구는 스페인 공공 의료기관의 원격진료 환경에서 피부암 중 가장 흔한 기저 세포암(BCC)을 자동으로 판별하고, 피부과 전문의가 사용하는 7가지 dermoscopic 패턴을 동시에 검출하는 다중작업 학습(MTL) 모델을 제안한다. MobileNet‑V2 백본에 이중 설명(패턴 기반 설명과 Grad‑CAM 시각화)을 결합해 90% 정확도와 99% 패턴 검출률을 달성했으며, 비 BCC 사례에서 pigment network 배제 기준을 95% 만족하였다.
상세 분석
본 논문은 임상 현장의 AI 도입 장벽인 ‘투명성 부족’ 문제를 해결하기 위해 두 단계의 설명 메커니즘을 설계한 점이 가장 큰 특징이다. 첫 번째는 다중라벨 형태로 정의된 7가지 BCC 특이 패턴(ulceration, ovoid nest, multiglobules, maple‑leaf, spoke‑wheel, arborizing telangiectasia, pigment network)을 직접 예측하도록 학습시킨다. 이는 기존의 단일 이진 분류 모델이 제공하지 못하는 임상적 근거를 제공한다. 두 번째는 Grad‑CAM을 활용해 모델이 집중한 영상 영역을 시각화함으로써, 패턴 검출 결과와 공간적 일치를 검증한다.
데이터 측면에서 60개 1차 진료소에서 수집된 1,559장의 dermoscopic 이미지와 4명의 피부과 전문의가 수행한 라벨링을 이용했으며, 라벨 간 일관성이 낮은 점을 보완하기 위해 Expectation‑Maximization(EM) 기반 합의 알고리즘을 적용해 ‘표준 레퍼런스(SR)’를 추출하였다. EM 알고리즘은 각 라벨러의 신뢰도를 추정하고, 다수결이 아닌 확률적 가중합을 통해 최종 라벨을 결정함으로써 주관적 오류를 최소화한다.
모델 아키텍처는 경량화된 MobileNet‑V2를 백본으로 채택하고, 공유된 특징 추출기 위에 이진 분류와 다중라벨 패턴 분류를 위한 두 개의 헤드를 병렬 배치한 전형적인 MTL 구조이다. 학습 단계는 1) ImageNet 사전학습 가중치 전이, 2) 마지막 3개 블록을 중심으로 미세조정, 3) 패턴 분류 전용 헤드의 저학습률 재학습 순으로 진행되었다. 클래스 불균형 문제를 해결하기 위해 focal loss와 stratified 5‑fold cross‑validation을 적용했으며, dropout(0.3)과 AdamW 옵티마이저를 사용해 과적합을 억제하였다.
성능 평가 결과, 이진 BCC 판별에서 정확도 90%, 정밀도 0.90, 재현율 0.89를 기록했으며, 패턴 검출에서는 BCC 양성 사례의 99%에서 최소 하나의 임상적으로 의미 있는 패턴을 올바르게 식별했다. 비 BCC 사례에서는 pigment network가 존재하지 않음을 95% 정확도로 판단했다. Grad‑CAM 시각화는 평균 전경 밀도 0.57, 배경 0.16을 보이며, 전문가가 수동으로 지정한 영역과 높은 공간적 일치를 보였다.
한계점으로는 데이터셋 규모가 비교적 작고, 피부 타입·연령·성별 등 인구통계학적 변수가 누락되어 일반화 가능성 검증이 부족하다는 점이다. 또한, 현재는 7가지 패턴만을 대상으로 했으며, 다른 피부암 종류와의 구분 능력은 평가되지 않았다. 향후 연구에서는 대규모 다기관 데이터와 멀티클래스 확장을 통해 모델의 견고성을 높이고, 실제 원격진료 워크플로우에 통합해 임상의 신뢰도와 효율성 변화를 정량화할 필요가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기