설명 가능한 딥러닝 기반 ADHD 진단 프레임워크
초록
본 논문은 ADHD 진단을 위한 하이브리드 딥러닝 모델(HyExDNN‑RNN)을 제안하고, 피어슨 상관계수를 이용한 특징 선택과 SHAP·PFI 기반 설명가능인공지능(XAI) 기법을 결합해 이진 및 다중 클래스 분류에서 각각 99 %와 94.2 %의 F1 점수를 달성하였다. 모델의 결정 과정이 시각화·해석 가능하도록 설계함으로써 심리학자들이 AI 결과를 신뢰하고 임상 판단에 활용할 수 있도록 지원한다.
상세 분석
본 연구는 ADHD 진단을 위한 데이터‑드리븐 접근법을 설계하면서 두 가지 핵심 목표를 동시에 달성하고자 한다. 첫째, 피어슨 상관계수를 활용한 특징 선택 단계에서 95 % 이상의 상관값을 가진 중복 특성을 제거함으로써 차원 축소와 동시에 모델의 과적합 위험을 감소시킨다. 이는 특히 ADHD200 데이터셋처럼 다양한 인구통계·임상 변수를 포함하는 경우, 정보 손실 없이 핵심 변수를 추출하는 효율적인 방법이다. 둘째, 제안된 HyExDNN‑RNN은 두 개의 전결합(Dense) 레이어(256·128 유닛)와 두 개의 순환(RNN) 레이어(64·32 유닛)를 계층적으로 배치하고, 각 레이어 사이에 드롭아웃(0.5)과 정규화 기법을 적용해 일반화 성능을 강화한다. 이 구조는 시계열·정적 특성을 동시에 학습할 수 있어, 행동 평가 점수와 뇌 영상 지표 등 시간적 연관성을 가진 데이터에 적합하다.
모델 학습에는 Adam 옵티마이저와 범주형 교차 엔트로피 손실을 사용했으며, 다중 클래스(4개) 문제에서는 소프트맥스 출력으로 확률 기반 예측을 제공한다. 실험 결과, 이진 분류에서 99 %의 F1 점수를 기록했으며, 다중 클래스에서는 94.2 %라는 높은 정확도를 보였다. 이는 기존 CNN·RNN 기반 연구(정확도 68~80 %)에 비해 현저히 우수한 성능이다.
설명가능성 측면에서는 SHAP 값을 이용해 개별 샘플에 대한 로컬 특성 중요도를 시각화하고, Permutation Feature Importance(PFI)를 통해 전역적인 특성 기여도를 평가한다. SHAP 해석 결과, ‘ADHD Index’, ‘Inattentive Score’, ‘IQ Measure’ 등이 모델 결정에 핵심적인 역할을 함을 확인했으며, PFI는 동일한 특성들을 전역적으로도 상위에 배치한다. 이러한 이중 설명 체계는 심리학자가 모델의 예측 근거를 직관적으로 파악하고, 임상 판단과 교차 검증할 수 있게 한다.
한계점으로는 클래스 불균형(특히 ADHD‑Hyperactive/Impulsive 클래스가 5개에 불과함)과 데이터 전처리 단계에서 평균 대체 imputation이 잠재적 편향을 초래할 수 있다는 점을 들 수 있다. 향후 연구에서는 SMOTE와 같은 오버샘플링 기법이나 베이지안 imputation을 적용해 데이터 균형성을 개선하고, 모델의 견고성을 검증할 필요가 있다. 또한, 현재는 정량적 특성에 집중했으나, fMRI와 같은 고차원 영상 데이터를 직접 입력으로 활용하는 멀티모달 확장도 기대된다.
전반적으로 본 논문은 딥러닝과 XAI를 통합한 ADHD 진단 파이프라인을 제시함으로써, 높은 예측 정확도와 함께 임상 현장에서 요구되는 투명성을 동시에 만족시키는 실용적인 솔루션을 제공한다.
댓글 및 학술 토론
Loading comments...
의견 남기기