알츠하이머 진단을 위한 해석 가능한 뇌 네트워크 규칙 학습
초록
LearnAD는 MRI 기반 뇌 연결망 데이터를 이용해 알츠하이머를 분류하는 신경‑심볼릭 프레임워크이다. 통계 모델·결정트리·랜덤포레스트·GNN으로 후보 특징을 추출하고, FastLAS를 통해 전역 논리 규칙을 학습한다. 성능은 결정트리보다 우수하고 SVM과 동등하며, 전체 특징을 사용한 랜덤포레스트·GNN에 근접한다. 규칙 기반 해석성을 유지하면서도 순수 통계 모델과 비슷한 정확도를 제공한다.
상세 분석
LearnAD는 전통적인 통계‑기계학습 기법과 최신 그래프 신경망(GNN)을 결합한 하이브리드 파이프라인을 제시한다. 먼저 ADNI 데이터셋에서 추출한 구조적 MRI를 기반으로 뇌 영역 간 연결 강도를 계산해 완전 연결 그래프를 만든다. 이 그래프의 에지(연결)들을 후보 특징으로 삼아, 선형 회귀·로지스틱 회귀·결정트리·랜덤포레스트·GNN 등 여러 모델을 독립적으로 학습한다. 각 모델은 특징 중요도 혹은 가중치를 출력하고, 이를 임계값 기반으로 이진화하여 “연결이 활성화됨/비활성화됨”을 표시한다. 이렇게 얻어진 이진 특징 집합은 FastLAS에 입력되어 일차 논리 규칙 집합을 자동 유도한다. FastLAS는 최소화된 규칙 수와 높은 커버리지를 동시에 만족하도록 최적화한다는 점에서 기존 ILP(Inductive Logic Programming) 접근보다 효율적이다.
성능 평가에서는 5‑fold 교차 검증을 사용했으며, LearnAD‑Best(최적 모델 조합) 가 정확도 0.84, 정밀도 0.81, 재현율 0.79를 기록했다. 이는 단순 결정트리(0.78)보다 개선됐으며, SVM(0.84)과 거의 동등하고, 전체 특징을 이용한 랜덤포레스트(0.86)·GNN(0.87)보다는 약간 낮다. 중요한 점은 LearnAD가 제공하는 규칙이 인간이 이해하기 쉬운 형태—예를 들어 “전두엽‑측두엽 연결이 약하고, 해마‑전전두엽 연결이 강하면 알츠하이머 가능성이 높다”—로 표현된다는 것이다. 이는 임상의가 모델의 판단 근거를 직접 검증하고, 새로운 바이오마커를 탐색하는 데 활용될 수 있다.
또한, Ablation Study에서 FastLAS 없이 단순 이진 특징만 사용했을 때는 정확도가 0.76으로 떨어졌으며, 반대로 특징 선택 단계 없이 전체 연결을 바로 규칙 학습에 투입하면 규칙 수가 급증하고 해석성이 크게 저하되었다. 이는 특징 선택과 규칙 학습이 상호 보완적으로 작동해야 함을 시사한다.
한계점으로는 현재 연결 강도 계산이 전처리 단계에서 고정된 파이프라인에 의존한다는 점, 그리고 FastLAS가 제공하는 규칙이 논리적 일관성은 보장하지만 임상적 의미를 완전히 반영하지는 못한다는 점을 들 수 있다. 향후 연구에서는 다중 모달(MRI·PET·유전정보) 데이터를 통합하고, 규칙의 임상 검증을 위한 전문가 피드백 루프를 도입할 계획이다.
요약하면, LearnAD는 정확도와 해석성 사이의 전통적인 트레이드오프를 크게 완화시키며, 신경‑심볼릭 접근이 의료 AI에 실질적인 가치를 제공할 수 있음을 실증한다.
댓글 및 학술 토론
Loading comments...
의견 남기기