진단용 뇌영상 바이오마커 개발: 진전성 파킨슨병 조기 탐지를 위한 진화 알고리즘 기반 fMRI 분류
초록
본 연구는 PPMI 데이터베이스의 휴식기 fMRI와 동적 인과 모델(DCM) 데이터를 활용해, 진화 알고리즘인 Cartesian Genetic Programming(CGP)을 이용한 파킨슨병(PD) 조기 진단 분류기를 제안한다. CGP는 인공신경망(ANN)과 서포트 벡터 머신(SVM)과 비교했을 때 유사한 정확도를 보였으며, 특히 무증상(Prodromal) PD와 정상 대조군을 75 % 이상의 정확도로 구분했다. CGP는 모델 해석이 용이해 바이오마커 후보를 식별하는 데 장점을 제공한다.
상세 분석
이 논문은 파킨슨병의 조기 진단을 목표로, 휴식기 기능적 MRI(resting‑state fMRI)와 동적 인과 모델링(DCM)으로부터 추출한 기능적 연결성(feature)을 분류하는 새로운 접근법을 제시한다. 핵심 기술은 Cartesian Genetic Programming(CGP)이라는 진화 알고리즘이다. CGP는 프로그램 트리를 2‑차원 격자 형태로 표현하고, 변이와 교차 연산을 통해 최적의 분류 함수를 진화시킨다. 기존의 블랙박스 모델인 인공신경망(ANN)과 서포트 벡터 머신(SVM)과 달리, CGP는 각 노드가 어떤 입력 변수를 사용하고 어떤 연산을 수행하는지 명시적으로 드러내므로, 모델 해석이 비교적 직관적이다.
데이터는 PPMI(Parkinson’s Progression Markers Initiative)에서 수집한 3개의 군집—정상 대조군, 무증상(PD prodromal) 환자, 임상적 PD 환자—으로 구성되었다. 각 피험자에 대해 전처리된 fMRI 시계열을 기반으로 90개 뇌 영역(Automated Anatomical Labeling atlas) 간의 상관 행렬을 계산하고, 이를 DCM을 통해 인과적 연결성 매개변수로 변환하였다. 두 종류의 피처(시계열 상관 행렬과 DCM 파라미터)를 별도로 입력해 CGP, ANN, SVM을 학습시켰다.
평가 방법은 10‑fold 교차 검증을 적용했으며, 주요 성능 지표는 정확도, 민감도, 특이도였다. 결과는 다음과 같다.
- Prodromal PD vs. 정상: CGP 75.21 % (ANN 73.8 %, SVM 74.5 %)
- 임상 PD vs. Prodromal PD: CGP 85.87 % (ANN 84.3 %, SVM 85.1 %)
- 임상 PD vs. 정상: CGP 92.09 % (ANN 91.4 %, SVM 91.7 %)
특히 무증상 환자를 정상군과 구분하는 정확도가 75 %를 초과한 점은 현재 임상에서 신뢰도가 낮은 prodromal PD 진단에 큰 의미를 가진다. 또한, CGP가 제공하는 프로그램 트리 구조를 통해 어떤 뇌 영역 간 연결이 분류에 기여했는지를 추적할 수 있었으며, 이는 잠재적 바이오마커 후보를 도출하는 데 직접 활용될 수 있다.
한계점으로는 샘플 수가 제한적이며, 다중 센터 데이터에 대한 일반화 검증이 부족하다는 점이다. 또한, CGP의 연산 복잡도가 높은 편이라 대규모 데이터셋에 적용하려면 효율적인 병렬화가 필요하다. 향후 연구에서는 더 많은 피험자를 포함한 다기관 데이터와, 다른 진화 알고리즘(예: 유전 프로그래밍, 진화 전략)과의 비교를 통해 모델의 견고성을 검증할 계획이다.
댓글 및 학술 토론
Loading comments...
의견 남기기