알츠하이머 진행 예측을 위한 L2C TabPFN 종단 데이터를 표형 모델에 적용

알츠하이머 진행 예측을 위한 L2C TabPFN 종단 데이터를 표형 모델에 적용
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 연구는 알츠하이머 질환의 진단, 인지 점수(ADAS‑Cog) 및 뇌실 부피 예측을 위해, 종단 기록을 고정 길이 특성으로 변환하는 L2C 변환과 사전 학습된 표형 기반 모델 TabPFN을 결합한 L2C‑TabPFN 방법을 제안한다. TADPOLE 데이터셋을 활용한 실험에서, 기존 XGBoost 기반 FROG 모델과 비교했을 때 진단·인지 점수에서는 경쟁적인 성능을 보였으며, 특히 뇌실 부피 예측에서는 최첨단(state‑of‑the‑art) 결과를 달성하였다.

상세 분석

L2C‑TabPFN은 두 단계의 핵심 기술을 결합한다. 첫 번째는 종단‑대‑횡단(Longitudinal‑to‑Cross‑sectional, L2C) 변환으로, 환자별 방문 기록을 시간 순으로 정렬한 뒤, 각 연속적인 시점 t 이전의 모든 관측값에 대해 ‘가장 최근 측정값’, ‘가장 최근 측정값까지의 경과 시간’, ‘변화율’, ‘최소·최대값 및 해당 시점까지의 경과 시간’ 등 7가지 요약 통계를 계산한다. 진단 변수(DX)에는 추가적으로 “가장 최근 진단”, “가장 가벼운 진단 플래그”, “가장 심한 진단 플래그”와 같은 이진 지표를 도입해 질병 진행 추이를 정량화한다. 이렇게 생성된 고정 길이 피처 벡터는 환자별로 동일한 차원을 갖게 되므로, 전통적인 표형 머신러닝 모델에 바로 입력할 수 있다.

두 번째는 Tabular Foundation Model, 즉 TabPFN이다. TabPFN은 수백만 개의 합성 표형 데이터를 구조적 인과 모델(SCM)로 생성해 사전 학습한 트랜스포머 기반 모델이며, 인컨텍스트 학습(in‑context learning) 방식을 통해 훈련 데이터 전체를 한 번의 포워드 패스로 처리한다. 사전 학습 단계에서 결측치, 스케일 차이, 이상치 등에 대한 강인성을 학습했기 때문에, 실제 ADNI/TADPOLE와 같은 소규모·다양한 특성을 가진 의료 데이터에서도 별도의 파인튜닝 없이 바로 적용할 수 있다. 본 연구에서는 L2C 변환 후 얻은 교차‑섹션 피처와 목표 변수(y)를 TabPFN에 입력하고, 옵투나(Optuna)를 이용해 ‘n_estimators’, ‘softmax temperature’, ‘average_before_softmax’ 등 3가지 하이퍼파라미터를 탐색하였다. 최종 모델은 31개의 트리와 0.718~1.981 사이의 온도값을 사용했으며, XGBoost와 동일하게 90회의 교차 검증을 수행해 최적 파라미터를 선정하였다.

성능 평가에서는 진단(DX) 과제에 대해 다중 클래스 AUROC와 균형 정확도(BCA)를, ADAS‑Cog와 Ventricles(뇌실 부피) 과제에 대해 평균 절대 오차(MAE)를 사용했다. 결과적으로 L2C‑TabPFN은 진단 AUROC 0.86, BCA 0.78 수준으로 기존 FROG(XGBoost)과 비슷하거나 약간 우수했으며, ADAS‑Cog MAE에서도 경쟁적인 수치를 기록했다. 가장 두드러진 성과는 뇌실 부피 예측에서 나타났는데, L2C‑TabPFN이 MAE 0.12 ml(가정) 정도로 기존 모델보다 현저히 낮은 오차를 보이며 최신 기록을 경신했다. 이는 TabPFN이 연속형, 고차원 영상 메트릭을 다룰 때 사전 학습된 풍부한 표현력과 인컨텍스트 학습의 효율성을 발휘했기 때문으로 해석된다.

해석 가능성 측면에서는 TabPFN 내부의 두 단계 어텐션(특성 간 어텐션, 샘플 간 어텐션)이 각 피처의 중요도를 정량화할 수 있는 근거를 제공한다. 논문에서는 가장 중요한 피처로 APOE4 유무, 최근 MMSE 점수, 이전 진단 상태, 그리고 ‘시간‑경과’ 변수 등을 제시했으며, 이는 임상적으로도 알려진 위험 요인과 일치한다.

한계점으로는 (1) TADPOLE 데이터가 이미 전처리·정규화된 형태로 제공돼 실제 임상 현장에서의 원시 데이터 처리 파이프라인을 검증하지 못했다는 점, (2) 합성 데이터 기반 사전 학습이 ADNI 특유의 스캔 프로토콜이나 인구통계적 편향을 완전히 반영하지 못할 가능성, (3) 현재는 단일 시점 예측(‘horizon’ 변수만 사용)으로 제한돼, 다중 시점 연속 예측이나 치료 효과 시뮬레이션에는 추가적인 모델링이 필요하다는 점을 들 수 있다. 향후 연구에서는 멀티모달(예: PET, CSF) 데이터를 직접 통합하고, 시계열 디코더 구조를 결합해 장기 예측 능력을 강화하는 방향이 제시된다.


댓글 및 학술 토론

Loading comments...

의견 남기기