EEG 기반 파운데이션 모델의 현황과 향후 과제
초록
EEG 데이터를 라벨 없이 학습하는 파운데이션 모델(EEG‑FM)의 초기 연구 10편을 분석해 입력 표현, 자기지도 학습 방식, 평가 전략을 비교하였다. 대부분이 트랜스포머 기반 시퀀스 모델에 마스크 재구성(pre‑text) 과제를 적용했으며, 평가가 데이터셋·태스크마다 달라 실용성을 판단하기 어렵다. 향후 표준화된 벤치마크와 규모 확대, 신뢰성·해석가능성 확보가 필요하다.
상세 분석
본 리뷰는 EEG‑FM을 세 가지 핵심 ‘기둥’(입력 데이터 표현, SSL(pre‑text) 설계, 평가 전략)으로 구조화하고, 2021‑2024년 사이 발표된 10개의 초기 모델을 체계적으로 비교하였다. 입력 표현 측면에서는 대부분이 원시 시계열(채널 × 시간) 그대로를 토큰화해 트랜스포머에 투입했으며, 일부는 스펙트럼 혹은 공분산 행렬 등 변형된 형태를 사용했다. 변형 입력이 제공하는 주파수·연결성 정보를 명시적으로 학습하도록 설계했음에도, 현재는 변형 입력이 성능에 미치는 영향에 대한 정량적 보고가 부족하다.
SSL 설계는 주로 마스크드 시퀀스 재구성(Masked Modeling) 방식에 집중돼 있다. 마스크 비율, 마스크 형태(연속 vs. 랜덤), 재구성 손실(L2, L1, 혹은 스펙트럼 손실) 등 세부 설정이 모델마다 크게 다르며, 이러한 차이가 최종 임베딩의 특성(시간적 연속성 vs. 주파수 구조)과 downstream task 성능에 미치는 영향을 체계적으로 분석하지 못하고 있다. 대조적(pre‑text) 과제로는 인포맥스 기반 대비 학습이 일부 모델에 도입됐지만, 아직은 소수에 불과하다.
평가 전략은 가장 큰 약점으로 지적된다. 각 논문이 제시한 downstream task가 다르고, 사용된 공개 데이터셋(예: TUH, SEED, BCI‑IV 등)도 상이해 직접적인 성능 비교가 불가능하다. 또한, 평가 지표가 정확도·F1에 국한돼 있어 모델의 일반화·견고성(노이즈, 채널 결손, 도메인 이동) 및 해석가능성(시각화, 뇌생리학적 연관성)까지 포괄하지 못한다. 일부 연구는 작은 규모의 파인튜닝 실험만 수행했으며, 대규모 파라미터 스케일링(예: 1B 파라미터)과 데이터 스케일링(수천 시간 이상)에서 나타나는 스케일 효과를 입증하지 못했다.
이러한 분석을 토대로 저자는 다음과 같은 핵심 인사이트를 도출한다. ① 입력 표현 단계에서 도메인 지식(주파수 밴드, 공간 연결성)을 반영한 표준화된 전처리 파이프라인이 필요하다. ② SSL 프리텍스트 과제는 마스크 재구성 외에 대조 학습, 시계열 예측, 멀티모달(EEG + 영상·음성) 연계 등 다양화가 요구된다. ③ 평가 체계는 공통 벤치마크(다중 데이터셋·다중 태스크), 견고성 테스트(노이즈·채널 손실·도메인 적응), 그리고 해석 가능성 검증(특징·뇌파 패턴 매핑)을 포함해야 한다. ④ 모델 규모와 데이터 규모의 상관관계를 체계적으로 조사해 ‘스케일링 법칙’이 존재하는지 검증해야 한다. ⑤ 오픈소스 툴킷과 표준화된 API 제공을 통해 연구자·임상의 협업을 촉진하고, 실제 임상 워크플로우에 적용 가능한 파운데이션 모델을 구축해야 한다.
댓글 및 학술 토론
Loading comments...
의견 남기기