EEG 채널 상호작용을 활용한 희소 베이지안 모델, P300 BCI 성능 혁신

본 논문은 EEG 채널 간 상호작용을 명시적으로 모델링하고, 완화된 임계값을 적용한 Gaussian Process(RTGP) 사전으로 구조적 희소성을 부여한 시간 가변 회귀 프레임워크를 제안한다. 55명의 참가자를 대상으로 한 P300 스펠러 데이터에 적용했을 때, 전체 자극 시퀀스 사용 시 중위 문자 정확도가 100%에 도달했으며, 채널 상호작용을 포함한 모델이 기존 통계·딥러닝 방법보다 최고 성능을 보였다. 특히 알코올 섭취를 하지 않은 그…

저자: Guoxuan Ma, Yuan Zhong, Moyan Li

EEG 채널 상호작용을 활용한 희소 베이지안 모델, P300 BCI 성능 혁신
본 논문은 EEG 기반 P300 스펠러 BCI의 성능을 향상시키기 위해, 채널 간 상호작용을 명시적으로 포함하고 구조적 희소성을 부여하는 베이지안 시간‑가변 회귀 모델을 제안한다. 서론에서는 P300 BCI가 시각‑청각 자극에 대한 ERP를 이용해 비운동성 의사소통을 가능하게 하지만, 고차원·시간 의존적인 EEG 데이터와 채널 간 복잡한 상호작용 때문에 정확도와 효율성이 제한된다고 지적한다. 기존 연구는 주로 채널을 독립적으로 다루거나, 블랙박스 딥러닝 모델에 의존해 해석 가능성이 낮으며, 채널 상호작용을 두 단계로 추정하는 방식이 EEG 특성에 부합하지 않는다며 문제점을 제시한다. 데이터는 55명의 피험자를 대상으로 한 공개 P300 스펠러 데이터셋을 사용한다. 각 피험자는 캘리브레이션 단계에서 여러 문자 입력을 수행하고, 32채널, 1200 ms 구간을 0~1200 ms 사이에 100 Hz 정도로 샘플링한 EEG를 기록한다. 각 자극은 목표(타깃)와 비목표(비타깃)로 라벨링되며, 한 문자 선택에 15개의 자극 시퀀스(각 시퀀스는 12개의 플래시)가 포함된다. 관련 연구에서는 SWLDA, ICA‑SVM, EEGNet 등 다양한 통계·머신러닝·딥러닝 접근법을 검토하고, 베이지안 스파스 모델, Riemannian 기반 방법, GLASS 등 채널 상관성을 활용한 최신 방법을 소개한다. 그러나 대부분은 채널 간 직접적인 상호작용을 회귀 변수로 포함하지 않거나, 비선형 관계를 포착하지 못한다는 한계를 지적한다. 제안 모델은 다음과 같은 핵심 구성 요소를 갖는다. 1) 입력 피처: 각 채널 k의 시계열 X_{ki}(t)와 채널 쌍(k₁,k₂) 사이의 피셔 Z‑변환 Pearson 상관계수 Z_i(k₁,k₂). 2) 회귀식: 로짓(또는 프로빗) 링크를 사용해 목표 확률을 예측하며, 채널별 시간 가중치 β_k(t)와 채널 쌍 상호작용 가중치 ζ(k₁,k₂)를 포함한다. 3) 사전: β와 ζ에 각각 완화된 임계값 Gaussian Process(RTGP) 사전을 부여한다. RTGP는 기존 soft/hard thresholded GP의 희소성 유지와 계산 효율성을 동시에 제공한다. 구체적으로, 원본 GP f(x)~GP(0,κ)에 백색 잡음 ξ²를 더한 ˜f(x)~N(f(x),ξ²)를 만든 뒤, |˜f(x)|>ω인 경우에만 f(x)를 유지하는 완화 임계값 함수를 적용한다. ω와 ξ는 하이퍼파라미터로, 희소성 정도와 부드러움을 조절한다. 베이지안 추론은 Gibbs 샘플링 기반 MCMC로 수행한다. RTGP 사전 덕분에 β와 ζ의 전체 조건부 사후가 닫힌 형태를 갖게 되어, 대규모 EEG(32채널·~200시간 포인트)에서도 효율적인 샘플링이 가능하다. 각 피험자마다 독립 모델을 학습함으로써 개인 맞춤형 파라미터를 얻고, 테스트 단계에서는 사후 평균을 이용해 목표 확률을 계산한다. 실험에서는 제안 모델을 (i) 기존 통계 모델(SWLDA, LDA, Ridge), (ii) 머신러닝 모델(SVM, Random Forest), (iii) 딥러닝 모델(EEGNet, ConvNet)과 비교하였다. 평가 지표는 문자 수준 정확도, BCI‑Utility(속도·정확도 종합), 그리고 자극 시퀀스 수에 따른 정확도 변화를 포함한다. 결과는 다음과 같다. 전체 55명에 대해 15시퀀스 사용 시 중위 문자 정확도가 100%에 도달했으며, 이는 모든 비교 모델을 능가한다. 채널 상호작용을 포함한 모델은 평균 정확도가 2~7% 상승했으며, 특히 알코올 섭취를 하지 않은 피험자군에서는 최대 18% 향상이 관찰되었다. BCI‑Utility 측면에서는 최적 운영점(7번째 시퀀스)에서 약 10% 향상이 확인되었으며, 이는 실제 입력 속도를 크게 개선한다는 의미다. 또한, 사후 β_k(t)와 ζ(k₁,k₂) 값을 시각화함으로써, 어떤 채널·시간 구간과 어떤 채널 쌍이 목표 구분에 기여하는지 해석 가능하게 했다. 예를 들어, FC2와 PO3 사이의 ζ 값이 크게 양수인 경우는 시각‑주의 네트워크가 활성화된 것으로 해석되며, 이는 기존 신경과학 연구와 일치한다. 논문의 한계로는 (1) 피험자별 독립 모델링으로 인해 대규모 사용자 베이스에 대한 일반화가 제한되고, (2) 상호작용 변수를 Pearson 상관계수 기반으로 정의함으로써 비선형·비정상적 연결성을 충분히 포착하지 못할 가능성이 있다. 향후 연구에서는 그래프 라플라시안, 위상 동기화 등 복합적인 연결성 지표와 딥 베이지안 구조를 결합해 보다 풍부한 상호작용을 모델링하고, 메타‑학습을 통해 다수 피험자에 대한 공동 사전 학습을 시도할 계획이다. 결론적으로, 이 연구는 구조적 희소성을 갖는 베이지안 프레임워크 안에서 EEG 채널 간 상호작용을 명시적으로 모델링함으로써, P300 BCI의 정확도와 효율성을 동시에 향상시키고, 해석 가능성을 제공한다는 점에서 BCI 연구 및 실용 시스템 설계에 중요한 기여를 한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기