그룹 공명 네트워크 학습 가능한 프로토타입과 다중 피험자 공명을 이용한 EEG 감정 인식

그룹 공명 네트워크 학습 가능한 프로토타입과 다중 피험자 공명을 이용한 EEG 감정 인식
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

EEG 기반 감정 인식에서 피험자 간 변동성을 줄이기 위해, 저자는 개인 EEG 동역학과 오프라인 그룹 공명을 결합한 그룹 공명 네트워크(GRN)를 제안한다. GRN은 (1) 밴드별 EEG 특징을 인코딩하는 개인 인코더, (2) 학습 가능한 그룹 프로토타입을 이용한 프로토타입 유도 공명, (3) 소규모 레퍼런스 집합과의 PLV·코히런스 기반 다중 피험자 공명 텐서를 포함한다. 세 가지 뷰를 공명 인식 융합 모듈로 결합해 최종 감정 분류를 수행한다. SEED와 DEAP 데이터셋에서 주제 의존 및 LOSO 교차 검증 모두에서 기존 최첨단 방법들을 능가했으며, 프로토타입 학습과 다중 피험자 공명 각각이 성능 향상에 기여함을 실험적으로 입증하였다.

상세 분석

본 논문은 EEG 감정 인식에서 가장 큰 난제 중 하나인 피험자 간 변동성(inter‑subject variability)을 완화하기 위해, 개인 수준의 신호 특성과 집단 수준의 동기화 정보를 동시에 활용하는 새로운 프레임워크인 그룹 공명 네트워크(Group Resonance Network, GRN)를 설계하였다. 기존 연구들은 주로 도메인 적응, 전이 학습, 혹은 피험자 불변 표현 학습에 초점을 맞추어 개별 피험자를 독립적인 도메인으로 취급했으며, 동일 자극에 대한 집단적 뇌 반응, 즉 stimulus‑locked group regularities를 충분히 활용하지 못했다. 이러한 배경에서 저자는 두 가지 핵심 아이디어를 도입한다. 첫째, 학습 가능한 프로토타입 집합을 도입해 전체 피험자군을 대표하는 잠재 공간을 형성한다. 각 샘플의 개인 임베딩 F와 M개의 프로토타입 pₘ 간의 유사도를 소프트 어텐션 αₘ으로 변환하고, 이를 가중합해 프로토타입 유도 공명 R=∑αₘpₘ을 만든다. 이는 “이 샘플이 어느 그룹 패턴에 가장 가까운가”를 명시적으로 모델링한다는 점에서 기존의 평균화 혹은 고정 프로토타입 방식보다 유연하고 표현력이 높다. 둘째, 실제 뇌 동기화 메트릭인 위상 잠금 값(Phase Locking Value, PLV)과 코히런스(Coherence)를 이용해 다중 피험자 공명 텐서 M∈ℝ^{K_r×C×C×2}를 구축한다. 여기서 K_r은 레퍼런스 피험자 수이며, 각 레퍼런스와 현재 샘플 사이의 PLV·CoH 행렬을 쌓아 만든다. 이 텐서는 “같은 자극을 본 다른 사람들과의 신경 동기화 정도”를 정량화하며, 얕은 2D CNN+풀링 기반 레진코더 ResEnc(·)를 통해 압축된 임베딩 G∈ℝ^d 로 변환된다.

세 가지 임베딩(F, R, G)은 차이(difference)와 공통성(commonality) 상호작용을 명시적으로 모델링하는 융합 모듈에 입력된다. 구체적으로 F−R, F−G (차이)와 F⊙R, F⊙G (공통) 를 계산하고, 이를 모두 concatenate한 뒤 MLP에 통과시켜 최종 감정 클래스 확률을 얻는다. 이 설계는 개인 고유 정보와 그룹 공명 정보를 동시에 보존하면서, 서로 보완적인 특징을 학습하도록 유도한다.

실험에서는 SEED(3‑class)와 DEAP(Valence/Arousal 2‑class) 두 벤치마크를 사용해 주제 의존(SD)와 LOSO(주제 독립, SI) 두 프로토콜을 모두 평가하였다. 하이퍼파라미터는 임베딩 차원 d=256, 프로토타입 수 M=8, 레퍼런스 수 K_r=3 으로 설정했으며, Adam 옵티마이저(1e‑4)와 교차 엔트로피 손실에 프로토타입 정규화 λL_proto 를 추가하였다. 결과는 GRN이 모든 비교 모델(DGCNN, ST‑DADGAT, FCANet, LATN, DVIE‑Net 등)을 능가했으며, 특히 LOSO 상황에서 1~2%p 정도의 절대 정확도 향상을 보였다.

Ablation 연구에서는 (i) 프로토타입만 사용, (ii) 다중 피험자 공명만 사용, (iii) 두 요소 모두 제거한 경우를 비교했다. 프로토타입만 사용했을 때 86.40%, 공명만 사용했을 때 86.85%의 정확도를 기록했으며, 두 요소를 모두 결합한 전체 모델은 87.90%로 최고 성능을 달성했다. 또한 프로토타입 정규화 없이 학습한 경우 약간의 성능 저하(87.35%)가 관찰돼 정규화의 필요성을 확인했다. K_r와 M에 대한 민감도 분석에서도 K_r=3, M=8이 최적이었지만, 15개의 레퍼런스와 412개의 프로토타입에서도 성능이 크게 변동하지 않아 모델의 안정성을 입증했다.

시각화된 혼동 행렬과 학습 곡선은 GRN이 클래스 간 균형 잡힌 예측을 유지하면서 과적합 없이 안정적으로 수렴함을 보여준다. 최종적으로 저자는 EEG 감정 인식에서 개인‑집단 이중 레벨의 공명 모델링이 피험자 간 변동성을 효과적으로 완화하고, 프로토타입 기반의 잠재 군집 구조와 실제 신경 동기화 메트릭을 결합함으로써 차세대 BCI 시스템에 유용한 새로운 패러다임을 제시했다고 결론짓는다.


댓글 및 학술 토론

Loading comments...

의견 남기기