뇌파 기반 감정 인식 고성능 머신러닝
초록
**
본 연구는 DEAP 데이터셋의 EEG 신호를 이산 웨이브릿 변환(DWT)으로 γ, β, α, θ 네 대역으로 분해하고, 각 대역에서 엔트로피와 에너지 스펙트럼 특징을 추출한다. 추출된 10채널(주로 전두부) 특징에 대해 차원 축소 없이 주성분 분석(PCA)으로 상관성을 제거한 뒤, RBF 커널 SVM, K‑NN, ANN을 8‑fold 교차검증으로 학습한다. β 대역에서 10채널을 이용한 SVM이 아러전(91.3%)과 밸런스(91.1%) 모두에서 최고 정확도를 달성하였다. 기존 연구 대비 5~10%p 향상된 성능을 보이며, 실시간 응용에 적합한 채널 수와 윈도우 길이(4 s) 선택을 제시한다.
**
상세 분석
**
본 논문은 감정 인식을 위한 EEG 기반 머신러닝 파이프라인을 체계적으로 설계하고, 각 단계에서 선택된 방법론이 최종 성능에 미치는 영향을 정량적으로 분석한다. 첫째, 데이터는 DEAP 데이터베이스(32명, 40개 비디오 클립, 512 Hz)에서 전통적인 valence‑arousal 2‑차원 라벨을 사용하였다. 라벨링 기준은 4.5를 기준으로 고·저를 구분했으며, 이는 기존 연구와 동일한 방식이다. 둘째, 채널 선택은 전두엽 좌·우 대칭 페어(F3‑F4, F7‑F8, FC1‑FC2, FC5‑FC6, FP1‑FP2)를 기반으로 하였으며, 전두부 비대칭성이 감정 처리와 연관된다는 신경과학적 근거를 제시한다. 실험 결과 F3‑F4 쌍이 가장 높은 정확도를 보였으며, 이는 전두극 전위 차이가 정서적 각성과 직접 연관됨을 뒷받침한다.
셋째, 전처리 단계에서는 평균 참조(AMR)와 0‑1 정규화를 적용해 개인 간 전압 차이를 최소화하였다. 이는 고차원 특징 공간에서 클래스 간 경계가 명확해지는 효과를 가져온다. 넷째, 특징 추출은 db4 모레 웨이브릿을 이용해 5대역(θ, α, β, γ, noise)으로 신호를 분해하고, 각 윈도우(2 s·50% 중첩, 4 s·50% 중첩)에서 엔트로피와 에너지 두 가지 통계량을 계산하였다. 엔트로피는 정보량을, 에너지는 파워 스펙트럼을 대변하므로, 두 특징을 결합하면 시간‑주파수 복합 정보를 효과적으로 포착한다.
다섯째, PCA는 차원 축소 없이 전체 특징을 변환해 상관성을 제거했으며, 이는 SVM의 마진 최적화에 유리하게 작용한다. 차원 축소를 하지 않은 이유는 원본 특징이 이미 충분히 압축돼 있어 정보 손실 위험이 낮다고 판단했기 때문이다.
여섯째, 분류기 설계에서는 RBF 커널 SVM, K‑NN(k=5), 3‑계층 ANN(ReLU‑ReLU‑Sigmoid)을 8‑fold 교차검증으로 평가하였다. SVM은 고차원 비선형 경계 형성에 강점이 있어, 특히 β 대역에서 91.3%(arousal)와 91.1%(valence)의 최고 정확도를 기록했다. K‑NN과 ANN은 각각 70~80% 수준에 머물렀으며, 이는 특징 공간이 비선형이지만 SVM에 비해 일반화 능력이 떨어짐을 시사한다.
일곱째, 윈도우 길이와 채널 수에 대한 실험 결과, 4 s 윈도우가 2 s보다 일관되게 높은 정확도를 보였으며, 이는 더 긴 시간 구간이 감정 상태의 변동성을 포착하는 데 유리함을 의미한다. 또한, 전체 10채널을 사용했을 때와 단일 채널 쌍을 사용했을 때의 차이는 크지 않아, 실시간 시스템 구현 시 연산 비용을 크게 절감할 수 있다.
마지막으로, 본 연구는 기존 DEAP 기반 연구(최고 86.7% 정확도)와 비교해 약 5~10%p 향상을 달성했으며, 향후 ICA, LDA와 같은 차원 축소 기법, 랜덤 포레스트·딥러닝·RNN 등 더 복잡한 분류기의 적용 가능성을 제시한다. 실시간 자율주행 차량이나 뇌‑컴퓨터 인터페이스와 같은 응용 분야에 바로 활용할 수 있는 실용적인 결과를 제공한다.
**
댓글 및 학술 토론
Loading comments...
의견 남기기