감정 기반 EEG를 이용한 딥러닝 인물 식별: CNN‑GRU와 CNN‑LSTM 비교 연구

본 논문은 감정 유발 영상 시청 중 기록된 DEAP 데이터셋의 EEG를 활용해 인물 식별(Person Identification)을 수행한다. 공간 정보를 추출하기 위해 2‑D 메시 형태로 배열한 32채널 EEG에 CNN을 적용하고, 시간 정보를 모델링하기 위해 RNN(LSTM·GRU)을 결합한 CNN‑RNN 구조를 제안한다. CNN‑GRU와 CNN‑LSTM 두 모델을 비교 실험했으며, 40명의 피험자에 대해 10‑초 길이의 데이터만 사용해 평…

저자: Theerawit Wilaiprasitporn, Apiwat Ditthapron, Karis Matchaparn

감정 기반 EEG를 이용한 딥러닝 인물 식별: CNN‑GRU와 CNN‑LSTM 비교 연구
본 논문은 감정 유발 영상 시청 중에 기록된 EEG 신호를 이용해 개인 식별(Person Identification, PI) 시스템을 구현하고, 딥러닝 기반의 공간·시간 모델링이 감정 상태에 따른 변동을 최소화할 수 있음을 입증한다. 연구 배경으로는 기존 EEG‑PI가 주로 운동 과제나 시각 자극 등 특정 정신 작업에 의존했으며, 감정 상태가 변하면 식별 정확도가 저하된다는 점을 들었다. 이러한 문제를 해결하기 위해 저자들은 최신 감정 데이터셋인 DEAP를 선택했으며, 32명의 피험자가 40개의 음악 비디오를 시청하면서 EEG를 기록한 데이터를 활용하였다. 데이터 전처리 과정은 다음과 같다. 원본 신호를 128 Hz로 다운샘플링하고, ICA를 이용해 눈동자 움직임을 제거하였다. 이후 4–45 Hz 대역통과 필터를 적용하고, 전통적인 θ, α, β, γ 대역으로 분리하였다. 전극은 평균·분산 정규화를 거쳐 9 × 9 2‑D 메시 형태로 재배열했으며, 채널이 없는 위치는 0으로 채워 CNN 입력으로 사용하였다. 각 60 초 영상 시청 데이터는 10 초 구간(1280 샘플)으로 나누고, 1 초 슬라이딩 윈도우를 적용해 6개의 서브샘플을 만든 뒤, 5개의 영상(총 30개 서브샘플)으로 구성하였다. 모델 설계는 두 단계로 이루어진다. 첫 단계는 CNN으로, 2‑D 메시 형태의 EEG를 입력받아 공간적 특징을 추출한다. 컨볼루션 레이어와 풀링 레이어를 여러 층 쌓아 전극 간 상관관계를 학습하고, 최종적으로 1‑D 피처 벡터를 만든다. 두 번째 단계는 RNN으로, 이 피처 벡터를 시간 순서대로 입력해 temporal dynamics를 모델링한다. 여기서는 두 종류의 순환 유닛을 각각 적용한 CNN‑LSTM과 CNN‑GRU 모델을 구현했다. LSTM은 입력·포겟·출력 게이트와 셀 상태를 통해 장기 의존성을 포착하고, GRU는 업데이트·리셋 게이트만으로 구조를 단순화해 파라미터 수와 학습 시간을 절감한다. 실험은 10‑fold 교차 검증(stratified)으로 진행했으며, 훈련·검증·테스트 비율을 각각 80 %·10 %·10 %로 설정했다. 동일한 데이터 분할을 사용해 SVM 기반 PSD 특징 추출 방법과 비교했으며, SVM은 평균 94 % 수준의 CRR을 보였다. 반면, CNN‑GRU는 99.90–100 %의 평균 CRR을 달성했으며, CNN‑LSTM도 99.80–99.95 %로 높은 성능을 보였다. 특히, 전극 수를 32개에서 전두엽 5개(Fp1, Fp2, F3, F4, Cz 등)로 줄였을 때도 CNN‑GRU는 99.17 %의 CRR을 유지해 실용적인 착용형 디바이스 적용 가능성을 시사한다. 감정 상태별 성능 분석에서는 네 가지 감정 조합(저가치·저각성 LL, 저가치·고각성 LH, 고가치·저각성 HL, 고가치·고각성 HH) 모두에서 높은 정확도를 기록했으며, 감정에 따른 성능 차이가 미미했다. 이는 CNN‑RNN 구조가 공간·시간 정보를 동시에 학습함으로써 감정에 의한 EEG 변동을 내재된 특징으로 흡수했기 때문이다. 주요 기여는 다음과 같다. (1) 감정 기반 EEG를 이용한 PI 연구를 최초로 딥러닝으로 수행했다. (2) CNN‑GRU가 CNN‑LSTM보다 약간 높은 정확도와 빠른 학습 속도를 보였다. (3) 전극 수를 최소화해도 높은 성능을 유지함으로써 실제 적용 가능성을 높였다. (4) 감정 상태에 따른 성능 변동을 효과적으로 억제했다. 한계점으로는 실험 대상이 DEAP 데이터셋의 40명에 국한돼 있어 대규모 인구에 대한 일반화 검증이 부족하고, 10 초 짧은 구간만 사용했기 때문에 장시간 연속 인증 시나리오에서의 안정성 검증이 필요하다. 또한, 다른 뇌파 대역(예: 고주파 γ)이나 멀티모달(EEG+EMG) 결합에 대한 탐색이 이루어지지 않았다. 향후 연구에서는 다양한 데이터셋과 실시간 스트리밍 환경에서의 테스트, 전이학습 및 데이터 증강 기법을 적용해 소량 데이터 상황에서도 견고한 성능을 확보하는 방안을 모색할 수 있다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기