뇌‑컴퓨터 인터페이스 성능 향상을 위한 조건부 딥 컨볼루션 GAN 기반 데이터 증강
초록
본 논문은 제한된 EEG 훈련 샘플 문제를 해결하고자 조건부 딥 컨볼루션 생성적 적대 신경망(cDCGAN)을 활용해 인공 뇌파 데이터를 자동 생성한다. BCI Competition의 운동 상상 데이터셋에 적용해, 생성된 인공 EEG가 원본 데이터와 동등하거나 더 높은 분류 정확도를 보이며, 제한된 훈련 데이터 상황에서 실제 성능 향상을 입증하였다.
상세 분석
본 연구는 뇌‑컴퓨터 인터페이스(BCI) 분야에서 가장 큰 병목 중 하나인 훈련 샘플의 부족을 데이터 증강이라는 관점에서 접근한다. 기존의 전통적 증강 기법(시간 이동, 잡음 추가 등)은 EEG 신호의 복잡한 시공간 구조를 충분히 보존하지 못한다는 한계가 있다. 이에 저자들은 조건부 딥 컨볼루션 GAN(cDCGAN)을 설계하여, 클래스 레이블(예: 좌우 손 움직임)과 함께 Gaussian 노이즈를 입력으로 받아, 실제 뇌파와 구별이 어려운 고품질 합성 신호를 생성한다.
네트워크 구조는 DCGAN의 기본 아이디어를 차용하되, 1‑D 컨볼루션 레이어를 사용해 시계열 특성을 유지한다. 생성기(Generator)는 입력 노이즈와 레이블을 결합한 후, 여러 층의 전치 컨볼루션(transposed convolution)으로 4초 길이, 22채널(EEG 전극) 데이터를 복원한다. 판별기(Discriminator)는 실제 EEG와 합성 EEG를 동시에 입력받아, 진위와 레이블을 동시에 판단하도록 설계되었다. 조건부 구조를 도입함으로써, 특정 운동 상상 클래스에 맞는 신호를 목표로 생성할 수 있다.
학습 과정에서는 Wasserstein GAN with Gradient Penalty(WGAN‑GP)를 변형해 안정성을 높였으며, 라벨 손실과 진위 손실을 가중합한 복합 손실 함수를 사용한다. 데이터 전처리 단계에서는 밴드패스 필터링(8–30 Hz)과 정규화를 수행해 신호의 잡음 비율을 감소시켰다. BCI Competition IV‑2a 데이터셋(4개의 클래스, 9명 피험자, 22채널)을 실험에 사용했으며, 훈련 샘플을 10 % 수준으로 제한한 뒤, 생성된 인공 데이터를 원본 데이터와 결합해 CNN 기반 분류 모델을 재학습시켰다.
실험 결과는 두 가지 관점에서 의미가 있다. 첫째, 생성된 인공 EEG만으로도 테스트 셋에서 원본 데이터와 동등한 정확도를 달성했으며, 이는 cDCGAN이 EEG의 시공간 패턴을 충분히 학습했음을 시사한다. 둘째, 제한된 원본 데이터에 인공 데이터를 추가했을 때, 평균 분류 정확도가 약 3–5 % 상승하였다. 특히 피험자별 데이터가 극히 적은 경우(예: 5 % 훈련 비율)에는 성능 격차가 더 크게 나타났다.
한계점으로는 생성기와 판별기의 구조가 비교적 얕아 복잡한 뇌파 변이성을 완전히 포착하지 못할 가능성이 있다. 또한, 현재는 단일 세션(같은 실험 조건) 내에서만 검증했으며, 세션 간 변동성이나 다른 BCI 과제(예: P300, SSVEP)로의 일반화는 추가 연구가 필요하다. 향후 연구에서는 더 깊은 1‑D ResNet 기반 GAN, 도메인 적응 기법, 그리고 실시간 온라인 BCI 시스템에의 적용을 탐색할 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기