EEG 기반 운전자 졸음 및 정신 작업 부하 분석을 위한 개선된 TSception

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 연구는 기존 TSception 모델에 다섯 단계의 계층적 시간 정제 레이어와 Adaptive Average Pooling(ADP), 두 단계 융합 메커니즘을 추가한 Modified TSception을 제안한다. SEED‑VIG 데이터셋에서 83.46%의 정확도와 0.24의 좁은 신뢰구간을 달성했으며, STEW 데이터셋에서는 2‑class 95.93%, 3‑class 95.35%의 최고 성능을 기록한다. 이러한 결과는 모델의 안정성 및 작업 간 일반화 능력이 크게 향상되었음을 보여준다.

상세 분석

Modified TSception은 기존 TSception이 갖는 세 개의 Temporal Convolution(Tception) 레이어를 다섯 개로 확장함으로써 시간 축에서의 다중 스케일 특징 추출 능력을 강화한다. 첫 세 레이어는 0.5 s, 0.25 s, 0.125 s의 윈도우를 커버하며, 추가된 두 레이어는 샘플링 레이트를 절반으로 낮춘 작은 커널을 사용해 급격한 알파 스핀들이나 세타 버스트와 같은 순간적 변화를 포착한다. 이러한 계층적 설계는 뇌파의 저주파와 고주파 동역학을 동시에 학습하게 하여 졸음 전이 단계와 정신 부하 변동을 정밀히 구분한다.

Adaptive Average Pooling(ADP)은 고정된 풀링 크기 대신 입력 길이와 채널 수에 관계없이 일정한 출력 차원을 보장한다. 특히 Temporal Layer 3에서 ADP를 적용함으로써 다양한 실험 환경(샘플링 레이트 차이, 채널 수 변동)에서도 특징 맵의 차원 불일치를 방지하고, 이후 Fusion 단계에 안정적인 입력을 제공한다. 이는 STEW와 같이 채널 구성이 다른 데이터셋에서도 모델이 동일한 구조로 동작하게 하는 핵심 요인이다.

두 단계 융합 메커니즘은 먼저 Spatial Convolution(Sception) 레이어에서 추출된 채널 간 상관관계를 통합하고, 이어서 1×1 포인트와이즈 컨볼루션을 이용해 채널 차원을 재조정한다. 이 과정은 공간 특징과 시간 특징 사이의 복합적인 상호작용을 학습하도록 설계돼, 단일 Fusion 레이어에 비해 과적합 위험을 낮추고 신뢰구간을 0.24로 축소하는 데 기여한다.

학습 측면에서는 LeakyReLU 활성화와 배치 정규화(BN)를 전 레이어에 적용해 그래디언트 소실을 방지하고, 0.5 드롭아웃을 통해 일반화를 촉진한다. 라벨 스무딩을 포함한 교차 엔트로피 손실 함수는 클래스 불균형을 완화한다. 하이퍼파라미터(필터 수 15, FC 은닉 유닛 64)는 비교적 경량이면서도 충분한 표현력을 제공한다.

실험 결과 SEED‑VIG에서 원본 TSception(83.15% ± 0.36) 대비 정확도는 미세하게 상승했지만 신뢰구간이 크게 감소해 실운용 시 안정성이 향상되었음을 확인한다. STEW 데이터셋에서는 2‑class 95.93%, 3‑class 95.35%라는 최고 수준의 정확도를 기록했으며, 이는 기존 CNN 기반 모델(최대 94% 수준)보다 현저히 우수하다. 특히 두 데이터셋 간 전이 성능이 뛰어난 점은 제안된 구조가 뇌파 신호의 보편적 패턴을 효과적으로 학습한다는 증거다.

한계점으로는 17채널, 200 샘플(1 s) 입력에 최적화돼 있어 고밀도 EEG나 장시간 연속 데이터에 대한 확장성이 검증되지 않았으며, 실시간 적용을 위한 연산량 분석이 부족하다. 또한, 데이터 증강이나 도메인 적응 기법을 결합하면 더욱 강인한 모델이 될 가능성이 있다.

EEG 기반 운전자 졸음 및 정신 작업 부하 분석을 위한 개선된 TSception

초록

상세 분석

댓글 및 학술 토론

의견 남기기