유전 프로그래밍 기반 EEG 특징 구축으로 수면 파형 자동 분류
본 논문은 EEG 신호에서 수면 스핀들 및 K‑컴플렉스와 같은 구조를 자동으로 식별하기 위해 유전 프로그래밍(GP)을 이용한 특징 구축 및 차원 축소 프레임워크를 제안한다. 75개의 원본 특성으로부터 평균 12개의 비선형 조합 특성을 생성하고, 5가지 분류기(AUC 기준)와 비교 실험을 통해 기존 PCA 혹은 전체 특성보다 높은 성능을 달성하였다. 또한, 가장 많이 활용된 특성을 분석해 채널 수를 하나로 줄일 수 있음을 시사한다.
저자: Icaro Marcelino Mir, a, Claus Aranha
본 논문은 수면 단계에서 중요한 전형적 파형인 수면 스핀들(Sleep Spindle)과 K‑컴플렉스(K‑Complex)를 EEG 신호로부터 자동 검출하기 위한 새로운 프레임워크를 제시한다. 기존 연구에서는 전문가의 시각적 검토에 의존하거나, 선형 차원 축소(PCA)·전통적인 특징 선택에 의존해 높은 차원의 원본 특성을 그대로 사용했다. 그러나 EEG는 비정상적이고 비정상적인 잡음, 비정상성, 높은 상관성을 갖는 복합 신호이므로, 비선형적인 특징 조합이 필요하다는 점에서 한계가 있었다.
이를 해결하기 위해 저자들은 유전 프로그래밍(GP)을 활용해 원본 특성으로부터 새로운 비선형 조합 특성을 자동으로 생성하고, 동시에 차원을 축소하는 방법을 고안하였다. GP 트리는 입력 노드(원본 75개 특성)와 연산자 노드(+, –, ×, 보호 연산자 /, ln, sqrt)로 구성되며, 특수 연산자 F를 사용해 서브트리를 마킹함으로써 하나의 트리 안에 여러 새 특성을 정의한다. 이렇게 생성된 특성 집합은 각 세대마다 선택된 분류기에 학습시켜 ROC‑AUC 값을 적합도로 사용한다. AUC를 적합도로 채택한 이유는 데이터가 심하게 불균형(스핀들·K‑컴플렉스는 전체 샘플의 소수)하기 때문에 정확도보다 민감도·특이도 균형을 평가하는 ROC‑AUC가 더 신뢰할 수 있기 때문이다.
데이터는 DREAMS 프로젝트에서 제공한 수면 스핀들·K‑컴플렉스 레코드(30분, 3채널, 샘플링 50~200 Hz)를 사용했다. 모든 레코드는 256 Hz로 보간 후 디지털 웨이블릿 변환(DWT) 5단계로 분해했으며, 각 레벨·채널마다 평균, 표준편차, 대칭도, 전력 스펙트럼 밀도(PSD), 곡선 길이 5가지 통계량을 계산해 총 75개의 실수형 특성을 얻었다. 이후 2초 길이의 윈도우로 슬라이딩하여 900개의 샘플을 구성하였다.
GP 파라미터는 인구 500, 최대 트리 깊이 12, 교차 확률 0.9, 돌연변이 확률 0.1, 50세대까지 진행했으며, 연산 비용을 줄이기 위해 초기 세대에서 무작위 특성 선택 비율을 높게 설정했다. 5가지 분류기(K‑Nearest Neighbors, Support Vector Machine, Random Forest, Gradient Boosting, Logistic Regression)를 각각 GP가 만든 특성 집합에 적용해 AUC를 측정하였다. 실험 결과, GP가 평균 12개의 비선형 특성을 도출했을 때, 전체 75개 특성 사용 시보다 AUC가 0.03~0.05p 상승했으며, PCA로 차원 축소한 29개 특성보다도 우수했다. 특히 Recall(민감도)과 Specificity(특이도)의 조화가 크게 개선돼, 실제 임상 적용 시 오진·누락 위험을 동시에 낮출 수 있음을 보여준다.
특징 중요도 분석에서는 중앙 채널(CZ 또는 C3)에서 파생된 PSD와 Curve Length가 가장 많이 사용되었으며, 다른 두 채널(FP1‑A1, O1‑A1)의 기여도가 낮았다. 이는 전극 수를 하나로 줄여도 동일한 검출 성능을 유지할 수 있음을 시사한다. 또한, GP가 만든 수식 자체가 해석 가능해, 어떤 원본 특성이 파형 검출에 핵심적인지 직관적으로 파악할 수 있다. 이는 ‘블랙박스’ 딥러닝 모델과 차별화되는 장점이며, 데이터 수집·전처리 단계에서 비용·시간을 절감하는 전략적 의사결정에 활용될 수 있다.
한계점으로는 GP 연산이 비교적 시간이 많이 소요돼 실시간 시스템에 바로 적용하기는 어려우며, 현재 사용된 데이터셋이 특정 병원·경로의 30분 기록에 국한돼 있어 일반화 검증이 필요하다. 향후 연구에서는 다양한 수면 단계·다양한 병리학적 상태를 포함한 대규모 데이터셋을 이용해 모델을 재학습하고, GPU 기반 병렬 GP 구현으로 연산 효율을 높이는 방안을 모색한다. 또한, GP와 딥러닝 기반 특징 추출을 결합해 하이브리드 모델을 개발함으로써 성능 한계를 더욱 확장할 수 있을 것으로 기대한다.
결론적으로, 본 논문은 유전 프로그래밍을 활용한 비선형 특징 구축이 EEG 기반 수면 파형 검출에서 차원 축소와 성능 향상을 동시에 달성할 수 있음을 실증하였다. 이는 임상 현장에서 전극 수를 최소화하고, 자동화된 정확한 파형 검출을 제공함으로써 수면 장애 진단 및 연구에 중요한 기여를 할 수 있다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기