뇌전증 발작 탐지 및 예측을 위한 머신러닝 실시간 시스템

본 연구는 CHB‑MIT 두피 EEG 데이터베이스를 활용해 발작 탐지와 예측을 동시에 수행하는 머신러닝 모델을 개발하였다. 로지스틱 회귀는 90.9% 정확도와 89.6% 재현율을 달성했으며, LSTM 기반 예측 모델은 89.26% 정확도를 기록하였다.

뇌전증 발작 탐지 및 예측을 위한 머신러닝 실시간 시스템

초록

본 연구는 CHB‑MIT 두피 EEG 데이터베이스를 활용해 발작 탐지와 예측을 동시에 수행하는 머신러닝 모델을 개발하였다. 로지스틱 회귀는 90.9% 정확도와 89.6% 재현율을 달성했으며, LSTM 기반 예측 모델은 89.26% 정확도를 기록하였다.

상세 요약

본 논문은 기존의 발작 탐지 연구가 발작 발생 후에만 신호를 인식하는 한계를 지적하고, 사전 예측을 포함한 통합 프레임워크를 제안한다는 점에서 의미가 크다. 데이터셋은 CHB‑MIT Scalp EEG Database로, 23명의 약물 저항성 소아·청년 환자로부터 969시간, 173건의 발작을 포함한다. 이 데이터는 23채널 256Hz 샘플링으로 수집되었으며, 전처리 단계에서 밴드패스 필터링(0.5‑40 Hz)과 아티팩트 제거가 수행되었다. 특징 추출은 시간 영역(평균, 표준편차, RMS)과 주파수 영역(파워 스펙트럼, 밴드 파워)으로 구성되었으며, 각 채널별로 30개의 특성을 도출해 총 690개의 피처 벡터를 생성하였다.

감독 학습 모델로는 K‑Nearest Neighbors, Logistic Regression, Random Forest, Support Vector Machine을 비교하였다. Logistic Regression은 클래스 불균형을 고려한 가중치 조정과 L2 정규화를 적용해 90.9% 정확도와 89.6% 재현율을 달성했으며, 이는 임상 스크리닝에 적합한 균형 잡힌 성능을 의미한다. 반면 Random Forest와 SVM은 정확도는 94%에 달했지만 재현율이 0%로, 발작을 전혀 탐지하지 못했다는 점에서 정확도만으로 모델을 평가하는 위험성을 강조한다. 이는 클래스 비율이 1:5 이상 차이 나는 상황에서 정밀도·재현도와 같은 지표가 필수임을 보여준다.

예측 모델은 LSTM(Long Short‑Term Memory) 네트워크를 사용했으며, 시계열 특성을 포착하기 위해 5초 길이의 윈도우를 0.5초 간격으로 슬라이딩하였다. 입력은 23채널의 원시 전압값을 정규화한 시퀀스로, 2개의 LSTM 레이어(각 128 유닛)와 0.5의 드롭아웃을 거쳐 전결합 레이어와 시그모이드 출력으로 구성되었다. 학습에는 Adam 옵티마이저와 binary cross‑entropy 손실 함수를 사용했으며, 조기 종료와 클래스 가중치를 적용해 과적합을 방지하였다. 결과적으로 89.26%의 정확도와 0.84의 AUC를 기록했으며, 발작 전 30초~5분 구간의 전조 신호를 효과적으로 구분했다는 점에서 실시간 예측 가능성을 입증한다.

또한 논문은 모델 경량화와 실시간 구현을 위한 전략을 논의한다. Logistic Regression은 파라미터 수가 적어 모바일 디바이스에서도 실시간 추론이 가능하고, LSTM은 TensorFlow Lite 변환 후 10 ms 이하의 추론 지연을 보였다. 이러한 구현 가능성은 환자 개인용 웨어러블 디바이스에 직접 탑재될 수 있음을 시사한다.

전체적으로 본 연구는 발작 탐지와 예측을 동시에 다루는 최초의 통합 접근법을 제시하고, 클래스 불균형 문제에 대한 적절한 평가 지표 사용의 중요성을 강조한다. 향후 연구에서는 다중 센서 융합, 환자 맞춤형 모델링, 그리고 장기적인 임상 시험을 통해 실제 치료 효과를 검증할 필요가 있다.


📜 논문 원문 (영문)

🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...