다양한 데이터와 잡음 유형을 아우르는 ECG 잡음 탐지 일반화 연구
초록
본 논문은 HRV 기반 머신러닝 모델을 이용해 착용형 ECG 신호의 잡음 구간을 자동으로 식별하고, 네 개의 서로 다른 데이터셋을 교차 검증함으로써 모델의 일반화 능력을 입증한다. 랜덤 포레스트가 가장 높은 정확도(≈91%)와 AUPRC(>90%)를 달성했으며, 새롭게 라벨링된 데이터셋을 공개한다.
상세 분석
이 연구는 착용형 ECG에서 흔히 발생하는 근육 및 움직임 잡음에 초점을 맞추어, 기존 연구들이 단일 데이터셋에 국한된 한계를 극복하고자 한다. 네 개의 데이터셋(D1D4)은 실험실 제어 환경, 일상 생활, 장시간 기록, 그리고 저자 자체 수집 데이터로 구성되어 센서 종류(Shimmer, 단일 전극 등), 샘플링 레이트(360 Hz1024 Hz), 그리고 잡음 유형(근육, 움직임, 전원선 간섭 등)에서 큰 이질성을 보인다. 라벨링은 두 명의 숙련된 annotator가 “R‑peak가 명확히 보이지 않는 구간”을 잡음으로 정의해 20 초 윈도우(50 % 겹침) 단위로 수행했으며, 이는 인덱스 수준 라벨을 세그먼트 수준으로 변환한 것이다.
전처리 단계에서는 BioSPPy의 3–45 Hz 밴드패스와 이동 평균 필터를 적용해 기본 잡음을 억제하고, Hamilton segmenter를 이용해 정확한 R‑peak를 검출한다. 이후 NeuroKit2를 통해 RR 간격을 추출하고, 평균 NN, SDNN, RMSSD, pNN50 등 22개의 시간‑도메인 HRV 특성을 계산한다. 이 특성들은 짧은 구간에서도 신뢰할 수 있는 심박 변동 정보를 제공하므로, 잡음 여부를 판단하는 데 충분히 구별력을 가진다.
분류 모델로는 로지스틱 회귀, 서포트 벡터 머신, 결정 트리, 그래디언트 부스팅, 랜덤 포레스트, 그리고 ANN·CNN·VGG와 같은 딥러닝 구조를 비교했다. 교차 검증 결과, 랜덤 포레스트가 가장 일관된 성능을 보였으며, 특히 데이터셋 간 전이 학습(한 데이터셋에서 학습 후 다른 데이터셋에서 테스트)에서도 평균 정확도 91.1 %와 AUPRC 90 % 이상을 유지했다. 모든 데이터셋을 합쳐 학습한 경우 정확도는 93.6 %에 달했다. 이는 HRV 기반 특성이 센서와 잡음 유형에 강인함을 의미한다.
한계점으로는 시간‑도메인 HRV에만 의존함으로써 매우 짧은 순간 잡음(예: 1 s 이하)이나 비정상적인 리듬 변동과의 구분이 어려울 수 있다. 또한, 클래스 불균형 문제를 완화하기 위해 50 % 이상 잡음이 포함된 윈도우만을 잡음으로 라벨링했지만, 실제 임상 현장에서는 더 미세한 잡음도 영향을 미칠 수 있다. 향후 연구에서는 멀티‑스케일 특징 결합, 실시간 구현, 그리고 심방세동 등 병리적 리듬과의 상호작용 분석이 필요하다.
댓글 및 학술 토론
Loading comments...
의견 남기기