짧은 단일채널 ECG로 심방세동을 정확히 판별하는 밀집 연결 합성곱 신경망과 신호 품질 분석

본 연구는 9~60초 길이의 단일채널 ECG를 대상으로 정상동리듬(NSR), 심방세동(AF), 기타 리듬(O), 잡음 네 클래스를 자동 분류하는 알고리즘을 제안한다. 신호 품질 지수(SQI)로 저품질 신호를 사전 차단하고, 남은 신호를 시간‑주파수 스펙트로그램으로 변환한 뒤 DenseNet 기반 두 개의 CNN(15초 전용, 9초 전용)으로 분류한다. NSR와 O의 구분이 불명확할 경우 AdaBoost 기반 특징 후처리기를 적용한다. Physi…

저자: Jonathan Rubin, Saman Parvaneh, Asif Rahman

본 논문은 2017년 PhysioNet/CinC 챌린지에서 제시된 “짧은 단일채널 ECG로 심방세동을 분류” 문제에 대응하기 위해, 신호 품질 평가와 밀집 연결 합성곱 신경망(DenseNet)을 결합한 다단계 자동 분류 시스템을 설계·평가하였다. 데이터는 9 ~ 60 초 길이의 8 528개 레코드(NSR 5 050, AF 738, 기타 2 456, 잡음 284)로 구성되었으며, 5‑fold 계층적 스트래티파이드 분할을 통해 학습·검증·테스트 셋을 구성하였다. 1. **신호 품질 지수(SQI) 기반 전처리** - 원시 ECG에서 베이스라인 워터를 이동 평균 필터로 제거하고, WFDB 툴박스의 gqrs 알고리즘으로 QRS를 검출한다. - 검출된 QRS에 대해 평균 템플릿 매칭 상관계수를 계산하고, 임계값 0.5를 초과하면 품질이 양호한 것으로 판단한다. - SQI가 0.5 이하인 경우 즉시 ‘Noise’ 클래스로 라벨링하여 이후 복잡한 연산을 회피한다. 2. **시간‑주파수 변환 및 스펙트로그램 생성** - 품질이 통과된 신호는 75 샘플(≈0.3 s) 윈도우와 50 % 오버랩을 적용해 FFT를 수행, 스펙트로그램을 만든다. - 주파수 축은 0‑50 Hz 범위의 20개 빈으로 제한해 저주파 심전도 성분을 강조한다. - QRS 피크를 기준으로 15 s와 9 s 길이의 세그먼트를 추출해 두 종류의 입력을 준비한다. 3. **DenseNet 기반 CNN 모델** - **메인 모델(15 s)**: 3개의 Dense 블록으로 구성된 40계층 네트워크, 성장률 6, 총 파라미터 262 344개. 입력은 20 × 375(주파수 × 시간) 형태. - **보조 모델(9 s)**: 구조는 동일하나 성장률 4, 파라미터 119 458개, 입력은 20 × 225. - 각 계층은 3 × 3 컨볼루션 → ReLU → 행‑단위 배치 정규화(BN) 순으로 진행한다. 행‑단위 BN은 주파수 빈 별로 정규화해 스펙트로그램의 비정상적인 스케일 변동에 강인함을 제공한다. 4. **학습 전략** - 4‑클래스(NSR, AF, O, Noise) 소프트맥스 교차 엔트로피 손실을 사용해 15 epoch 이하로 학습한다. - 초기 5‑fold 학습 후 성능이 우수한 모델을 선택, 전체 데이터의 95 %를 재학습에 사용해 가중치를 초기화한다(전이 학습 방식). 5. **후처리 단계** - CNN이 NSR와 O를 동시에 높은 확률로 예측하고, 두 확률 차이가 0.4 미만이면 AdaBoost‑abstain 분류기로 재판정한다. - AdaBoost 분류기는 437개의 특징을 사용해 학습했으며, 특징은 다음 5가지 카테고리로 구분된다. - **신호 품질**(2): 평균 템플릿 매칭 상관계수, bSQI. - **주파수 콘텐츠**(10): 9개 밴드 평균 파워와 5‑14 Hz/5‑50 Hz 비율. - **RR 간격 통계**(11): 평균, 최소, 최대, 중앙값, SDNN, RMSSD, 평균 심박수, HRV 비대칭 지표 등. - **재구성 위상공간**(401): 2차원 위상공간을 20 × 20 격자로 나누어 정규화된 점 밀도와 공간 채움 지수. - **Poincaré 섹션**(13): 위상공간에서 유도된 다양한 비선형 지표. - 특징 선택 결과 상위 58개 중 10개가 RR 간격, 5개가 위상공간, 3개가 Poincaré 섹션에서 추출된 것으로, 시간‑도메인 변동성이 NSR/O 구분에 핵심임을 확인했다. 6. **성능 평가** - **In‑house 테스트**(1 707 레코드)에서 전체 F1 = 0.82, 개별 F1(NSR 0.91, AF 0.80, O 0.76)를 기록. - **Blind 테스트**(전체 챌린지 데이터)에서는 F1 = 0.80, 개별 F1(NSR 0.90, AF 0.80, O 0.70)로 최종 순위에 기여. - AdaBoost 후처리기의 ROC AUC는 0.86이며, 58개의 선택된 특징 중 10개가 RR 간격, 5개가 위상공간, 3개가 Poincaré 섹션에서 온다. 7. **추가 실험 및 한계** - Wide‑&‑Deep 구조(심박 변동성, 엔트로피, 형태학적 특징을 결합)와 원시 ECG를 병렬 입력으로 사용하는 이중 네트워크를 시험했으나, 연산량이 챌린지 서버 제한을 초과해 최종 제출에 포함되지 못했다. - 모델 경량화와 실시간 구현을 위한 최적화가 필요하며, 특히 모바일/웨어러블 디바이스에서의 메모리·전력 제약을 고려한 설계가 향후 과제로 남는다. **결론** 본 연구는 SQI 기반 사전 필터링, 행‑단위 배치 정규화가 적용된 DenseNet, 그리고 HRV·위상공간 기반 후처리기를 결합해 짧은 단일채널 ECG에서 AF를 포함한 다중 클래스를 높은 정확도로 분류할 수 있음을 입증하였다. 제안된 파이프라인은 웨어러블 기반 대규모 심방세동 스크리닝에 실용적이며, 향후 모델 경량화와 실시간 SQI 계산 최적화를 통해 임상 및 일상 생활에서의 적용 가능성을 확대할 수 있다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기