엑스체인지AI와 카드X: 심전도 분석을 위한 올인원 플랫폼
초록
ExChanGeAI는 다양한 ECG 포맷을 지원하고, 시각화·전처리·모델 학습·미세조정을 한 번에 수행할 수 있는 웹 기반 엔드‑투‑엔드 플랫폼이다. 오픈소스 기반의 ECG 기반 모델 CardX는 100만 개 이상의 12‑lead ECG로 사전학습돼 파라미터와 FLOPs가 적으면서도 외부 데이터셋에서 견고한 성능을 보인다. 플랫폼은 로컬 및 프라이버시 보호 학습을 제공하며, ONNX 형식으로 모델을 배포·공유할 수 있다.
상세 분석
ExChanGeAI는 데이터 로딩 단계에서 MIT‑BIH, PTB‑XL, PhysioNet 2021 등 6개 이상의 공개 데이터베이스와 자체 수집된 독일 대학병원 ECG를 포함한 7개 소스의 포맷을 자동 인식한다. 전처리 파이프라인은 이동 평균 기반 잡음 제거, Min‑Max 정규화, Z‑score 스케일링을 선택적으로 적용할 수 있어 신호 품질에 따라 유연하게 조정된다. 시각화 모듈은 원시 시계열, QRS 복합 파형, fiducial point 라벨링, 평균 비트 정렬 등 4가지 뷰를 제공함으로써 임상의가 직접 파형을 검증하고 라벨링 오류를 즉시 수정할 수 있다.
모델 관리 측면에서 ExChanGeAI는 ONNX 표준을 채택해 로컬 환경, 클라우드 서버, 엣지 디바이스 어디서든 동일한 추론 엔진을 사용할 수 있다. 모델 공유를 위한 WebDAV 기반 “Model ExChanGe” 서버는 버전 관리와 접근 제어를 지원해 협업 연구에 적합하다.
핵심 기여인 CardX는 15 M 파라미터와 201 MFLOPs로 ECG‑FM(90 M 파라미터, 14 GFLOPs) 대비 70배 적은 연산량을 요구한다. 사전학습은 반지도 학습(contrastive‑masking)과 지도 학습을 혼합해 7개 데이터소스로부터 1 M ECG를 이용했으며, 레이어 구조는 경량화된 Conv‑Transformer와 시계열 어텐션을 결합한 하이브리드 형태다.
성능 평가에서는 PTB‑XL 내부 검증과 외부 데이터셋(Yang et al., MIMIC‑IV‑ECG, EDMS) 3곳을 사용해 9가지 진단 과제(심근경색, ST/T 변화, 전도 장애, 비대, 재관류 필요 여부 등)를 테스트했다. CardX는 평균 가중 F1 0.611, 중앙값 0.645를 기록했으며, IQR와 CV가 각각 0.123, 0.358로 가장 낮아 외부 데이터에 대한 견고성을 입증했다. 파라미터와 FLOPs가 적음에도 XceptionTime·InceptionTime과 비슷하거나 약간 뒤처지는 수준이었다. 특히 데이터가 제한된 상황에서 CardX는 2 M 파라미터 DSAIL SNU보다 6배 적은 연산량으로 비슷한 안정성을 보였으며, 대규모 모델인 ECG‑FM보다 70배 적은 연산량으로도 경쟁력 있는 성능을 유지했다.
또한, 플랫폼은 “one‑click fine‑tuning”을 제공해 사용자는 라벨 파일만 업로드하면 자동으로 학습‑검증‑테스트 파이프라인을 실행할 수 있다. 학습은 전체 모델 혹은 헤드만 미세조정하는 옵션을 제공하며, 파라미터 동결 비율을 조절해 과적합을 방지한다. 연합 학습(Federated Learning) 및 스웜 학습(Swarm Learning) 모듈이 내장돼 데이터 프라이버시를 유지하면서 다기관 협업이 가능하도록 설계되었다.
한계점으로는 현재 12‑lead ECG에 최적화돼 있어 단일 리드 혹은 웨어러블 저채널 데이터에 대한 지원이 미비하고, 라벨링 품질에 크게 의존한다는 점이다. 또한, CardX의 사전학습 데이터가 주로 서구권 병원에서 수집돼 있어 인구통계학적 편향이 존재할 가능성이 있다. 향후 다채널·다양한 인구집단을 포괄하는 데이터 증강 및 도메인 적응 기법을 도입하면 일반화 성능을 더욱 향상시킬 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기