분산 ECG 라벨링을 위한 웹 기반 도구 LabelECG
초록
LabelECG는 웹 브라우저만으로 12‑lead ECG를 시각화·주석 달 수 있게 만든 분산형 라벨링 시스템이다. 통합 데이터 관리와 사용자 인증을 제공해 여러 병원의 의사·기술자가 동시에 작업할 수 있게 하며, 3개월 동안 15 000건의 ECG를 성공적으로 주석 달아 국내 최초 ECG AI 경진대회를 지원하였다.
상세 분석
본 논문은 심전도(ECG) 데이터의 대규모 라벨링이 딥러닝 기반 자동 진단 모델 개발에 필수적이라는 전제 하에, 기존 오프라인 전용 툴들의 한계를 극복하고자 웹 기반 분산 라벨링 플랫폼인 LabelECG를 설계·구현하였다. 시스템은 프론트엔드, 백엔드, 그리고 Lightwave 시각화 모듈로 구성되며, 프론트엔드는 HTML5·JavaScript 기반으로 PC, 태블릿, 스마트폰 등 다양한 디바이스에서 접근 가능하도록 설계되었다. 백엔드는 Node.js와 Express를 활용한 RESTful API 서버와 세 개의 MySQL 데이터베이스(사용자 관리, ECG 데이터·파라미터, 주석·자동 진단)로 이루어져 있어 확장성과 유지보수가 용이하다. 특히 Docker 컨테이너화된 배포 방식을 채택해 로컬 LAN 환경이나 클라우드 환경 어디서든 손쉽게 설치·운용할 수 있다.
데이터 관리 측면에서 LabelECG는 사용자별 계정과 인증 코드를 통해 접근 권한을 제어하고, 각 사용자의 주석 이력을 자동으로 트래킹한다. 라벨링 과정은 ‘확인(confirmed)’과 ‘불확실(unsure)’ 두 가지 상태를 지원해 의학적 모호성을 명시적으로 기록할 수 있게 하며, 전문가 계정은 일반 사용자의 주석을 검토·수정할 수 있는 검증 워크플로우를 제공한다. 이러한 설계는 라벨 품질을 향상시키고, 다중 사용자 간의 협업을 촉진한다.
시각화 모듈인 Lightwave는 PhysioNet에서 제공하는 CGI 기반 ECG 파서와 연동되어 다양한 리드 수와 시간 길이의 신호를 실시간으로 렌더링한다. 사용자는 필요에 따라 특정 리드를 숨기거나 확대·축소할 수 있으며, 자동 진단 결과를 좌측 패널에 표시해 라벨링 보조 정보를 제공한다. 현재 버전은 진단 라벨(예: 정상, AF, ER 등)만 지원하지만, 향후 파형·비트 레벨의 fiducial point 라벨링 기능을 추가할 계획이다.
실제 적용 사례로, 저자들은 네 개 병원의 4명 의사가 LabelECG를 이용해 3개월 동안 15 000건의 12‑lead 휴식 ECG를 라벨링했다. 라벨링 효율은 하루 평균 200건 이상으로, 기존 오프라인 툴 대비 작업 속도와 협업 효율이 크게 향상된 것으로 보고된다. 라벨링된 데이터는 ‘제1회 중국 ECG 인텔리전스 경쟁’의 학습·평가 데이터셋으로 활용되어, 대회 참가팀들의 알고리즘 성능 향상에 기여하였다.
한계점으로는 현재 파형 수준(beat, fiducial point) 라벨링이 부재하고, 인터페이스가 한글로만 제공되어 국제 사용자 접근성이 낮다는 점을 들었다. 향후 영어 버전 제공과 자동 분석 모듈(예: QRS 검출, ST‑segment 변형 자동 표시) 추가를 통해 라벨링 부담을 더욱 경감하고, 데이터 품질을 높일 계획이다.
전반적으로 LabelECG는 ECG 라벨링의 병목을 해소하고, 대규모 고품질 데이터 구축을 위한 인프라로서 실용적 가치를 입증했으며, 오픈 소스로 공개될 경우 전 세계 연구 커뮤니티에 큰 파급 효과를 기대할 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기