대규모 웨어러블 센서 데이터로 개인 맞춤형 심혈관 반응 모델링
초록
본 연구는 80,000명 이상의 착용형 디바이스 사용자 데이터를 활용해, 개인별 심박수 변화를 예측하는 “심혈관 서명”을 자동으로 학습한다. 주의(attention) 기반 컨볼루션 신경망을 이용해 1분 단위의 걸음수·수면·심박 데이터를 입력으로 하며, 학습된 서명은 1년 차이의 데이터에서도 높은 재현성을 보인다. 서명은 기존의 정적 휴식심박수(RHR)보다 연령·BMI 등 건강 지표를 예측하는 데 더 유의미한 정보를 제공한다.
상세 분석
이 논문은 웨어러블 센서에서 수집된 대규모 시계열 데이터를 활용해 개인별 심혈관 반응을 함수 형태로 추정하는 새로운 접근법을 제시한다. 핵심은 두 단계로 구성된 자동인코더 구조이다. 인코더는 WaveNet‑style의 7층 dilated causal convolution 블록을 두 개(W₁, W₂) 사용해, 각각 물리적 활동(걸음수·수면)과 심박수 시계열을 별도로 처리한다. 이후 두 블록의 출력을 concat하고, Scaled‑Dot‑Product Attention을 적용해 고정 차원의 “심혈관 서명”을 추출한다. 여기서 쿼리·키 차원(dₖ=dᵥ=8)과 값 차원(dᵥ)은 서명 크기에 따라 달라지며, 실험에서는 32차원 서명이 최적 성능을 보였다.
디코더는 인코더와 가중치를 공유하는 동일한 WaveNet 블록(W₂)을 사용해, 각 시간 단계에서 추출된 서명 벡터와 물리적 활동 특징을 결합한다. 이어지는 두 개의 1‑D convolution 레이어가 최종 심박수 예측값을 출력한다. 손실 함수는 평균 L2 오차이며, Adam 옵티마이저(α=0.001)로 학습한다. 데이터 전처리 단계에서는 심박수를 개인별 평균·표준편차로 정규화하고, 걸음수는 log 변환 후 스케일링한다. 결측값은 ‘깨어 있을 때 평균 심박수’로 대체했으며, 손실 전파에서는 해당 구간을 무시한다.
베이스라인으로는 (1) 개인 평균 심박수, (2) 개인별 XGBoost(지난 120분 활동 입력), (3) 전체 인구 기반 XGBoost을 사용했으며, 제안 모델은 모든 경우에서 RMSE를 0.28~0.30 수준으로 크게 앞섰다. 특히 서명 크기가 16 이상이면 성능 향상이 포화되는 것을 확인했으며, 학습 데이터 양을 1%→100%로 확대했을 때 검증 오차가 약 14% 감소했다.
내적 타당성 검증에서는 2017년 데이터로 학습한 서명을 2018년 데이터에 적용했을 때, 동일 인물 서명이 타인 서명보다 평균 제곱 오차가 60% 낮았다(p<10⁻¹⁶). 외적 타당성에서는 서명을 입력으로 XGBoost를 훈련시, 연령(중위값 기준)과 비만(BMI≥30) 여부를 각각 AUROC 70.1%와 69.7%로 예측했으며, 이는 단순 휴식심박수만 사용할 때보다 현저히 높은 수치다.
논문의 한계로는 스트레스, 약물 복용, 식사 등 심박수에 영향을 미치는 비활동 요인을 고려하지 않았으며, 데이터 품질(결측률, 관찰 기간)과 개인의 행동 변동성에 따라 서명의 신뢰도가 달라질 수 있다. 향후 연구에서는 attention 가중치를 시각화해 “자연 실험” 패턴을 해석하고, 변분 자동인코더(VAE) 등으로 서명의 잠재 공간을 정규화하는 방안을 제시한다.
전반적으로 이 연구는 대규모 실생활 웨어러블 데이터를 활용해 개인 맞춤형 생리학적 모델을 자동으로 구축할 수 있음을 입증했으며, 임상적 위험 감시, 피트니스 트래킹, 급성 사건 회복 모니터링 등 다양한 응용 가능성을 열어준다.
댓글 및 학술 토론
Loading comments...
의견 남기기