보행 기반 멀티시스템 건강 바이오신호 모델

본 논문은 보행을 전신 건강을 반영하는 독립적인 바이오신호로 정의하고, 이를 정량화하기 위한 대규모 데이터셋과 최신 자기지도학습 기법을 제시한다. 연구는 Human Phenotype Project(HPP)에서 모집된 3,414명의 성인(남 1,652명, 여 1,762명)을 대상으로 진행되었으며, 평균 연령 52.5 ± 10.1세, 평균 BMI 25.7 ± 3.8 kg/m²라는 비교적 건강한 인구를 포함한다. 각 참가자는 깊이 카메라(Azure Kinect) 기반의 Movement Lab에서 5가지 표준화된 운동 과제(고정 속도 트레드밀 보행, 의자 일어서기, Romberg 균형 검사 등)를 수행했고, 실시간으로 3D 골격 포즈 시퀀스가 추출되었다. 총 351시간에 달하는 시계열 데이터는 기존의 평균 보행 속도·보폭·보행 변동성 등 요약 통계와는 달리 관절 간의 공간‑시간 상호작용을 보존한다. 데이터 처리와 모델링은 두 단계로 이루어졌다. 첫 번째 단계는 Masked Autoencoder(MAE) 기반의 Dual‑Stream Spatio‑Temporal Transformer를 이용해 자기지도학습을 수행하는 것이다. 입력 시퀀스는 무작위로 관절(공간)과 시간 구간을 마스킹하고, 가우시안 노이즈를 추가한 뒤, 네트워크가 마스크된 부분을 복원하도록 학습한다. 재구성 손실은 평균 관절 위치 오차(mean per‑joint position error) 0.008 m(≈8 mm)까지 감소했으며, 이는 인간 수준의 정밀도에 근접한다. 학습된 인코더는 고차원 시계열을 128‑dimensional 임베딩으로 압축하고, 각 과제별 임베딩을 평균 풀링한 뒤 전체 과제에 대해 가중 평균을 취해 “Gait Fusion” 임베딩을 생성한다. 두 번째 단계에서는 이 임베딩을 다양한 다운스트림 과제에 적용했다. 첫째, 연령, BMI, 내장지방(VAT) 등 주요 인구통계 변수와 직접 비교하였다. 단일 과제 중 3 km/h 트레드밀 보행이 연령 예측에서 Pearson r = 0.61을 기록했으며, Fusion 모델은 남성 r = 0.691, 여성 r = 0.682로 기존 요약 통계(연령+키+키) 대비 크게 앞섰다. BMI 예측에서도 r ≈ 0.89, VAT 예측에서도 r ≈ 0.81을 달성, 전통적인 보행 지표와 키를 결합한 모델(r ≈ 0.52)보다 현저히 우수했다. 둘째, 18개 신체 시스템에 걸친 3,210개의 표현형에 대해 선형·비선형 회귀를 수행했으며, FDR 보정 후 1,980개의 표현형에서 유의한 예측이 확인되었다. 특히 신체 조성(lean mass, hand grip strength), 골밀도, 프레일리티 지표, 간 기능(음속, 탄성), 심혈관 파라미터, 수면 지표(AHI, ODI) 등이 높은 상관계수(r > 0.5)를 보였다. 보행 임베딩이 기존 인구통계·신체계 변수와 중복되지 않는 독립적인 정보를 제공한다는 점을 검증하기 위해, 기본 공변량(연령, BMI, 키, VAT)만 사용한 베이스라인 모델과 여기에 보행 임베딩을 추가한 모델을 비교하였다. 모든 시스템에서 Δr(예측력 향상)이 통계적으로 유의했으며, 남성에서는 18개 전 시스템, 여성에서는 17개(신장 기능 제외)에서 유의한 향상이 관찰되었다. 이는 보행이 단순히 연령·체형의 대리변수가 아니라, 다양한 생리적 상태를 직접 반영하는 독립적인 바이오신호임을 시사한다. 해부학적 ‘ablation’ 실험에서는 관절 그룹을 선택적으로 제외하고 임베딩을 재학습했다. 다리 관절을 제거하면 대사·프레일리티 관련 예측이 크게 감소하고, 몸통(척추·골반) 관절을 제거하면 수면·생활 습관 예측이 약화되는 패턴이 나타났다. 이는 각 신체 부위의 움직임이 특정 시스템의 생리적 상태와 연관된다는 생물학적 해석을 가능하게 한다. 논문의 주요 기여는 다음과 같다. (1) 3,414명의 대규모 성인 코호트를 이용한 3D 골격 보행 데이터셋을 공개하고, 이는 현재 공개된 가장 큰 규모의 3D 보행 데이터셋이다. (2) Masked Autoencoder 기반의 자기지도학습으로 고차원 시계열을 효율적으로 압축하는 방법을 제시하였다. (3) 보행 임베딩이 연령·BMI·VAT 등 전통적인 변수와 독립적으로 18개 시스템에 걸친 광범위한 표현형을 예측함을 실증하였다. (4) 해부학적 부위별 기여 분석을 통해 다리와 몸통 움직임이 각각 대사·프레일리티와 수면·생활 습관을 주도한다는 생물학적 인사이트를 제공한다. 한계점으로는 참가자 군이 주로 아슈케나지계 유대인에 국한되어 있어 인종·문화적 일반화가 제한될 수 있다. 또한 깊이 카메라 기반 데이터는 실외 조명·배경 변화에 민감할 수 있으며, 현재 모델은 정적인 임베딩 추출에 초점을 맞추어 실시간 위험 감지(예: 낙상)에는 추가 연구가 필요하다. 향후 연구에서는 스마트폰·웹캠 등 소비자 등급 영상으로 확장하고, longitudinal 데이터를 활용해 보행 변화가 질병 진행을 예측하는 시계열 모델을 개발하는 것이 기대된다. 최종적으로, 보행을 저비용·비침습적인 “패시브 바이탈 사인”으로 활용함으로써, 대규모 건강 스크리닝 및 개인 맞춤형 예방 의학에 새로운 패러다임을 제시한다.

보행 기반 멀티시스템 건강 바이오신호 모델

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기