운동캡처와 설명 가능한 머신러닝을 활용한 달리기 무릎 부상 탐지

운동캡처와 설명 가능한 머신러닝을 활용한 달리기 무릎 부상 탐지
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 연구는 광학식 모션 캡처 데이터를 이용해 달리기 시 자세의 스탠스 단계에서 관절 각도 시계열과 이산형 지표를 결합한 특징을 추출하고, KNN·GP·DT와 CNN·LSTM 등 다양한 분류 모델을 비교하였다. 839개의 트레드밀 기록(건강 576, PFPS 137, ITBS 126)을 대상으로 건강·부상, PFPS·건강, ITBS·건강 3가지 이진 분류를 수행했으며, 정확도·정밀도·재현율·F1을 평가하였다. 설명 가능성 기법(Shapley, PDP, Saliency, Grad‑CAM 등)을 적용해 모델이 주목하는 관절·시간 구간을 해석하였다. CNN이 가장 높은 정확도( PFPS 77.9 %, ITBS 73.8 %, 전체 부상 71.43 %)를 기록했으며, 시계열과 이산형 특징을 결합한 하이브리드 입력이 성능을 크게 향상시켰다.

상세 분석

이 논문은 기존 연구가 주로 점 기반(peak, stride length 등) 혹은 비지도 군집에 의존한 반면, 시계열 전체를 입력으로 활용한 지도 학습 접근을 체계적으로 검증한다는 점에서 의미가 크다. 데이터 전처리 단계에서 7개의 마커 트랙을 이용해 발·정강·대퇴·골반의 Cardan 각을 계산하고, PCA 기반 터치‑다운·토‑오프 검출로 스탠스 구간을 101개의 균등 샘플로 보간하였다. 이렇게 정규화된 12개의 관절·세그먼트 각 시계열과 30여 개의 스페이스‑타임·파워 파라미터(예: step width, knee flexion peak, LF/MF/HF 파워) 를 결합한 하이브리드 피처는 기존 점 기반만 사용했을 때보다 평균 5~7 %p 정도 정확도가 상승한다.

모델 비교에서는 K‑Nearest Neighbors, Gaussian Process Classifier, Decision Tree와 같은 전통적 알고리즘을 베이스라인으로 설정하고, 1‑D Convolutional Neural Network와 LSTM을 각각 시계열 전용 및 시계열‑점 혼합 입력에 적용하였다. 하이브리드 입력을 사용한 CNN이 가장 높은 성능을 보였으며, LSTM은 시계열 의존성을 어느 정도 포착했지만 과적합 위험과 학습 시간 증가로 CNN에 비해 약간 뒤처졌다. 전통 모델은 특히 데이터 양이 제한된 상황에서 과적합을 방지하는 장점이 있었지만, 복합 피처를 충분히 활용하지 못해 전반적인 정확도가 60 % 이하에 머물렀다.

설명 가능성 분석에서는 Shapley 값과 Partial Dependence Plot을 통해 전체 피처 중 무릎 굴곡 피크, 고관절 외전·내전 각, 발목 외번 각도와 같은 변수가 모델 예측에 큰 기여를 함을 확인했다. 또한, Grad‑CAM 및 Saliency Map을 CNN에 적용해 스탠스 초기(착지)와 중간(체중 지지) 구간에서 특히 무릎·고관절 각도가 중요한 시점임을 시각화하였다. 이러한 결과는 임상적으로 PFPS와 ITBS가 각각 무릎 전방·측면 부하와 고관절 회전·외측 스트레인과 연관된다는 기존 biomechanical 이론과 일치한다.

한계점으로는 데이터가 트레드밀에서 수집된 정형화된 환경에 국한돼 실제 야외 달리기 상황에 대한 일반화가 어려우며, 클래스 불균형(특히 ITBS)과 스탠스 외의 스윙 단계 정보를 배제한 점을 들 수 있다. 또한, 모델 검증이 교차 검증 수준에 머물러 외부 독립 코호트에 대한 테스트가 부족하다. 향후 연구에서는 웨어러블 IMU와 영상 기반 추정치를 결합해 멀티모달 입력을 구축하고, 실시간 피드백 시스템을 설계해 부상 예방에 직접 적용하는 방안을 모색할 필요가 있다.


댓글 및 학술 토론

Loading comments...

의견 남기기