엘리트 여성 축구 부상 예측: DeepHit 생존 모델로 시간‑대별 위험 추정

엘리트 여성 축구 부상 예측: DeepHit 생존 모델로 시간‑대별 위험 추정
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

**
본 연구는 공개된 SoccerMon 데이터셋을 활용해 여성 elite 축구선수들의 훈련·경기·웰니스 기록을 기반으로 DeepHit 딥러닝 생존 모델을 적용, 부상까지 남은 시간을 예측한다. Chronological 및 LOPO 검증에서 C‑index 0.762를 기록해 기존 Random Forest·XGBoost·Logistic Regression 대비 우수한 성능을 보였으며, SHAP 해석을 통해 피로, 급성·만성 부하, 이전 부상 횟수 등 임상적으로 의미 있는 위험 요인을 도출하였다.

**

상세 분석

**
본 논문은 여성 축구선수라는 상대적으로 데이터가 부족한 분야에 고차원 시계열 데이터를 적용한 최초 사례 중 하나로 평가할 수 있다. 데이터 전처리 단계에서 GPS 기반 객관 지표와 주관 설문 데이터를 통합하고, 물리적으로 불가능한 값(예: 시속 32 km 초과)과 신호 오류(세션 200 분 초과)를 제거함으로써 데이터 품질을 크게 향상시켰다. 특히 결측치 처리에 세 가지 전략(중앙값, 팀 기반 상대값, 선형 보간)을 비교 실험한 점은 모델 민감도 분석에 중요한 근거를 제공한다.

Baseline 모델은 Random Forest, XGBoost, Logistic Regression을 각각 그리드 서치와 맞춤형 가중 평가 지표(F1·Recall·Precision·AUC)로 최적화했으며, 클래스 불균형을 완화하기 위해 오버샘플링을 적용했다. 그러나 이들 모델은 “다음 날 부상 위험”이라는 이진 예측에 국한돼 시간 의존성을 반영하지 못한다는 한계가 있다.

DeepHit 모델은 기존 RNN 기반 구조 대신 MLP 백본을 채택했는데, 이는 관측치가 일일 단위로 제한되고 시계열 길이가 짧아 RNN의 장점이 크게 발휘되지 못하기 때문이다. 입력 윈도우를 21일, 예측 호라이즌을 7일로 설정해 단기 위험 변동을 포착하도록 설계했으며, 시간‑to‑event와 이벤트 인디케이터를 동시에 학습한다. 모델 평가는 C‑index를 주요 지표로 삼아 순위 기반 위험 예측 정확도를 측정했으며, Chronological split과 LOPO(Leave‑One‑Player‑Out) 검증을 병행해 실제 현장 적용 가능성과 일반화 능력을 동시에 검증했다.

성능 결과는 DeepHit이 C‑index 0.762를 달성해 baseline 모델(대략 0.68~0.71 수준)보다 현저히 우수함을 보여준다. 특히 LOPO 검증에서 대부분의 선수에 대해 0.70 이상을 유지했으며, 이는 모델이 특정 선수의 이력에 과도히 의존하지 않고 전반적인 패턴을 학습했음을 의미한다.

해석 측면에서는 SHAP 값을 활용해 개별 선수와 특정 고위험 일자에 기여한 피처를 시각화했다. 주요 위험 요인으로는 (1) 급성·만성 부하 비율(ACWR), (2) 누적 이전 부상 횟수, (3) 주관적 피로·근육통 수준, (4) 훈련 단일일 변동성(monotony·strain) 등이 도출되었으며, 이는 기존 스포츠 의학 문헌과 일치한다. 또한 결측률이 높은 주관적 설문이 “불완전 응답 비율”이라는 파생 변수를 통해 위험 신호로 작용한다는 점을 발견했다.

한계점으로는 데이터 규모가 37명·2시즌에 불과해 외부 검증이 어려웠으며, 부상 라벨이 객관적 의료 기록이 아닌 팀 보고서에 의존해 라벨링 오류 가능성이 있다. 또한 MLP 백본은 시계열 패턴을 완전히 포착하지 못할 수 있어, 향후 더 많은 시계열 데이터를 확보하면 RNN·Transformer 기반 DeepHit 변형을 시험해볼 여지가 있다.

종합하면, 본 연구는 DeepHit을 활용한 생존 분석이 축구 부상 예측에 실용적이며, SHAP 기반 해석을 통해 코칭 스태프가 구체적인 훈련 조정 및 회복 전략을 설계할 근거를 제공한다는 점에서 학술적·실무적 기여가 크다.

**


댓글 및 학술 토론

Loading comments...

의견 남기기