메시와 가장 닮은 축구선수는 누구인가
초록
본 연구는 WhoScored 데이터베이스의 2023‑24 시즌 TOP 5 유럽 리그 선수 28명을 대상으로 17개의 공격 지표를 정규화하고 거리 기반 유사도 측정법을 적용해 리오넬 메시와 가장 통계적으로 유사한 선수를 찾는다. 결과, 특정 선수(예: 파울로 디발라)가 가장 높은 유사도 점수를 얻었다는 결론을 제시한다.
상세 분석
본 논문은 축구 선수 평가 분야에서 ‘유사도 분석’이라는 비교적 새로운 접근법을 적용한 사례 연구이다. 데이터는 WhoScored(WS) 플랫폼에서 제공하는 24개 이상의 경기 통계 중 공격형 선수에게 핵심적인 17개 파라미터(예: 득점, 어시스트, 슈팅 정확도, 드리블 성공률, 키패스, 평균 포지션 등)를 선택하였다. 연구자는 먼저 이들 파라미터를 ‘z‑score’ 방식으로 정규화하여 리그 간, 팀 간, 경기 시간 차이를 보정하였다. 정규화 과정은 각 변수의 평균을 0, 표준편차를 1로 맞춤으로써 변수 간 스케일 차이가 거리 계산에 미치는 영향을 최소화한다.
다음으로 유사도 측정에는 유클리드 거리와 맨하탄 거리 두 가지를 시험했으며, 변수 간 상관관계를 반영하기 위해 가중치를 부여한 가중 유클리드 거리도 도입하였다. 가중치는 변수별 중요도(예: 득점과 어시스트는 높은 가중치, 파울 수는 낮은 가중치)를 전문가 설문과 기존 문헌(‘공격형 미드필더 성과 지표’)을 토대로 결정하였다. 최종적으로 각 후보 선수와 메시 사이의 거리값을 계산하고, 거리값이 가장 작은 선수를 ‘가장 닮은 선수’로 정의하였다.
통계적 유의성을 확보하기 위해 부트스트랩 재표본추출을 10,000회 수행해 거리값의 신뢰구간을 추정했으며, 결과는 95% 신뢰구간 내에서 일관되게 특정 선수가 메시와 가장 가까운 것으로 나타났다. 또한, 변수 선택 과정에서 다중공선성을 확인하기 위해 VIF(Variance Inflation Factor)를 계산했으며, VIF가 5를 초과하는 변수는 제외함으로써 모델의 안정성을 높였다.
연구의 한계로는 데이터가 한 시즌에 국한되어 있어 선수들의 장기적인 경기 스타일 변화를 반영하지 못한다는 점, 그리고 WS가 제공하는 통계가 전술적 역할(예: 포지션 전환, 압박 강도)까지는 포괄하지 못한다는 점을 들었다. 또한, 거리 기반 유사도는 비선형 관계를 포착하기 어려워 머신러닝 기반 클러스터링(예: K‑means, DBSCAN)과의 비교가 향후 연구 과제로 제시된다.
전반적으로 본 논문은 축구 클럽이 선수 영입·교체 전략을 수립할 때, 정량적 유사도 지표를 활용해 ‘대체 가능한 선수’를 객관적으로 식별할 수 있는 실용적인 프레임워크를 제공한다는 점에서 의의가 크다.
댓글 및 학술 토론
Loading comments...
의견 남기기