크리스티아누 호날두와 리오넬 메시 득점 일관성 비교 CFM 탐색적 분석
본 연구는 2002‑2021 시즌 동안 두 슈퍼스타가 경기당 득점까지 소요된 시간을 오른발, 왼발, 페널티, 프리킥, 장거리, 헤더 6가지 방식으로 구분해 수집하고, 경쟁 실패 모드(CFM)와 Kaplan‑Meier 생존 분석을 적용해 일관성을 평가하였다. 결과는 두 선수의 일관성이 통계적으로 차이가 없으며, 17년 이상 비슷한 수준이라고 결론짓는다.
저자: Samsul Anwar, Siti Munawarah, Radhiah Radhiah
본 논문은 축구계에서 가장 뜨거운 논쟁거리인 크리스티아누 호날두와 리오넬 메시의 득점 일관성을 비교하기 위해 ‘Competing Failure Modes (CFM)’라는 생존 분석 기법을 적용한 최초의 시도라고 주장한다. 연구 대상은 2002‑03 시즌부터 2020‑21 시즌까지 두 선수가 출전한 모든 공식 경기이며, 각 경기에서 득점까지 걸린 시간을 ‘분’ 단위로 측정하였다. 득점 방식은 오른발 킥, 왼발 킥, 페널티 킥, 직접 프리킥, 장거리 킥, 헤더의 6가지로 구분하고, 각 방식별로 사건 발생 여부를 기록했다. 데이터는 전 세계 축구 통계 사이트 Transfermarkt에서 추출했으며, 해당 사이트는 선수별 경기 시간, 득점, 어시스트 등 다양한 정보를 제공한다는 점을 강조한다.
연구 방법은 크게 두 단계로 나뉜다. 첫째, 각 선수별로 시간‑득점 데이터를 ‘검열(censoring)’ 여부에 따라 구분한다. 경기 중 득점이 발생하면 ‘비검열(uncensored)’ 데이터로, 득점이 없으면 ‘검열(censored)’ 데이터로 처리한다. 둘째, 비검열 데이터를 기반으로 Kaplan‑Meier 추정량을 구해 각 득점 방식별 ‘신뢰도(reliability)’ 곡선을 만든다. 여기서 신뢰도는 특정 시간까지 득점이 발생하지 않을 확률, 즉 ‘생존 확률’로 정의된다. 각 방식별 신뢰도 곡선에 대해 Log‑Rank 검정을 수행해 두 선수 간 차이를 검증하고, 최종적으로 6가지 방식의 신뢰도 값을 가중 평균해 전체 신뢰도(Overall Reliability)를 산출한다.
결과는 두 선수 모두 전체 신뢰도 값이 거의 동일하게 0.85 수준이며, 각 방식별로도 큰 차이가 없다고 보고한다. 특히, 오른발 킥과 왼발 킥에서는 약간의 차이가 있었지만 95% 신뢰구간이 겹쳐 통계적으로 유의미하지 않다고 판단한다. 논문은 이를 근거로 “호날두와 메시는 17년 이상 거의 동일한 일관성을 보인다”고 결론짓는다.
하지만 논문 전반에 걸쳐 여러 한계점이 지적된다. 첫째, 데이터의 질과 정확성이 검증되지 않았다. Transfermarkt는 사용자 기반 데이터베이스이며, 경기당 실제 출전 시간(예: 교체 여부)과 득점 기회(예: 슈팅 수) 등을 반영하지 않는다. 둘째, ‘검열’ 정의가 모호하다. 득점이 없다고 바로 검열 데이터로 처리했지만, 실제로는 경기 종료 전까지 득점 기회가 전혀 없었을 수도 있다. 이는 비정상 검열을 초래해 Kaplan‑Meier 추정에 편향을 일으킨다. 셋째, CFM 접근법은 다중 실패 모드(6가지 득점 방식)를 동시에 고려한다는 점에서 이론적으로는 적절하지만, 논문에서는 각 모드별 위험도(hazard)와 누적 발생률을 제시하지 않고, 단순히 평균화된 신뢰도만을 보고한다. 따라서 개별 방식 간 차이를 파악할 수 없다. 넷째, 통계적 검정 결과가 구체적으로 제시되지 않는다. Log‑Rank 검정의 p‑값, 검정 통계량, 신뢰구간 등이 누락돼 ‘통계적으로 차이가 없다’는 주장이 근거가 부족하다. 다섯째, 연구 설계가 ‘탐색적’이라고 명시했지만, 사전 가설 설정, 표본 크기 검증, 다중 비교 보정 등 기본적인 통계 절차가 결여돼 있다. 마지막으로, 논문 자체에 오탈자, 부적절한 인용, 비전문적인 문체가 다수 존재해 학술적 신뢰성을 저하시킨다.
결론적으로, 본 연구는 두 슈퍼스타의 득점 일관성을 비교하려는 흥미로운 시도를 보여주지만, 데이터 처리와 통계 분석이 충분히 엄밀하지 않다. 향후 연구에서는 실제 경기 출전 시간, 포지션, 전술적 역할, 상대 강도 등을 포함한 다변량 생존 모델을 적용하고, 각 득점 방식별 위험비(HR)와 신뢰구간을 제시함으로써 보다 정교한 비교가 필요하다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기