조 디마지오 56연속 안타와 확률론적 시뮬레이션

조 디마지오 56연속 안타와 확률론적 시뮬레이션
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 조 디마지오의 56경기 연속 안타 기록을 단순 확률 모델과 몬테카를로 시뮬레이션으로 분석한다. 연도별 타자 평균 성공률과 경기 수를 이용해 무작위 시뮬레이션을 수행한 결과, 개별 시즌에서는 극히 드물지만 전체 야구 역사(1870‑현재)에서는 한 번 정도는 발생할 확률이 70 % 이상임을 보였다. 흥미롭게도 모델은 1941년 이전, 19세기 말‑20세기 초에 같은 혹은 더 큰 기록이 나타났을 가능성이 높다고 제시한다.

상세 분석

논문은 먼저 “베이스볼 히트 확률”을 타자별 평균 타율과 경기당 타석 수를 곱해 추정한다. 여기서 핵심 가정은 각 타석이 독립적인 베르누이 시행이라는 점이다. 저자는 1900년대 초반부터 현재까지의 리그 전체 타율을 연도별 평균값으로 사용해, 각 시즌의 전체 타석 수(N)와 성공 확률(p)를 구한다. 이후 N번의 베르누이 시행을 10⁶ 회 반복하는 몬테카를로 시뮬레이션을 통해 “최대 연속 성공 횟수”(longest run of hits)를 기록한다.

시뮬레이션 결과는 두 가지 주요 통계치를 제공한다. 첫째, 단일 시즌(예: 1941년)에서 56연속 안타가 발생할 확률은 약 0.03 %로 매우 낮다. 둘째, 전체 역사(≈150 년) 동안 최소 한 번은 56연속 안타 수준의 기록이 나타날 확률은 71 %에 달한다. 이는 “극단적 사건은 드물지만 충분히 긴 시간 축에서 보면 필연적으로 나타난다”는 통계적 원리를 확인시킨다.

또한 저자는 모델의 민감도 분석을 수행한다. 타율(p)을 ±0.001씩 변동시키면 전체 발생 확률이 60 %~80 % 사이로 크게 변하지 않으며, 경기 수(N)의 변동(예: 시즌당 경기 수 증가) 역시 결과에 큰 영향을 주지 않는다. 다만, 타석 독립성 가정이 현실과 차이가 있다는 점을 인정한다. 실제 경기에서는 투수와 수비의 전략, 날씨, 부상 등 외부 요인이 성공 확률을 시간에 따라 변동시킨다. 이러한 비독립성을 반영한 마코프 체인 모델을 도입하면 연속 안타 확률이 약간 상승하거나 감소할 수 있다.

논문은 또한 “역사적 기록 부재”에 대한 해석을 제시한다. 19세기 말에는 타율이 현재보다 낮고, 경기 수가 적었음에도 불구하고 시뮬레이션은 그 시기에 56연속 안타가 발생했을 가능성이 더 높다고 예측한다. 이는 실제 기록이 남아 있지 않거나, 당시 리그 구조(예: 리그 통합, 경기 규칙 차이) 때문에 비교가 어려울 수 있음을 시사한다.

마지막으로 저자는 결과의 함의를 논한다. 대중이 “역사적 기록은 불가능했다”는 직관에 반해, 통계적 관점에서는 충분히 기대 가능한 사건이었다는 점을 강조한다. 이는 스포츠 기록 해석에 있어 ‘극단적 사건’과 ‘시간적 규모’를 동시에 고려해야 함을 보여준다.


댓글 및 학술 토론

Loading comments...

의견 남기기