NYT 기사 속 확률 오류와 HH‑비율 오해

이 논문은 2015년 뉴욕 타임스가 “핫핸드”와 “연속성”에 대해 보도하면서 발생한 확률·통계 개념의 오해를 짚는다. 특히 HH‑비율(연속된 성공의 비율)을 무게를 두지 않은 평균으로 계산한 것이 왜 잘못됐는지, 올바른 가중 평균과 Miller‑Sanjurjo 논문의 핵심 교정(작은 표본에서 조건부 확률 추정치가 하향 편향됨)을 설명한다. NYT가 원 논문을 오해·왜곡한 사례를 교육용 사례로 제시한다.

저자: Dan Gusfield

이 논문은 2015년 뉴욕 타임스가 “핫핸드”와 “연속성”에 관한 두 차례 보도에서 발생한 확률·통계 오류를 상세히 분석한다. 첫 번째 배경은 1985년 Gilovich, Vallone, Tversky(GVT) 논문으로, 이들은 농구 선수들의 성공(‘H’)이 무작위 동전 던짐과 동일하다고 가정하고, HH‑비율(‘H’ 뒤에 또 ‘H’가 나오는 비율)을 0.5와 비교했다. 두 번째는 2015년 Miller와 Sanjurjo(MS) 논문으로, 이들은 짧은 시계열(예: 한 경기, 한 시즌)에서 HH‑비율을 추정할 때 편향이 발생한다는 점을 지적한다. 구체적으로, “첫 L‑1 위치에 H가 나타난 경우”에만 조건을 두면 기대 HH‑비율이 0.5보다 작아진다(예: L=4이면 0.405). 이는 표본 선택 편향이며, 실제 무작위 과정에서는 H가 H 뒤에 올 확률이 정확히 0.5라는 사실과는 별개이다. NYT는 이 두 논문을 오해한다. 첫 번째 기사(George Johnson)는 “무작위 상황에서 H가 H 뒤에 올 확률이 50% 미만이다”라고 주장한다. 두 번째 기사(Binyamin Appelbaum)는 “길이 4인 평균 시퀀스에서 HH가 HT보다 현저히 적다”며 40.5%라는 숫자를 인용한다. 그러나 두 기사 모두 MS 논문의 핵심을 잘못 해석한다. MS는 “GVT가 0.5를 가정한 것이 오류”가 아니라, “짧은 표본에서 HH‑비율을 추정하면 하향 편향이 있다”는 점을 강조한다. 즉, GVT가 사용한 0.5는 이론적 확률이며, 실제 데이터에서 관측된 HH‑비율이 0.5보다 작을 수 있다는 것이 MS의 주장이다. 논문은 이 오류를 “무게를 두지 않은 평균”과 “가중 평균”의 차이로 설명한다. HH‑비율을 구할 때 전체 H(첫 L‑1 위치에 나타난 모든 H)에 대해 직접 비율을 계산하면 0.5가 된다. 그러나 NYT는 각 시퀀스(14개의 길이‑4 시퀀스)별 HH‑비율을 구하고, 이를 단순 평균했다. 이 과정에서 H가 적게 나타나는 시퀀스와 많이 나타나는 시퀀스에 동일 가중치를 부여했으며, 결과적으로 편향된 40.5%가 도출되었다. 논문은 이를 욕실 수 예시로 비유한다. 전체 집합을 직접 평균해야 하는데, 그룹별 평균을 다시 평균하면 전체 평균이 왜곡된다. 같은 원리가 HH‑비율에도 적용된다. 또한 논문은 GVT와 MS 사이의 실제 통계적 논쟁을 정리한다. GVT는 “핫핸드 현상이 통계적으로 입증되지 않는다”는 결론을 내렸고, MS는 “GVT가 사용한 추정량이 작은 표본에서 편향된다”며, 실제로 핫핸드 효과가 존재할 가능성을 열어두었다. NYT는 이 미묘한 차이를 무시하고, GVT가 “기본적인 통계 오류”를 범했다고 단정한다. 이는 독자에게 확률이 직관에 반한다는 잘못된 인상을 심어준다. 결론적으로, 논문은 NYT 기사들이 확률과 통계 개념을 오용한 구체적 사례를 제시하고, 올바른 통계적 접근법—즉, 전체 데이터에 대한 가중 평균, 표본 편향 보정, 그리고 작은 표본에서의 조건부 확률 추정에 대한 주의—을 강조한다. 이러한 분석은 고등학교·대학 수준의 확률·통계 교육에 활용될 수 있는 좋은 사례가 된다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기