통계 검정의 올바른 활용: 지진 데이터에 대한 χ² 검정 재검토
초록
본 논문은 Vermeesch(2009)의 χ² 검정 적용 오류를 지적하고, 표본 크기 축소와 데이터 재표본화 과정에서 발생한 통계적 편향을 설명한다. 이후 여진 제거와 규모 임계값 적용을 통해 독립적인 주진(main shock)만을 대상으로 재검정한 결과, 규모 ≥ 5.0인 주진은 요일별로 균등하게 분포한다는 결론에 도달한다. 또한, p‑값의 표본 크기 의존성에 대한 오해를 정정하고, 귀무가설 검정과 Neyman‑Pearson 접근법의 차이를 명확히 한다.
상세 분석
이 논문은 Vermeesch(2009)가 제시한 “주간별 지진 발생 빈도는 균등하지 않다”는 주장에 대한 근본적인 통계적 오류를 짚는다. 첫 번째 오류는 전체 표본을 10%로 축소하면서 각 요일별 비율을 그대로 유지한 점이다. χ² 통계량은 관측도수와 기대도수의 차이를 제곱하여 기대도수로 나눈 합으로 정의되며, 표본 크기를 동일 비율로 감소시키면 통계량은 표본 크기의 제곱에 비례해 감소한다. 따라서 Vermeesch가 얻은 χ² = 9.4와 p = 0.15는 인위적인 편향이며, 실제로는 표본을 무작위로 10% 추출한 뒤 다시 7개의 요일 구간으로 재분류해야 한다. 올바른 재표본화에서는 p‑값이 약 10⁻⁶ 수준으로 유지되어 귀무가설을 여전히 기각한다.
두 번째 핵심은 χ² 검정의 전제조건이다. 검정은 관측값이 독립적이고 동일한 분포(i.i.d.)를 가정한다. 전 세계 지진 카탈로그는 다수의 여진(aftershocks)과 인위적 사건(채석장 폭발, 유체 유도 지진 등)으로 인해 이러한 가정을 위반한다. 저자들은 표준적인 “declustering” 절차를 적용해 68 %에 달하는 여진을 제거하고, 남은 37 779개의 주진에 대해 χ² 검정을 수행하였다. 그 결과 χ² = 36.19, p ≈ 2.5 × 10⁻⁶으로 여전히 귀무가설을 기각했지만, 규모가 큰 주진만을 대상으로 하면 결과가 달라진다.
세 번째 단계에서는 카탈로그의 완전성(completeness) 문제를 고려한다. 규모 m ≥ 5.0인 사건만을 선택하면 인위적 잡음과 작은 규모의 불완전한 기록을 배제할 수 있다. 이 하위집합(16 308건)에서도 여진을 제거하면 5 636개의 주진이 남으며, χ² = 5.64, p = 0.46이라는 비유의적(p > 0.05) 결과가 도출된다. 즉, 규모 ≥ 5.0인 주진은 요일별로 균등하게 분포한다는 지진학적 직관과 일치한다.
마지막으로 저자들은 p‑값이 표본 크기에 “실질적으로” 의존하지 않는다는 통계학적 정리를 강조한다. 충분히 큰 표본에서 각 구간에 최소 8–10개의 관측값이 있으면 χ² 검정의 근사분포는 표본 크기에 무관하게 일정하게 유지된다. Vermeesch가 제시한 “p‑값이 표본 크기에 따라 크게 변한다”는 주장은 위에서 지적한 표본 재구성 오류와 전제조건 위반을 무시했기 때문이다. 또한, 논문은 귀무가설 검정(단일 p‑값)과 Neyman‑Pearson 검정(대립가설 및 검정력) 사이의 개념적 차이를 명확히 하여, Vermeesch가 두 접근법을 혼동한 점을 비판한다. 전체적으로 이 논문은 통계 검정의 올바른 적용 절차와 해석 방법을 교육적 사례로 제시하며, 지진학뿐 아니라 모든 지구과학 분야에서 통계적 추론의 신뢰성을 확보하는 데 기여한다.
댓글 및 학술 토론
Loading comments...
의견 남기기