베이지안 모델을 위한 빈도주의 적합도 검정

본 논문은 베이지안 모델의 적합도와 실험 간 일관성을 평가하기 위한 새로운 빈도주의 검정 방법을 제시한다. 서론에서는 베이지안 모델 선택이 가설 H와 사전 π의 조합 M={π,H}으로 정의되며, 기존의 베이지안 모델 선택 절차가 최적 가설을 찾는 데는 유용하지만, 실제 데이터 D를 충분히 설명하는지 여부를 판단할 통계적 기준이 부족함을 지적한다. 특히, 사전이 이전 실험의 사후에서 유도될 때, 이전 실험에 결함이 있으면 그 결함이 다음 실험에 전파될 위험이 있음을 강조한다. 2절에서는 베이지안 모델 M을 명확히 정의하고, 사전이 잘못 설정될 경우 모델 M 자체가 잘못된 것으로 간주될 수 있음을 설명한다. 이어서, 연속 실험 X₁→X₂에서 사전 πᵢ₊₁ = p(α|H,Xᵢ) 형태로 업데이트되는 전통적 베이즈 정리 사용이, Xᵢ에 시스템적 오류가 있으면 Xᵢ₊₁의 추정에 부정적 영향을 미친다는 문제를 제시한다. 3절에서는 χ² 검정의 빈도주의적 정의를 복습하고, 베이지안 모델에 대한 아날로그 통계량 hχ²π를 정의한다. 이는 사후분포 위에서 χ²(α)를 평균한 값이며, 사전이 균일일 경우 hχ²ᵤ와의 관계가 hχ²ᵤ = χ²₀ + k(파라미터 수)임을 증명한다. 따라서 hχ²ᵤ − k는 자유도 ν=n−k인 χ² 분포를 따르며, 기존 χ²₀와 동일한 해석이 가능하다. 3.1절에서는 p‑값 해석을 논의한다. 전통적인 ‘귀무가설 기각’ 대신, 통계량이 사전 정의된 임계값을 초과하면 모델·데이터가 모두 완전함에도 불구하고 경고를 발생시키는 타입 I 오류, 반대로 결함이 있음에도 임계값을 넘지 않으면 타입 II 오류로 정의한다. 이는 베이지안 상황에서 ‘수용’·‘기각’보다 ‘경고’의 의미가 더 적절함을 강조한다. 4절에서는 hχ²π의 통계적 성질을 분석한다. 선형 모델·정규 오차 가정 하에 균일 사전이면 정확히 hχ²ᵤ = χ²₀ + k가 성립하고, 따라서 기대값 E

베이지안 모델을 위한 빈도주의 적합도 검정

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기