Wald 구간의 최소 커버리지 확률 정확한 계산

본 논문은 이항 비율 추정에 널리 사용되는 Wald 구간의 최소 커버리지 확률을 정확히 계산하는 방법을 제시한다. θ = Z²_{δ/2}/n이 3보다 작을 때, 정리 1에 따라 구간의 하한·상한에 대한 이산 확률을 유한 개만 평가하면 전체 파라미터 구간 (0, 1)에서의 최소 커버리지를 구할 수 있음을 보인다.

저자: Xinjia Chen

이 논문은 이항 비율 p에 대한 추정에서 가장 널리 사용되는 Wald 신뢰구간의 커버리지 특성을 정확히 분석한다. 서론에서는 Wald 구간이 간단히 계산 가능하지만, 특히 표본 크기가 작거나 p가 0 또는 1에 가까울 때 명목 신뢰수준(예: 95%)과 실제 커버리지 사이에 큰 차이가 발생한다는 기존 연구 결과를 언급한다. 이러한 문제점을 정량적으로 파악하기 위해, 저자는 최소 커버리지 확률을 정확히 구하는 새로운 방법을 제시한다. 먼저, 표본합 K=∑_{i=1}^{n}X_i와 비율 \hat p=K/n을 정의하고, Wald 구간의 하한 L(k)와 상한 U(k)를 전통적인 형태로 제시한다. 여기서 Z_{δ/2}는 표준 정규분포의 (1−δ/2) 분위수이며, θ=Z²_{δ/2}/n이라는 파라미터를 도입한다. θ는 표본 크기와 신뢰수준에 따라 결정되며, 논문에서는 θ<3이라는 조건을 가정한다. 이는 대부분 실용적인 상황에서 만족한다. 정리 1에서는 두 보조 함수 T⁻(p)와 T⁺(p)를 정의한다. T⁻(p)=\frac{2p+θ−pθ²+4θp(1−p)²}{1+θ}, T⁺(p)=\frac{2p+θ+pθ²+4θp(1−p)²}{1+θ}이다. 이 함수들은 각각 Wald 구간의 하한 L(k)와 상한 U(k)에서 p를 역으로 풀어 K가 가질 수 있는 최소·최대 값을 제공한다. 구체적으로, L(k)와 U(k)가 (0,1) 구간에 있을 때, 다음과 같은 이산 확률을 정의한다. - C_l(k)=Pr{⌈T⁻(L(k))⌉ ≤ K ≤ k−1 | p=L(k)} - C'_l(k)=Pr{⌊T⁻(L(k))⌋+1 ≤ K ≤ k−1 | p=L(k)} - C_u(k)=Pr{ k+1 ≤ K ≤ ⌊T⁺(U(k))⌋ | p=U(k)} - C'_u(k)=Pr{ k+1 ≤ K ≤ ⌈T⁺(U(k))⌉−1 | p=U(k)} 정리 1의 (I)와 (II) 항목은 각각 “폐구간 포함”과 “열린구간 포함” 상황에 대한 최소 커버리지를 구한다. 즉, 전체 파라미터 p∈(0,1)에서 inf Pr{L≤p≤U | p}는 위 네 개 확률 집합 중 최소값과 동일하고, 동일한 논리로 열린 구간에 대해서도 최소값을 구한다는 것이다. 증명에 앞서 레마 1에서는 L(k)와 U(k)가 k에 대해 단조 증가함을 보인다. 이를 위해 h(z)=z+Z_{δ/2}√{z(1−z)/n}와 g(z)=z−Z_{δ/2}√{z(1−z)/n}를 정의하고, 미분을 통해 ∂h/∂z>0, ∂g/∂z>0임을 확인한다. 여기서 z=K/n이며, θ<3이라는 가정 하에 모든 z∈(0,1)에서 위 부등식이 성립한다. 단조성은 T⁻와 T⁺가 정의된 구간을 정확히 구분하는 데 필수적이다. 다음으로, (p−k/n)²=θ·k/n·(1−k/n)이라는 관계식을 k에 대해 풀어 T⁻와 T⁺를 도출한다. 이 식은 Wald 구간의 경계가 실제 p와 얼마나 차이 나는지를 정량화한다. 구간 포함 여부는 K가 T⁻와 T⁺ 사이에 있는지 여부로 변환되며, 이는 이항 분포의 누적 확률로 계산된다. 따라서 전체 최소 커버리지는 k=0,…,n에 대해 네 개의 확률을 각각 계산한 뒤, 그 중 최소값을 선택하면 된다. 이는 기존에 파라미터 공간을 연속적으로 탐색해야 했던 방법에 비해 계산량을 크게 줄인다. 마지막으로, 논문은 이 방법이 Wald 구간뿐 아니라 다른 형태의 신뢰구간에도 적용 가능함을 언급한다. 예를 들어 Wilson 구간이나 Agresti‑Coull 구간에 대해 동일한 T⁻, T⁺ 정의와 단조성 검증을 수행하면, 최소 커버리지를 정확히 구할 수 있다. 결론적으로, 저자는 Wald 구간의 최소 커버리지를 정확히 계산하는 유한한 알고리즘을 제시함으로써, 실무에서 Wald 구간을 사용할 때 발생할 수 있는 위험을 정량적으로 평가하고, 필요 시 대체 구간을 선택하도록 안내한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기