순열 분포를 이용한 독립성 검정의 새 접근법

본 논문은 순열에 불변인 순위 통계량들의 귀무분포를 정밀하게 근사하기 위해 이중 새들포인트(saddlepoint) 방법을 제안한다. 기존의 정규근사보다 높은 정확도를 보이며, 시뮬레이션 없이도 p‑값을 거의 정확하게 계산할 수 있다. 실제 데이터와 다양한 시뮬레이션을 통해 제안 방법의 우수성이 입증된다.

저자: ** *논문에 저자 정보가 명시되어 있지 않습니다.* (제공된 텍스트에 저자 이름이 포함되지 않았음) --- **

본 논문은 두 변수 X와 Y 사이의 독립성을 검정하기 위해 순열에 불변인 순위 통계량들의 귀무분포를 정확히 근사하는 새로운 방법을 제시한다. 먼저, 관측된 N개의 (X_i, Y_i) 쌍을 X값의 크기 순으로 정렬하고, 정렬된 Y값들의 순위 R_i 를 구한다. 이때 귀무가설 H₀ 하에서는 모든 순열 (R₁,…,R_N) 이 동일 확률 1/N! 로 발생한다. 기존에 널리 사용되는 통계량 D = ∑(R_i − i)² 혹은 이를 변형한 V′ = ∑ i R_i 등은 모두 위와 같은 순열분포를 가진다. 이러한 통계량은 일반적으로 S = ∑_{i=1}^{N} f_N(i) f_N(R_i) 형태로 표현될 수 있으며, 여기서 f_N(·) 은 선택된 순위 가중함수이다. 예를 들어, 피셔‑예이츠 검정은 정규화된 정규점수, van der Waerden 검정은 Φ⁻¹(i/(N+1)) 등을 사용한다. 귀무분포를 정규근사로 대체하면 표본이 작거나 분포가 비대칭일 때 p‑값이 크게 왜곡될 수 있다. 이를 보완하기 위해 저자는 이중 새들포인트(saddlepoint) 근사를 도입한다. 핵심은 순열분포를 다변량 다항분포의 조건부 분포로 재구성하는 것이다. 구체적으로, N×1 지시벡터 Z_i 를 정의하고, Z_i 를 다항분포 Multinomial(1, θ₁,…,θ_N) 로부터 독립적으로 생성한 ζ_i 로 대체한다. 그런 다음 전체 순열분포는 ζ_i 들이 ∑ ζ_i = (1,…,1)ᵀ 를 만족하는 조건부 분포와 동일해진다. 이 조건부 분포의 결합 누적 생성함수 K(s,t)=log M(s,t) 를 이용해 새들포인트 방정식 ∂K/∂s_j = 0 (j = 1,…,N‑1), ∂K/∂t = 0 을 풀면 ŝ와 t̂ 를 얻는다. 여기서 M(s,t)=∑_{i=1}^{N} ∏_{j=1}^{N‑1} θ_j exp(s_j + r_{ij} t) + θ_N이며, r_{ij}=f_N(i)

순열 분포를 이용한 독립성 검정의 새 접근법

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기