혼합모델 동질성 검정을 위한 투사우도 대비법

본 논문은 혼합비가 사전에 0.5로 고정된 두 모집단 혼합모델에서 공통의 nuisance 파라미터가 존재할 때, 투사우도 대비(PLC) 통계량을 이용한 동질성 검정 방법을 제안한다. PLC는 전통적인 우도비 검정과 라오 점수 검정의 장점을 결합한 형태이며, 대표본 이론을 통해 그 asymptotic 분포를 유도하고, 가우시안 혼합을 대상으로 시뮬레이션을 수행해 영가설 하의 분포와 검정력 특성을 확인한다.

저자: ** - **Debapriya Sengupta** (Indian Statistical Institute) - **Rahul Mazumder** (Indian Statistical Institute) **

1. 서론 본 연구는 두 모집단의 혼합비가 사전에 0.5로 고정된 경우, 데이터가 실제로 두 분포의 혼합인지 단일 분포인지 판단하는 동질성 검정 문제를 다룬다. 특히, 혼합 모델의 주요 파라미터 θ와 공통 nuisance 파라미터 η를 구분하고, η가 알려지지 않은 상황에서도 검정이 가능하도록 설계한다. 기존 문헌에서는 LR 검정, 수정된 LR 검정, 그리고 점수 검정 등이 제안되었지만, 혼합 모델 특성상 Fisher 정보 행렬의 차원 감소와 비정규적인 극한 분포 때문에 χ² 근사가 잘 맞지 않는다는 한계가 있다. 2. 투사우도 대비(PLC) 통계량 정의 전체 로그우도 L_N(θ₁,θ₂,η)=∑_{i=1}^N log g(Z_i|θ₁,θ₂,η) 를 사용한다. 영가설 H₀:θ₁=θ₂ 일 때는 단일밀도 f(Z|θ,η) 로 축소된다. η에 대해 H₀ 하에서 MLE(ˆθ,ˆη)를 구하고, 이를 고정한 뒤 θ₁,θ₂만을 다시 최대화한다. 그 차이를 두 배로 곱한 것이 PLC 통계량 Λ_N이다. 이 절차는 “프로파일”을 만든 뒤 “투사”한다는 의미에서 명명되었다. 3. 대표본 이론 점수 함수 ξ_r(j)=∂^r_θ f(Z_j|ˆθ,ˆη)/f(Z_j|ˆθ,ˆη) 와 혼합 편미분 C_{Nij}= (∂_{θ₁}+∂_{θ₂})^i (∂_{θ₁}−∂_{θ₂})^j L_N(ˆθ,ˆθ) 를 정의한다. C_{Nij}는 이항 전개를 통해 ξ_r들의 다항식 형태로 표현된다. 특히 C_{N02}와 C_{N04}는 핵심적인 역할을 하며, C_{N02}=0이면 Λ_N은 확률 1로 0에 수렴한다. 반면 √N C_{N02}가 정규분포로 수렴하면 Λ_N은 c²·max(0,Z)² 형태의 비대칭 χ² 혼합분포에 수렴한다. 여기서 c²는 모델에 따라 계산되며, E_{H₀}

혼합모델 동질성 검정을 위한 투사우도 대비법

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기