정규모델이 견딜 수 있는 t‑분포 정도
초록
본 논문은 실제 데이터가 자유도 m을 가진 t‑분포에서 생성되었을 때, 정규분포( m=∞ )를 가정하고 추정하는 것이 언제까지 유효한지를 정량적으로 규명한다. m이 표본크기 n 에 대해 m ≥ 1.458 √n 이면 잘못된 정규모델을 사용한 최대우도추정이 자유도 m 을 포함한 3‑파라미터 t‑모델보다 평균제곱오차가 작다. 또한 평균만을 추정하는 특수한 경우는 t‑성향이 2차항까지 무시될 수 있음을 보인다. 일반적인 정규 스케일 혼합 모델에 대해서도 분산 Var(S) ≤ 0.3429/√n 이라는 공통적인 허용 범위를 제시한다.
상세 분석
이 연구는 “코너 비대칭성(corner asymptotics)”이라는 비표준적인 대수적 접근을 사용한다. 핵심 파라미터 γ=1/m 이 0에 가까워지는 상황을 파라미터 공간의 내부가 아닌 경계점으로 취급함으로써, 전통적인 최대우도(MLE) 이론이 붕괴되는 경우를 다룬다. 저자는 먼저 γ 가 0에 수렴하는 로컬 이웃을 설정하고, Y_i 가 f(y,ξ₀,σ₀,δ/√n) 분포를 따르는 일련의 모델 P_n 을 고려한다. 여기서 δ 는 γ 의 스케일을 표본크기에 맞춰 조정한 값이다.
점수함수와 정보행렬을 전개한 결과, 좁은(정규) 모델의 추정량 (ξ̂_narr,σ̂_narr) 은 평균 0, 분산 σ₀² · J⁻¹_narr 을 갖는 정상적인 한계분포를 가진다. 반면, 넓은(3‑파라미터) 모델의 추정량 (ξ̂,σ̂,γ̂) 은 γ̂ 가 0이 될 확률이 양수이며, 이로 인해 한계분포가 조각별(piecewise) 형태를 띤다. 구체적으로 γ̂ 가 −δ/√n 보다 크면(즉, C≥−δ) 정상적인 정규분포가 나오고, 작으면( C≤−δ ) 편향이 추가된 형태가 된다.
이러한 한계분포를 바탕으로 평균제곱오차(MSE)를 계산하면, 좁은 모델의 위험도는
E
댓글 및 학술 토론
Loading comments...
의견 남기기