다변량 기호 통계의 원시 유리 모델에서의 대편차와 정규극한

다변량 기호 통계의 원시 유리 모델에서의 대편차와 정규극한
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

이 논문은 원시(primitive) 전이 가중치 행렬을 갖는 유리 확률 모델에서, 길이 n 인 무작위 단어에 등장하는 여러 기호들의 출현 횟수를 다변량 확률 변수 Yₙ으로 정의하고, 그 평균·공분산의 일차 근사식, 대편차 원리(LDP), 중간편차 원리, 그리고 √n 스케일에서의 다변량 정규극한을 체계적으로 증명한다. 핵심은 순간생성함수의 quasi‑power 성질을 이용해 Gartner‑Ellis 정리를 적용하는 데 있다.

상세 분석

본 연구는 유리 확률 모델을 비결정적 유한 자동화와 양의 전이 가중치 행렬 M 으로 표현한다. 알파벳 Σ={a₁,…,a_ℓ,b} 에서 길이 n 인 단어 w 를 선택할 확률은 ξᵀ Mⁿ η 으로 정규화된 가중치에 비례한다. 여기서 Yₙ=(|w|{a₁},…,|w|{a_ℓ}) 는 관심 대상이며, Yₙ 의 순간생성함수는
Ψₙ(t)=ξᵀ(A₁e^{t₁}+⋯+A_ℓe^{t_ℓ}+B)ⁿη / ξᵀMⁿη
으로 쓰인다. M이 원시(primitive)라면 Perron‑Frobenius 정리에 의해 λ>0와 양의 좌·우 고유벡터 u, vᵀ가 존재하고, Mⁿ≈λⁿ u vᵀ (1+O(εⁿ))가 된다. 이때 y(t) 를 M(t)=A₁e^{t₁}+⋯+A_ℓe^{t_ℓ}+B 의 Perron‑Frobenius 고유값이라 정의하면, y(t)는 전역적으로 실수값이며 y(0)=λ이다.

주요 기법은 Φₙ(t)=log Ψₙ(t) 에 대해 (1/n)Φₙ(t)→Λ(t)=log y(t) 을 보이는 quasi‑power 정리를 입증하는 것이다. Λ(t)는 전역적으로 미분 가능하고, 그 그래디언트 ∇Λ(0)=β 는 평균 비율을, 헤시안 HΛ(0) 는 공분산 행렬 V 을 제공한다. Gartner‑Ellis 정리에 따라 {Yₙ/n}는 속도 n 의 대편차 원리를 만족하고, 속도 함수는 I(x)=Λ⁎(x) (Λ의 Legendre‑Fenchel 변환)이다. I(x) 는 β에서만 0이 되므로, Yₙ/n→β 는 거의 확실하게 수렴한다.

또한, 임의의 스케일 aₙ→0 이면서 n aₙ→∞ 인 경우에 대해 √(n aₙ)(Yₙ/n−β) 는 속도 1/aₙ 의 중간편차 원리를 만족한다. 이때의 속도 함수 J(z)=½ zᵀ V⁻¹ z 는 표준 정규분포의 대칭성을 반영한다.

마지막으로, Λ의 2차 항을 이용해 중심극한정리를 증명한다. 즉, (Yₙ−β n)/√n → N(0,V) (다변량 정규분포)이며, 이는 기존의 단변량 결과를 자연스럽게 일반화한다. 논문은 또한 평균·공분산의 일차 근사식 E


댓글 및 학술 토론

Loading comments...

의견 남기기