표준화된 무작위 순열의 사이클 구조와 극한 분포

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

표준화된 순열 모델을 정의하고, 사이클 길이별 개수의 정확한 결합분포를 원시 단어 개념으로 기술한다. 짧은 사이클은 포아송 또는 독립 기하분포 합으로 수렴하고, 큰 사이클은 파라미터 1의 포아송‑디리클레 과정으로 수렴한다. 전체 사이클 수는 로그 정규화 후 표준 정규분포에 수렴한다.

상세 분석

본 논문은 i.i.d. 이산 확률변수 G₁,…,Gₙ을 이용해 정의되는 “표준화된 순열(std(G))” 모델을 제시한다. Gₖ가 원자 없는 연속분포이면 std(G)는 균등 순열이 되지만, 여기서는 값이 가산집합 I에 한정된 경우를 다룬다. 핵심은 순열의 사이클을 Gₖ의 값 패턴과 연결시키는 것이다. 길이 k인 사이클이 특정 값 튜플 (i₁,…,i_k)∈Iᵏ에 대응하려면 (i₁,…,i_k)가 원시 단어(primitive word)이어야 하며, 서로 순환(conjugate) 관계가 없는 원시 단어들의 집합을 Q_k라 정의한다. 정리 1.1은 각 원시 단어 i∈Q_k에 대해 D_i(=그 원시 단어에 해당하는 k‑사이클 수)들의 결합확률을
P(D_{i₁}≥ℓ₁,…,D_{i_r}≥ℓ_r)=p_{i₁}^{ℓ₁}⋯p_{i_r}^{ℓ_r} (∑k_jℓ_j≤n)
로 정확히 구한다. 여기서 p_i는 Gₖ가 i가 될 확률이며, p_{i}=∏{j=1}^{k}p{i_j}. 이 결과는 기존의 리플‑셔플·메이저‑인덱스 편향 순열에 대한 알려진 식을 일반화한다.

짧은 사이클(길이 ≤K)에 대해서는 D_i가 n→∞일 때 독립적인 Geo₀(1−p_i) 분포로 수렴함을 보인다(정리 1.2). 따라서 c_k(=길이 k 사이클 수)는 Q_k에 속한 모든 D_i의 합이 되며, ℓ₁ 수렴을 이용해 (c₁,…,c_K)→(∑{i∈Q₁}X_i,…,∑{i∈Q_K}X_i) 로 약한 수렴한다. 여기서 X_i∼Geo₀(1−p_i) 독립이다. p_i가 점점 작아져 max_i p_i→0이면 각 c_k는 포아송(λ=1) 분포와 독립적인 곱으로 수렴한다(정리 1.4).

큰 사이클에 대해서는 순열을 크기 순으로 정렬한 무한 차원 벡터 λ^{(n)}=(λ₁^{(n)}/n,λ₂^{(n)}/n,…)를 고려한다. p_i가 일정 상수 R<1 이하로 제한되면(정리 1.5) λ^{(n)}는 파라미터 1의 포아송‑디리클레 과정에 수렴한다. 증명은 균등 순열에 대한 기존 결과와 결합 모멘트 수렴 기준을 이용한다.

전체 사이클 수 K_n=∑_{k≥1}c_k에 대해서는 로그 정규화 후 표준 정규분포로 수렴함을 보인다(정리 1.6). 증명은 누적량(cumulants)과 레오노프‑시리예프 공식에 기반한 모멘트 생성 함수 분석을 사용한다. 이 CLT는 리플‑셔플 모델에서도 새롭게 얻어진 결과이다.

결과적으로 논문은 표준화된 순열이라는 하나의 통합 프레임워크 안에서, 사이클 구조에 대한 정확한 분포식, 짧은 사이클의 포아송·기하 합, 큰 사이클의 포아송‑디리클레 극한, 그리고 전체 사이클 수의 정규극한을 모두 제공한다. 이는 기존 비균등 순열 모델들을 포함·확장하며, 원시 단어와 순열 사이클 사이의 깊은 조합적 연결을 밝힌다.

표준화된 무작위 순열의 사이클 구조와 극한 분포

초록

상세 분석

댓글 및 학술 토론

의견 남기기