표준화된 무작위 순열의 사이클 구조와 극한 분포

표준화된 무작위 순열의 사이클 구조와 극한 분포
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

표준화된 순열 모델을 정의하고, 사이클 길이별 개수의 정확한 결합분포를 원시 단어 개념으로 기술한다. 짧은 사이클은 포아송 또는 독립 기하분포 합으로 수렴하고, 큰 사이클은 파라미터 1의 포아송‑디리클레 과정으로 수렴한다. 전체 사이클 수는 로그 정규화 후 표준 정규분포에 수렴한다.

상세 분석

본 논문은 i.i.d. 이산 확률변수 G₁,…,Gₙ을 이용해 정의되는 “표준화된 순열(std(G))” 모델을 제시한다. Gₖ가 원자 없는 연속분포이면 std(G)는 균등 순열이 되지만, 여기서는 값이 가산집합 I에 한정된 경우를 다룬다. 핵심은 순열의 사이클을 Gₖ의 값 패턴과 연결시키는 것이다. 길이 k인 사이클이 특정 값 튜플 (i₁,…,i_k)∈Iᵏ에 대응하려면 (i₁,…,i_k)가 원시 단어(primitive word)이어야 하며, 서로 순환(conjugate) 관계가 없는 원시 단어들의 집합을 Q_k라 정의한다. 정리 1.1은 각 원시 단어 i∈Q_k에 대해 D_i(=그 원시 단어에 해당하는 k‑사이클 수)들의 결합확률을
P(D_{i₁}≥ℓ₁,…,D_{i_r}≥ℓ_r)=p_{i₁}^{ℓ₁}⋯p_{i_r}^{ℓ_r} (∑k_jℓ_j≤n)
로 정확히 구한다. 여기서 p_i는 Gₖ가 i가 될 확률이며, p_{i}=∏{j=1}^{k}p{i_j}. 이 결과는 기존의 리플‑셔플·메이저‑인덱스 편향 순열에 대한 알려진 식을 일반화한다.

짧은 사이클(길이 ≤K)에 대해서는 D_i가 n→∞일 때 독립적인 Geo₀(1−p_i) 분포로 수렴함을 보인다(정리 1.2). 따라서 c_k(=길이 k 사이클 수)는 Q_k에 속한 모든 D_i의 합이 되며, ℓ₁ 수렴을 이용해 (c₁,…,c_K)→(∑{i∈Q₁}X_i,…,∑{i∈Q_K}X_i) 로 약한 수렴한다. 여기서 X_i∼Geo₀(1−p_i) 독립이다. p_i가 점점 작아져 max_i p_i→0이면 각 c_k는 포아송(λ=1) 분포와 독립적인 곱으로 수렴한다(정리 1.4).

큰 사이클에 대해서는 순열을 크기 순으로 정렬한 무한 차원 벡터 λ^{(n)}=(λ₁^{(n)}/n,λ₂^{(n)}/n,…)를 고려한다. p_i가 일정 상수 R<1 이하로 제한되면(정리 1.5) λ^{(n)}는 파라미터 1의 포아송‑디리클레 과정에 수렴한다. 증명은 균등 순열에 대한 기존 결과와 결합 모멘트 수렴 기준을 이용한다.

전체 사이클 수 K_n=∑_{k≥1}c_k에 대해서는 로그 정규화 후 표준 정규분포로 수렴함을 보인다(정리 1.6). 증명은 누적량(cumulants)과 레오노프‑시리예프 공식에 기반한 모멘트 생성 함수 분석을 사용한다. 이 CLT는 리플‑셔플 모델에서도 새롭게 얻어진 결과이다.

결과적으로 논문은 표준화된 순열이라는 하나의 통합 프레임워크 안에서, 사이클 구조에 대한 정확한 분포식, 짧은 사이클의 포아송·기하 합, 큰 사이클의 포아송‑디리클레 극한, 그리고 전체 사이클 수의 정규극한을 모두 제공한다. 이는 기존 비균등 순열 모델들을 포함·확장하며, 원시 단어와 순열 사이클 사이의 깊은 조합적 연결을 밝힌다.


댓글 및 학술 토론

Loading comments...

의견 남기기