볼타우센 스니트만 코알레센트 대립유전자 빈도 스펙트럼 점근 분석
본 논문은 무한 대립유전자 모델에서 볼타우센‑스니트만 코알레센트가 만든 대립유전자 빈도 스펙트럼의 대규모 샘플에 대한 정확한 점근적 스케일을 구한다. 단일체(싱글톤) 블록은 log n / n 비율로, 크기 k≥2 블록은 (log n)² / n 비율로 수렴함을 보이며, 전체 블록 수 역시 log n / n 비율을 갖는다. 증명은 코알레센트와 돌연변이 과정을 결합한 마코프 과정의 유체극한을 이용한다.
저자: Anne-Laure Basdevant, Christina Goldschmidt
논문은 무한 대립유전자 모델에서 유전적 변이가 코알레센트 트리의 골격에 포아송 과정으로 삽입되는 과정을 다룬다. 전통적인 킹맨 코알레센트에서는 Ewens 샘플링 공식이 정확한 확률분포를 제공하지만, 일반적인 Λ‑코알레센트에서는 명시적 해가 알려져 있지 않다. 특히 베타(2−α,α) 코알레센트(α∈(1,2))에 대해 최근 베레스티키·베레스티키·슈바인스버그가 블록 수 Nₖ(n) 의 점근적 비율을 구했으며, 이는 n^{α−2} 스케일을 따른다.
볼타우센‑스니트만 코알레센트는 Λ(dx)=dx 로 정의되며, 다중 합병이 빈번히 일어나면서도 합병률이 단순한 조합식으로 표현된다. 이 코알레센트는 ‘무한대로부터 내려오지 않는다’(coming down from infinity) 특성을 갖지 않으며, 따라서 큰 n 에서도 활성 블록이 지속적으로 존재한다. 논문은 이러한 특성을 활용해 대립유전자 파티션을 형성하는 과정을 ‘활성’ 블록이 코알레센트 규칙에 따라 합병하고, 일정률 ρ 로 ‘동결’되는 두 단계 모델로 재구성한다. 동결된 블록은 최종 대립유전자 파티션에 기록되며, 이는 유전적 변이와 동일시된다.
주요 변수는 Xₙₖ(t) (크기 k 인 활성 블록 수)와 Zₙₖ(t) (크기 k 인 동결 블록 수)이며, 이들을 합쳐 다차원 마코프 과정 Xₙ,d(t) 를 만든다. 시간 스케일을 log n 으로 축소하고, 각 좌표마다 서로 다른 공간 스케일을 적용한다. 구체적으로 싱글톤에 대해서는 \(\bar X_{n,1}(t)=\frac{1}{n}X_{n,1}(t\log n)\) 를 log n 배, k≥2 에 대해서는 \(\bar X_{n,k}(t)=\frac{\log n}{n}X_{n,k}(t\log n)\) 로 스케일링한다. 동결 블록 Zₙ₁(t) 은 \(\frac{1}{n}Z_{n,1}(t\log n)\) 를 log n 배, Zₙₖ(k≥2) 은 \(\frac{(\log n)^2}{n}Z_{n,k}(t\log n)\) 로 스케일링한다. 이렇게 정의된 과정은 Darling‑Norris 의 유체극한 이론에 따라 연속적인 결정론적 궤적 xₖ(t), zₖ(t) 로 수렴한다. 여기서 x₁(t)=e^{-t}, xₖ(t)=t e^{-t} (k−1)/k! (k≥2), z₁(t)=ρ(1−e^{-t}), zₖ(t)=ρ k(k−1)(1−e^{-t}−t e^{-t}) (k≥2) 로 정의된다.
극한 궤적을 t→∞ 로 보낼 때, x₁(∞)=0, xₖ(∞)=0 (k≥2) 이지만 z₁(∞)=ρ, zₖ(∞)=ρ k(k−1) 가 된다. 따라서 n→∞ 일 때
\
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기