큰 편향에 의해 강제된 마코프 과정과 유전학 적용
본 논문은 강한 드리프트가 존재해 상태공간의 부분집합으로 빠르게 끌리는 마코프 과정들의 극한 거동을 마팅게일 문제 기법으로 분석한다. 일반적인 수렴 정리를 증명한 뒤, 이를 두 부모가 참여하는 Moran 모델에 적용하여 복제수 변이의 평균과 분포가 확산 과정으로 수렴함을 보인다.
저자: ** - Samuel Adeosun (University of Freiburg, Germany) – samuel.adeosun@stochastik.uni-freiburg.de - Philipp Pfaffelhuber (University of Freiburg, Germany) – p.p@stochastik.uni-freiburg.de **
본 논문은 “큰 편향에 의해 강제된 마코프 과정과 유전학 적용”이라는 제목 아래, 두 가지 주요 목표를 가지고 있다. 첫 번째는 강한 드리프트가 존재해 마코프 과정이 특정 부분공간으로 빠르게 끌리는 상황을 일반적인 수학적 프레임워크로 정리하는 것이며, 두 번째는 이 일반 결과를 두 부모가 참여하는 diploid Moran 모델에 적용해 복제수 변이(copy number variation, CNV)의 확률적 거동을 분석하는 것이다.
1. **일반 이론 구축**
- **모델 설정**: 상태공간 \(E\)와 그 부분집합 \(D\)를 두고, \(X^{N}\)가 생성자 \(G^{N}=N G^{N}_{1}+G^{N}_{0}\)를 갖는 마코프 과정이라고 가정한다. 여기서 \(G^{N}_{1}\)는 \(N\)에 비례하는 강한 드리프트, \(G^{N}_{0}\)는 비교적 약한 동역학을 담당한다.
- **매핑 \(\Phi\)**: \(\Phi:E\to D\)를 정의하고, 모든 \(g\in C_{b}(D)\)에 대해 \(g\circ\Phi\in D_{E}\)이며 \(G^{N}_{1}(g\circ\Phi)=0\)가 성립한다는 조건(2.2)을 둔다. 이는 빠른 시간척도에서는 \(\Phi(X^{N})\)가 변하지 않음을 의미한다.
- **핵심 가정**:
* **A1 (긴밀성)**: \(\Phi(X^{N})\)는 càdlàg 경로 공간에서, \(X^{N}\)는 점유 측도(occupation measure) 의미에서 각각 긴밀성을 만족한다.
* **A2 (생성자 수렴)**: 약한 생성자 \(G^{N}_{0}f\)가 어떤 제한 생성자 \(G_{0}f\)로 측도 의미에서 수렴한다.
* **A3 (역매핑 \(\Xi\))**: \(G^{N}_{1}f=0\)인 함수들의 값만으로 원 상태 \(x\)를 \(\Xi(\Phi(x))\)라는 매핑을 통해 복원할 수 있다. 즉, 빠른 동역학의 불변집합이 \(\Phi\)에 의해 완전히 규정된다.
- **정리 2.1**: 위 가정이 모두 성립하면, \(\Phi(X^{N})\)는 Skorohod 위상에서 확률 과정 \(Z\)로 수렴하고, \(X^{N}\)는 점유 측도 의미에서 \(\Xi(Z)\)에 수렴한다. 증명은 마팅게일 문제의 해 존재와 고유성을 이용하고, 제한 과정의 생성자를 직접 계산한다.
2. **유전학 모델 적용**
- **모델 설명**: 모집단 크기 \(N\)인 diploid Moran 모델을 고려한다. 각 개체는 복제수 \(k\in\mathbb N_{0}\)를 가지고, 번식 사건은 두 부모 \(a,b\)와 사망자 \(c\)를 무작위로 선택한다. 부모 \(a\)와 \(b\)는 각각 자신이 가진 유전 요소를 확률분포 \(p^{N}_{k}\)에 따라 자식에게 전달한다.
- **전이율**: (3.4)식에 따라 \(X^{N}\)는 \(x\to x+(e_{m}-e_{n})/N\) 형태의 점프를 하며, 전이율은 \(N^{2}\)에 비례한다.
- **관심 변수 \(\Phi\)**: 전체 인구의 평균 복제수 \(\rho_{1}(X^{N})=\sum_{j}j X^{N}_{j}\)를 선택한다. 이는 느린 변수이며, 빠른 동역학에 의해 거의 변하지 않는다.
- **두 가지 유전 요소 전달 분포**
1. **편향된 베르누이**: \(p^{N}_{k}=B(k,1/2+\varepsilon_{N})\)이며 \(\varepsilon_{N}\to\alpha/N\).
2. **균등 분포**: \(p^{N}_{k}=U\{0,\dots,k\}\).
- **가정 검증**: Lemma 4.1–4.5에서 빠른 생성자 \(G^{N}_{1}\)가 \(\Phi\)에 대해 0이 되는 것을 확인하고, 불변분포가 각각 포아송(Poisson)과 음이항(Negative Binomial)임을 보인다. A3에 해당하는 역매핑 \(\Xi\)는 \(\Xi(z)=\text{Poi}(z)\)와 \(\Xi(z)=\text{NB}(2,2/(2+z))\)가 된다.
- **느린 과정의 한계**: Lemma 4.2에서 \(G_{0}(g\circ\Phi)\)를 계산하면, 평균 \(\Phi\)에 대한 확산 방정식이 도출된다.
* **Case (i)**: \(dZ=\alpha Z\,dt+\sqrt{Z}\,dW\) (Cox–Ingersoll–Ross 형태).
* **Case (ii)**: \(dZ=pZ(Z+2)\,dW\) (분산이 \(Z(Z+2)\)인 확산).
- **전체 과정의 수렴**: Theorem 3.2에 따라 \((X^{N},\Phi(X^{N}))\)는 각각 \((\Xi(Z),Z)\)로 수렴한다. 즉, 평균 복제수는 위의 확산 방정식에 따라 움직이고, 전체 복제수 분포는 평균에 의해 파라미터화된 포아송 혹은 음이항 분포가 된다.
3. **기술적 기여와 의의**
- **일반 프레임워크**: 기존에 Katzenberger(1991)와 같은 반세미마르틴게일 접근법이 있었지만, 본 논문은 점유 측도 의미의 “측도 수렴”을 도입해 \(X^{N}\) 자체의 경로 수렴이 아니라 “측도 수렴”을 증명한다. 이는 빠른-느린 시스템에서 경로 수준의 수렴이 어려운 경우에 유용하다.
- **생성자 계산**: 팩토리얼 모멘트와 생성자 연산을 활용해 빠른 동역학의 불변분포를 명시적으로 구하고, 이를 통해 \(\Xi\)를 구성한다. 이는 복제수 변이 모델에서 실제 유전학적 해석을 가능하게 한다.
- **응용 가능성**: 제시된 일반 정리는 다른 생물학적 혹은 물리적 시스템(예: 화학 반응 네트워크, 생태계 모델)에서도 큰 드리프트가 존재하는 경우에 바로 적용될 수 있다.
4. **결론**
논문은 마팅게일 문제와 점유 측도 수렴을 결합한 새로운 방법론을 제시하고, 이를 diploid Moran 모델에 적용해 복제수 변이의 확률적 거동을 정확히 기술한다. 결과적으로 평균 복제수는 확산 과정으로, 전체 복제수 분포는 평균에 의해 파라미터화된 고정된 형태(포아송·음이항)로 수렴한다는 두 단계의 구조를 밝혀냈다. 이는 유전학적 변이 연구에 있어 큰 드리프트가 작용하는 상황을 정량적으로 이해하는 데 중요한 이론적 토대를 제공한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기