공동조상 트리에서 체리와 피치포크의 정확한 열거와 확률 분석

본 논문은 코얼센트 모델에 의해 생성된 순위 트리에서 체리(두 잎을 가진 내부 노드)와 피치포크(세 잎을 가진 서브트리)의 개수를 정확히 셈하고, 그 확률분포와 기대값·분산을 생성함수와 재귀식을 이용해 구한다. 또한 두 트리가 동일할 확률과 체리·피치포크의 결합조건부분포도 제시한다.

저자: Filippo Disanto, Thomas Wiehe

공동조상 트리에서 체리와 피치포크의 정확한 열거와 확률 분석
본 논문은 코얼센트 모델에 의해 무작위로 생성되는 순위 트리(Ranked tree)의 구조적 특성을 정확히 열거하고, 체리와 피치포크라는 두 가지 중요한 서브트리 형태의 개수를 확률적으로 분석한다. 서론에서는 계통수와 유전학적 계통분석에서 이진 무순서 트리의 중요성을 강조하고, 특히 내부 노드가 두 자식을 갖는 경우(체리)와 세 자식을 갖는 경우(피치포크)가 진화 과정에서 어떤 의미를 갖는지 설명한다. 2절에서는 기본 정의와 기호를 정리한다. 외부 노드(leaf)의 수를 n이라 하고, 내부 노드에 1부터 n‑1까지 라벨을 부여해 시간 순서를 반영한다. 내부 노드 중 두 잎을 직접 연결하는 경우를 ‘체리’(cherry)라 정의하고, 세 잎을 포함하는 서브트리를 ‘피치포크’(pitchfork)라 명명한다. 순위 트리 집합을 R, 크기 n인 트리 집합을 R_n이라 두며, |R_n|는 sec x + tan x의 계수인 오일러 수와 동일함을 언급한다. 3절에서는 핵심 결과를 전개한다. 먼저 외부 노드를 제거한 뒤 남은 구조를 0‑1‑2 증가 트리(I_{012})와 일대일 대응시킨다. 이때 차수 0(잎), 1, 2인 노드의 개수를 각각 o, p, q라 두고, Θ 연산을 통해 새로운 노드를 기존 차수가 0 또는 1인 노드에 삽입하는 재귀 규칙을 만든다. 이 규칙을 지수 생성함수 Y(x,z)=∑_{t∈I_{012}} x^{o(t)}z^{m(t)}/m(t)! 로 전환하면, x(1‑2x)∂Y/∂x + (xz‑1)∂Y/∂z = –xY‑x 이라는 1차 편미분 방정식을 얻는다. 특성곡선 방법을 적용해 해를 구하고, 최종적으로 Y(x,z)=√{2x‑1}·tan\!\bigl(−z√{2x‑1}+2\arctan√{2x‑1}\bigr)‑1 를 도출한다. x=¼을 대입하면 Y(¼,z)의 전개계수를 통해 두 독립적인 순위 트리가 동일할 확률 p_n을 구할 수 있다. 구체적인 값은 p₂=1, p₃=1, p₄=5/9, p₅=2/9, p₆=16/225 등이며, 이는 트리 동형성 확률을 정량화하는 데 유용하다. 다음으로 체리 개수에 대한 정확한 확률분포를 구한다. 가중 생성함수 F(x,z)=∑_{t∈R_n} 2^{n‑1‑o(t)}/(n‑1)!·x^{o(t)}z^{n} 를 정의하고, Y와의 관계를 이용해 F(x,z)=z·x·exp\!\bigl(2z√{‑x+1}‑z x(√{‑x+1}‑1)\bigr)+… 와 같은 형태를 얻는다. 이 함수의 x^{o}z^{n} 계수를 추출하면 크기 n인 트리에서 정확히 o개의 체리가 존재할 확률 P_n(o) =

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기