상수 k와 차수 D에서 최대 합의·호환 수퍼트리를 다항시간에 구하는 알고리즘
본 논문은 입력 트리 집합 𝒯 의 최대 합의 수퍼트리(MASP)와 최대 호환 수퍼트리(MCSP)를, 트리 개수 k와 최대 차수 D가 상수일 때 다항시간으로 해결하는 최초의 알고리즘을 제시한다. 루트가 있는 경우와 없는 경우를 모두 다루며, 특히 이진 트리에서는 기존 최선 알고리즘을 개선한다.
저자: Viet Tung Hoang, Wing-Kin Sung
본 논문은 다중 phylogenetic tree 집합 𝒯={T^{(1)},…,T^{(k)}}에 대해 두 가지 핵심 수퍼트리 문제, 즉 최대 합의 수퍼트리(MASP)와 최대 호환 수퍼트리(MCSP)를 다룬다. 각각은 입력 트리들의 잎 라벨이 부분집합으로 겹치는 경우, 가능한 가장 큰 공통 구조를 찾는 문제이며, k≥3일 때는 NP‑hard임이 알려져 있다. 저자들은 이러한 문제를 k와 각 트리의 최대 차수 D가 상수일 경우에 한해 다항시간 알고리즘으로 해결한다는 최초의 결과를 제시한다.
논문은 먼저 기본 용어와 정의를 정리한다. phylogenetic tree는 무순서이며 잎 라벨이 서로 구별되는 트리이며, T|S는 라벨 집합 S에 대해 트리를 제한한 결과이다. “refinement”는 트리의 일부 간선을 수축해 얻는 관계를 의미한다. MASP는 합의 수퍼트리 X가 각 입력 트리와 제한된 형태가 동일하도록 요구하고, MCSP는 호환 수퍼트리 Y가 각 입력 트리의 제한된 형태에 포함되는 관계를 만족한다.
핵심 알고리즘은 “cut‑subtree”와 “cut‑subforest”라는 새로운 구조를 도입한다. cut‑subtree는 한 내부 노드에 붙어 있는 서브트리들을 선택해 새로운 루트를 연결한 트리이며, cut‑subforest는 각 입력 트리마다 하나씩 선택된 cut‑subtree들의 집합이다. 모든 가능한 cut‑subforest의 수는 각 트리당 O(2^D n) 개 이하이며, 전체는 O((2^D n)^k) 로 제한된다.
MCSP를 해결하기 위해 “embedded superset” 개념을 정의한다. 이는 주어진 cut‑subforest A에 대해 A와 호환되면서, 각 입력 트리 i에 대해 L(Y)∩L(T_i)⊆L(A_i) 를 만족하는 트리 Y이다. 터미널 cut‑subforest(모두 빈 트리 혹은 잎만 포함)에서는 Λ(A)라는 잎 집합을 정의하고, 최적 해의 크기가 |Λ(A)|임을 증명한다. 비터미널인 경우, A를 두 부분 A_L, A_R 로 bipartition 하여 재귀식 mcsp(A)=max_{(A_L,A_R)}
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기