루트된 계통수의 노드 거리와 분할 경로 길이 매트릭스
** 본 논문은 기존의 경로 길이 벡터가 비가중 이진 루트 계통수만을 구분한다는 한계를 극복하고, 각 두 택소노미 사이의 경로를 최소공통조상(LCA)에서 각각의 택소노미까지의 두 부분 길이로 분할한다. 이 분할 길이 매트릭스는 임의의 루트 계통수(중첩 택소노미와 양의 실수 가중치 포함)를 유일하게 식별한다. 이를 기반으로 실수‑값 n×n 행렬 공간의 L^p 노름을 이용한 새로운 거리(metric)를 정의하고, 비가중 트리 경우의 기본 성질을…
저자: Gabriel Cardona, Merce Llabres, Francesc Rossello
**
본 논문은 계통수 비교를 위한 거리(metric) 정의에 있어 오래된 “노드 거리”(path‑length) 접근법의 한계를 정확히 짚고, 이를 보완하는 새로운 프레임워크를 제시한다. 서론에서는 현대 유전체·메타유전체 데이터의 폭발적 증가와 이에 따른 다수의 계통수 생성이 빈번해짐에 따라, 계통수 간 차이를 정량화하는 메트릭의 필요성을 강조한다. 기존에는 Robinson‑Foulds, nearest‑neighbor‑interchange, subtree‑transfer 등 다양한 메트릭이 제안되었으며, 1970‑80년대부터는 잎 사이 거리 벡터를 이용한 “노드 거리” 기반 메트릭이 사용되어 왔다. 그러나 Smolenskii 정리는 무루트 트리에서만 거리 벡터가 트리를 완전히 규정한다는 점을 밝히고, 루트가 있는 경우에는 동일한 거리 벡터를 갖는 비동형 트리가 존재함을 보여준다(그림 1‑3).
제2장에서는 기본 용어와 정의를 정리한다. 루트 트리, 가중치 함수, LCA, 중첩 택소노미 등 필요한 개념을 명확히 하고, 경로 길이 L_T(i, j) = ℓ_T(i, j) + ℓ_T(j, i) 를 정의한다. 이어서 “경로 길이 벡터” L(T) 를 소개하고, Proposition 1을 통해 비가중 이진 트리에서는 이 벡터가 트리를 완전히 구분한다는 것을 증명한다(증명은 Smolenskii 정리와 가중 무루트 트리 변환을 이용).
핵심 기여는 제3장에서 제시된다. 저자들은 각 (i, j) 쌍에 대해 LCA인
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기