죽은 종으로부터의 유전자 횡전이
초록
이 논문은 현존하는 종들의 부분적인 샘플만을 이용해 유전자 계통수를 추정할 때, 멸종하거나 샘플링되지 않은 종을 통한 횡전이가 전체 전이 사건의 대다수를 차지한다는 이론적·계산적 근거를 제시한다. 전체 종 다양성을 모델링한 후, 샘플된 종이 전체의 소수에 불과할 경우 대부분의 전이가 “죽은” 계통을 경유한다는 것을 보이고, 이를 몇 개의 전역 파라미터로 요약할 수 있음을 증명한다. 이를 바탕으로 유전자 계통수의 확률을 계산하고 최대우도 화해를 찾는 알고리즘을 개발했으며, 36종의 남조류 473개 유전체를 분석한 결과 전이 사건의 약 28%가 멸종/미샘플링된 종을 경유했지만, 실제로 공통 조상 이전으로 거슬러 올라가는 경우는 6%에 불과함을 보고한다.
상세 분석
본 연구는 전통적인 계통학적 가정, 즉 유전자는 현재 관찰 가능한 종들의 계통을 따라 진화한다는 전제에 도전한다. 저자들은 먼저 전체 종군을 생성하는 종분화 과정을 확률론적 birth‑death 모델로 정의하고, 이 모델을 통해 관찰되지 않은 ‘숨은’ 계통의 존재 확률을 정량화한다. 샘플링 비율이 낮을수록, 즉 전체 종 수에 비해 연구 대상이 되는 종이 적을수록, 숨은 계통을 통한 횡전이(LGT)의 비중이 급격히 증가한다는 수학적 증명을 제시한다. 핵심은 ‘extinct or unsampled lineages’ 를 독립적인 진화 단위로 취급할 수 있다는 가정이다. 이 가정 하에 전이 사건을 설명하는 복잡한 네트워크를 몇 개의 전역 파라미터—예를 들어 전이율, 사멸율, 샘플링 비율—로 요약함으로써, 기존에 불가능하다고 여겨졌던 전체 유전자 트리의 확률을 효율적으로 계산할 수 있다. 저자들은 이론적 모델을 기반으로 동적 프로그래밍 기반의 알고리즘을 설계했으며, 이는 주어진 종계통과 유전자 트리 사이의 최대우도 화해(reconciliation)를 찾는다. 실증 분석에서는 36종 남조류의 473개 거의 보편적인 유전자군을 대상으로 모델을 적용했으며, 전이 사건 중 28%가 ‘죽은’ 혹은 ‘샘플링되지 않은’ 계통을 경유한 것으로 추정되었다. 그러나 실제로 전이의 기원(ancestor)이 현재 샘플된 종들의 공통 조상 이전에 존재하는 경우는 6%에 불과해, 대부분의 전이가 비교적 최근의 숨은 계통을 통해 발생했음을 시사한다. 이 결과는 미생물 진화 연구에서 흔히 간과되는 ‘숨은’ 진화 경로의 중요성을 강조하며, 기존의 단순한 ‘수직적’ 진화 모델을 재검토하도록 촉구한다. 또한, 모델이 요구하는 파라미터가 비교적 적고 계산 효율성이 높아 대규모 메타게놈 데이터에 적용 가능하다는 실용적 장점도 갖는다.
댓글 및 학술 토론
Loading comments...
의견 남기기