게놈 진화에 법칙이 존재하는가
초록
**
이 논문은 유전체와 분자 표현형 사이에 나타나는 보편적인 정량적 패턴들을 ‘진화의 법칙’으로 간주할 수 있는지를 탐구한다. 로그정규분포의 유전자 진화 속도, 파라로그 유전자군의 멱법칙적 크기 분포, 진화 속도와 발현 수준의 음의 상관관계, 그리고 기능군별 유전자 수와 전체 유전체 크기의 비선형 스케일링 등 네 가지 주요 유니버설을 제시한다. 저자는 선택을 명시적으로 포함하지 않는 출생‑소멸‑혁신(birth‑death‑innovation) 모델 등 물리학적 수학 모델이 이러한 패턴을 재현함을 보여주며, 이러한 현상이 선택에 의해 직접 조정된 것이 아니라 유전자 집합의 집단적·통계적 특성에서 자연스럽게 발생하는 ‘ emergent’ 현상이라고 주장한다.
**
상세 분석
**
논문은 먼저 현대 유전체학과 시스템생물학이 제공하는 방대한 데이터(전장 게놈, 전사체, 단백질체, 상호작용망 등)를 정량적으로 분석함으로써 네 가지 보편적 현상을 도출한다. 첫째, 서로 다른 계통(세균, 고세균, 진핵생물)에서 직교 유전자의 진화 속도 분포가 거의 동일한 로그정규 형태를 띤다. 이는 35억 년에 걸친 진화 동안 유전자의 기능적 다양성과 복제 수가 크게 변했음에도 불구하고 유지되는 강인한 통계적 구조임을 시사한다. 둘째, 파라로그 유전자군의 크기와 생물학적 네트워크(예: 단백질‑단백질 상호작용, 대사망)의 노드 차수는 멱법칙적 분포를 보이며, 이는 ‘스케일프리’ 네트워크의 전형적인 특성이다. 셋째, 유전자의 서열 진화 속도와 발현 수준(또는 단백질 풍부도) 사이에 뚜렷한 음의 상관관계가 존재한다. 이는 고발현 유전자가 구조적 안정성을 유지하기 위해 진화 속도가 억제된다는 ‘misfolding‑driven’ 가설과 일맥상통한다. 넷째, 기능군별 유전자 수는 전체 유전체 크기에 대해 선형, 2차, 혹은 그 이상의 스케일링을 보이며, 이는 대사 효소와 조절 유전자의 진화적 압력이 서로 다름을 반영한다.
이러한 유니버설을 설명하기 위해 저자는 ‘출생‑소멸‑혁신’ 모델을 중심으로 여러 수학적 프레임워크를 제시한다. 출생(복제), 소멸(제거), 혁신(새로운 유전자군 획득)이라는 세 가지 기본 과정을 확률적으로 결합하면, 파라로그 군의 멱법칙 분포와 기능군 스케일링을 동시에 재현할 수 있다. 특히, 혁신률과 복제·소멸률 사이의 정밀한 균형이 관측된 지수와 일치한다는 점이 주목할 만하다. 또한, 단백질 접힘 물리학을 기반으로 한 모델은 발현 수준과 진화 속도 사이의 음의 상관관계를 ‘단백질 오작동 비용’이라는 단일 결정 요인으로 설명한다.
선택 압력의 직접적 역할을 배제한 이러한 모델들은 ‘선택‑중립’ 대립을 넘어, 복잡계 이론에서 말하는 ‘emergent property’ 개념을 적용한다. 즉, 개별 유전자는 약한 상호작용을 할 뿐이지만, 대규모 집합으로서 통계적 법칙을 형성한다는 점에서 이상기체 모델과 유사하다. 저자는 네트워크 구조가 무작위 복제와 서브기능화 과정을 통해 자연스럽게 스케일프리와 모듈러성을 획득한다는 실험적 증거(예: C. elegans 돌연변이 축적 라인)도 제시한다. 이러한 결과는 전통적인 적응적 해석을 넘어, 진화적 현상이 물리학적 법칙과 유사한 수준의 일반성을 가질 수 있음을 시사한다.
마지막으로, 저자는 진화 과정이 역사적 우연성과 적응적 ‘티킹’에 크게 좌우되기 때문에 완전한 물리학적 이론은 불가능하다고 인정한다. 그럼에도 불구하고, 관측된 보편적 패턴과 이를 재현하는 간단한 수학 모델이 존재한다는 점은 ‘진화 유전체학의 법칙’이라는 개념을 충분히 정당화한다는 결론에 이른다.
**
댓글 및 학술 토론
Loading comments...
의견 남기기