초기 진화의 첫 원리 모델: 유전자 패밀리와 종, 선호 단백질 폴드의 등장
본 연구에서는 표현형인 개체의 수명과 유전체인 단백질의 네이티브 안정성을 직접 연결시키는 미시 물리 모델을 구축하였다. 모델 내에서 단백질 안정성은 정확히 계산 가능하도록 설계되었으며, 이를 기반으로 컴퓨터 시뮬레이션을 수행하였다. 시뮬레이션 결과, 안정적인 서열‑구조 조합(안정적인 단백질 전구체)이 처음 발견되는 순간 인구가 급격히 증가하는 ‘빅뱅’ 현상
초록
본 연구에서는 표현형인 개체의 수명과 유전체인 단백질의 네이티브 안정성을 직접 연결시키는 미시 물리 모델을 구축하였다. 모델 내에서 단백질 안정성은 정확히 계산 가능하도록 설계되었으며, 이를 기반으로 컴퓨터 시뮬레이션을 수행하였다. 시뮬레이션 결과, 안정적인 서열‑구조 조합(안정적인 단백질 전구체)이 처음 발견되는 순간 인구가 급격히 증가하는 ‘빅뱅’ 현상이 일관되게 나타났다. 이후 구조 공간의 무작위 다양성은 소수의 선호 폴드로 급격히 수축하였다. 이러한 폴드들은 돌연변이 혹은 개체 수명보다 훨씬 긴 시간 동안 인구 내에 지속적으로 존재했으며, 지배적인 폴드의 지속 시간 분포는 대략적인 멱법칙을 따른다. 새로운 폴드가 발견되는 시간 스케일과 새로운 서열이 생성되는 시간 스케일이 분리됨에 따라, 실제 단백질에서 관찰되는 것과 유사한 멱법칙적 크기 분포를 갖는 유전자 패밀리와 슈퍼패밀리가 형성된다. 인구 수준에서는 유사한 유전체를 공유하는 하위 집단, 즉 종이 자율적으로 등장한다. 또한 단백질 안정성과 유전체 크기 사이의 관계를 설명하는 간단한 이론을 제시한다. 이 결과들은 초기 진화 과정에서 최초의 유전자 패밀리가 어떻게 형성되었는지를 미시적·첫 원리적 관점에서 설명한다.
상세 요약
이 논문은 초기 생명체의 진화를 물리학적 첫 원리에서 접근한다는 점에서 매우 혁신적이다. 기존의 진화 모델은 주로 선택 압력, 환경 변화, 혹은 유전적 drift와 같은 거시적 요인에 의존했지만, 여기서는 단백질의 열역학적 안정성을 직접적으로 ‘생존’이라는 표현형에 연결한다. 모델은 각 유전자를 단백질 서열로 간주하고, 해당 서열이 채택한 고유 구조(폴드)의 네이티브 상태 에너지를 정확히 계산한다. 이는 일반적인 ‘스코어링 함수’를 사용하는 기존 방법과 달리, 실제 물리‑화학적 원리를 적용한 것이며, 따라서 시뮬레이션 결과에 대한 해석이 보다 직관적이다.
시뮬레이션 과정에서 관찰된 ‘빅뱅’ 현상은, 어느 순간 안정적인 폴드가 처음 등장하면서 그 폴드를 가진 개체들의 사망률이 급격히 감소하고, 복제율이 증가함에 따라 인구가 기하급수적으로 성장하는 것을 의미한다. 이는 실제 초기 생명체가 ‘핵심 효소’ 혹은 ‘핵심 구조’를 획득함으로써 급격한 번식을 시작했을 가능성을 시사한다. 또한, 구조 공간이 소수의 선호 폴드로 수축한다는 결과는 ‘폴드 스페이스’가 제한적이며, 진화가 진행될수록 특정 폴드가 반복적으로 재사용된다는 가설을 뒷받침한다.
흥미로운 점은 지배적인 폴드의 지속 시간이 멱법칙을 따른다는 것이다. 이는 몇몇 폴드가 매우 오래 지속되는 반면, 다수는 짧은 시간 내에 사라진다는 ‘파레토 법칙’적 현상을 의미한다. 이러한 현상은 실제 단백질 데이터베이스에서 관찰되는 ‘핵심 폴드’와 ‘희귀 폴드’의 분포와도 일맥상통한다.
또한, 새로운 폴드가 발견되는 시간 스케일과 새로운 서열이 생성되는 시간 스케일이 명확히 구분된다는 점은, ‘폴드 발견’이 ‘서열 변이’보다 드물고 중요한 진화적 사건임을 강조한다. 이때문에 동일한 폴드 내에서 다양한 서열이 축적되어 유전자 패밀리와 슈퍼패밀리가 형성되며, 그 크기 분포가 멱법칙을 따른다는 결과는 실제 생물학적 데이터와 높은 일치성을 보인다.
인구 수준에서 종이 자율적으로 형성된다는 관찰은, 유전체가 유사한 개체들이 집단적으로 존재하게 되면 내부 교환이 활발해지고, 외부와는 차별화된 ‘생태적 틈새’를 차지하게 된다는 전통적 종 개념과도 부합한다. 마지막으로, 단백질 안정성과 유전체 크기 사이의 관계를 설명하는 간단한 이론은, 안정적인 단백질이 더 큰 유전체를 유지할 수 있게 함으로써 복잡성 증가에 대한 물리적 제한을 제시한다.
전체적으로 이 연구는 ‘단백질 물리학 → 개체 생존 → 인구·종 진화’라는 일련의 인과관계를 정량적으로 보여줌으로써, 초기 생명체가 어떻게 복잡한 유전자 네트워크와 구조적 다양성을 획득했는지를 첫 원리 수준에서 설명한다. 다만 모델이 실제 세포 내 복합적인 대사 네트워크, 환경 변동성, 그리고 수평 유전자 전달 등을 배제하고 있다는 점은 향후 연구에서 보완될 필요가 있다.
📜 논문 원문 (영문)
🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...