단백질 안정성이 제한하는 생명 복잡성과 진화 속도

고전적 집단유전학은 대립유전자의 적합도를 단백질의 물리적·기능적 특성을 고려하지 않고 가정한다. 본 연구에서는 필수 유전자가 암호화하는 단백질의 안정성이 손실될 경우 치명적 표현형을 초래한다는 생리학적 전제를 두고, 적합도를 물리적 특성으로부터 추론할 수 있는 모델을 제시한다. 감마(Γ)개의 필수 유전자를 가진 유기체에서 돌연변이 축적은 각 차원마다 단백질

단백질 안정성이 제한하는 생명 복잡성과 진화 속도

초록

고전적 집단유전학은 대립유전자의 적합도를 단백질의 물리적·기능적 특성을 고려하지 않고 가정한다. 본 연구에서는 필수 유전자가 암호화하는 단백질의 안정성이 손실될 경우 치명적 표현형을 초래한다는 생리학적 전제를 두고, 적합도를 물리적 특성으로부터 추론할 수 있는 모델을 제시한다. 감마(Γ)개의 필수 유전자를 가진 유기체에서 돌연변이 축적은 각 차원마다 단백질 안정성 상실(흡수 경계)과 과도한 안정성(서열 부재)으로 제한되는 Γ차원 하이퍼큐브 내 확산으로 나타난다. 단백질의 점돌연변이에 대한 실험 데이터를 이용해 확산 방정식의 파라미터를 설정하고 해석함으로써, 기존 데이터와 일치하는 보편적인 단백질 안정성 분포를 도출한다. 이 이론은 돌연변이율, 최대 게놈 크기, 그리고 단백질의 열역학적 반응 사이의 근본적인 관계를 제시한다. 또한, 메소필성 생물은 필수 게놈 부분당 복제당 약 6개의 돌연변이, 고온성 생물은 1~2개의 돌연변이를 초과하면 치명적 돌연변이(리터럴 멀투전)로 인해 집단이 소멸한다는 ‘진화 속도 한계’를 예측한다. 오류 교정이 없을 경우 현대 RNA 바이러스와 원시 게놈은 반드시 매우 짧아야 하며, 실제로 몇몇 RNA 바이러스는 이 한계에 근접한다. 반면 DNA 바이러스와 비돌연변이 박테리아는 오류 교정 메커니즘을 통해 자연적인 속도 한계보다 약 1000배 낮은 진화 속도를 유지한다.

상세 요약

이 논문은 전통적인 집단유전학이 “적합도는 유전자의 형태만으로 결정된다”는 전제에 도전한다. 실제 생물학적 시스템에서는 유전자가 암호화하는 단백질의 물리‑화학적 특성이 생존과 직접 연결된다. 특히, 필수 단백질이 충분한 구조적 안정성을 유지하지 못하면 세포는 기능을 상실하고 사멸한다는 가정은, 단백질 폴딩과 열역학을 진화론에 통합하려는 시도로서 매우 혁신적이다.

논문은 ‘감마 차원 하이퍼큐브’라는 수학적 틀을 도입한다. 여기서 각 차원은 하나의 필수 유전자를 나타내며, 그 좌표값은 해당 단백질의 자유 에너지(안정성) 수준을 의미한다. 돌연변이는 이 하이퍼큐브 안에서 무작위 확산을 일으키지만, 어느 한 차원의 안정성이 임계값 이하가 되면 그 경계는 흡수(죽음) 경계가 된다. 반대로 너무 높은 안정성은 단백질 서열 공간이 제한되어 실제 존재할 수 없는 영역을 형성한다(상한 경계). 이러한 경계 조건을 갖는 확산 방정식을 풀면, 전체 유전체가 유지할 수 있는 안정성의 확률 분포가 도출된다.

핵심 결과는 두 가지이다. 첫째, 실험적으로 측정된 단백질 돌연변이 효과(ΔΔG)와 평균 돌연변이율을 이용하면, ‘보편적인’ 단백질 안정성 분포가 예측되고 이는 실제 단백질 데이터베이스와 일치한다는 점이다. 이는 단백질이 진화 과정에서 “안정성의 최적화”가 아니라 “안정성의 허용 범위 내에서 무작위 탐색”을 한다는 기존 가설을 뒷받침한다.

둘째, 돌연변이율과 게놈 크기의 곱이 일정 임계값을 초과하면 전체 개체군이 ‘치명적 돌연변이’를 겪어 소멸한다는 ‘진화 속도 한계’를 제시한다. 메소필(중온성) 생물의 경우 필수 유전자의 평균 길이를 고려했을 때, 복제당 약 6개의 돌연변이가 한계이며, 고온성(thermophilic) 생물은 단백질이 열에 더 민감해 1~2개의 돌연변이만으로도 한계에 도달한다. 이는 기존에 제시된 “오류 정정 한계”(error‑threshold)와 수치적으로 일치하면서도, 물리적 근거(단백질 안정성 손실)를 제공한다.

또한, RNA 바이러스는 오류 교정 효소가 거의 없고, 게놈이 짧으며, 높은 복제 속도로 인해 이 한계에 근접한다는 실증적 관찰과 일치한다. 반면 DNA 바이러스와 박테리아는 DNA 복제 기구에 내재된 교정 메커니즘 덕분에 실제 돌연변이율이 이론적 한계보다 약 10⁻³ 수준으로 낮아, 진화 속도가 크게 억제된다. 이는 ‘왜 DNA 바이러스는 큰 게놈을 가질 수 있는가’, ‘왜 RNA 바이러스는 짧은 게놈에 머무는가’에 대한 물리‑생물학적 설명을 제공한다.

결론적으로, 이 연구는 단백질 물리학을 진화론에 정량적으로 연결함으로써, “게놈 크기‑돌연변이율”이라는 전통적 제약 외에 “단백질 안정성‑열역학”이라는 새로운 제약을 제시한다. 이는 바이러스학, 합성생물학, 그리고 초기 생명 기원 연구에 있어 중요한 이론적 토대를 제공한다.


📜 논문 원문 (영문)

🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...