p진법을 이용한 유전체와 유전암호 모델링
초록
이 논문은 뉴클레오타이드, 코돈, DNA·RNA 서열, 아미노산, 단백질을 각각 p‑진법 정보공간에 매핑함으로써 유전체와 유전암호를 수학적으로 모델링한다. 각 시스템에 고유한 소수(p)를 할당하고, p‑adic 거리 개념을 이용해 코돈 간의 유사성 및 유전암호의 퇴화 현상을 설명한다. 또한 초기 유전암호가 단일 뉴클레오타이드와 네 종류의 아미노산으로 구성되었다는 진화 가설을 제시한다.
상세 분석
본 연구는 유전정보를 ‘정보 시스템’으로 간주하고, p‑adic 수 체계를 적용해 각 단계별 생물학적 요소를 정량화한다. 먼저 4개의 핵산 염기(A, C, G, T/U)를 2‑adic(또는 5‑adic) 공간에 매핑하여 염기 간 거리와 변이를 p‑adic 거리로 정의한다. 코돈은 3개의 염기로 이루어지므로 5‑adic(또는 7‑adic) 3자리 수로 표현되며, 이때 인접 코돈 간의 p‑adic 거리는 1/5 혹은 1/7 수준으로 작아져 ‘유사 코돈 군’이 자연스럽게 형성된다. 이러한 군집은 실제 유전암호의 퇴화(여러 코돈이 동일 아미노산을 지정)와 일치한다는 점이 핵심 통찰이다.
DNA·RNA 서열 전체는 연속적인 p‑adic 수열로 모델링되며, 서열 내 반복구조와 전위 변이를 p‑adic 메트릭을 통해 정밀히 측정한다. 아미노산은 20가지 종류를 19‑adic 혹은 23‑adic 공간에 배치해, 물리·화학적 특성(극성, 부피 등)을 좌표화한다. 단백질은 아미노산 p‑adic 벡터의 연속으로 표현되어, 구조적 도메인 간 거리와 접힘 경로를 p‑adic 거리론으로 해석할 수 있다.
특히 논문은 ‘유전암호 퇴화는 p‑adic 현상’이라는 주장을 실험적 데이터와 비교해 검증한다. 예를 들어, 동일 아미노산을 지정하는 코돈군이 p‑adic 거리 1/5 이하에 몰려 있음을 보여, 전통적인 Hamming 거리보다 p‑adic 메트릭이 생물학적 의미를 더 잘 포착함을 증명한다.
진화 가설 부분에서는 원시 유전암호가 단일 염기(1‑adic)와 최초 네 아미노산(글리신, 알라닌, 아스파라긴, 프롤린)으로 구성되었다고 제안한다. 이때 p‑adic 확장은 2‑adic → 5‑adic → 7‑adic 순으로 진행되며, 새로운 염기와 아미노산이 추가될 때마다 기존 코드와의 p‑adic 거리 최소화를 유지한다는 논리적 일관성을 제공한다.
마지막으로 저자들은 제시된 p‑adic 모델을 컴퓨터 알고리즘에 구현할 수 있음을 강조한다. p‑adic 연산을 이용한 서열 정렬, 변이 탐지, 코돈 최적화 등이 실제 바이오인포매틱스 파이프라인에 적용 가능하다는 전망을 제시한다. 전체적으로 이 논문은 수학적 p‑adic 체계가 유전정보의 구조와 진화를 설명하는 새로운 언어가 될 수 있음을 설득력 있게 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기