RNA 결정학 오류를 자동 교정하는 ERRASER‑PHENIX 파이프라인
초록
본 논문은 저해상도 RNA 결정구조에서 빈번히 나타나는 결합 기하학 오류, 당 피크 오류, 백본 로터머 이상 및 원자 간 충돌을 자동으로 교정하는 새로운 실공간 정제 방법인 ERRASER‑PHENIX를 제시한다. 24개의 테스트 데이터셋에 대해 기존 PHENIX 정제와 비교했을 때, ERRASER‑PHENIX는 MolProbity 지표를 크게 개선하고 Rfree 값을 평균 0.012 감소시켰으며, 저해상도 모델을 고해상도 모델과 거의 일치하도록 재구성한다.
상세 분석
ERRASER‑PHENIX는 Rosetta의 물리‑화학 에너지 함수와 전자밀도 상관 점수를 결합한 ‘enumerative real‑space refinement’ 전략을 사용한다. 각 뉴클레오티드에 대해 가능한 모든 백본 토션 각(α, β, γ, δ, ε, ζ)과 당 피크(2′‑endo/3′‑endo)를 전부 탐색하고, Rosetta 에너지와 전자밀도 적합도(χ² 기반)를 가중합한 스코어로 최적 구조를 선택한다. 이 과정은 자동화 파이프라인으로 구현되어, PHENIX의 전통적인 X‑ray 정제 단계와 순차적으로 연결된다.
실험적으로는 24개의 RNA 결정구조(2.0 Å ~ 3.7 Å)에서 시작 모델을 MolProbity로 평가하였다. 초기 모델은 결합 길이·각도 이상(0.53 %·1.18 %), 심각한 원자 충돌(클래시 스코어 18.0), 백본 로터머 이상(19 %), 당 피크 오류(5 %)를 보였다. ERRASER‑PHENIX 적용 후, 결합 길이·각도 이상은 0 %로 사라졌고, 클라시 스코어는 평균 7.0으로 60 % 이상 감소하였다. 백본 로터머 이상은 19 %→8 %로, 당 피크 오류는 5 %→0.2 %로 각각 크게 감소했다. 특히, 저해상도(>3 Å) 데이터셋에서 ERRASER‑PHENIX는 고해상도(≤2 Å) 모델과 거의 동일한 백본 토션 각과 당 피크 분포를 재현했으며, 이는 독립적인 고해상도 구조와의 직접 비교에서 확인되었다.
Rfree 값도 전반적으로 개선되었다. 평균 R은 0.210→0.199, Rfree는 0.255→0.243으로 감소했으며, 24개 중 22개에서 Rfree가 낮아졌다. 이는 과적합 없이 실험 데이터와의 일치를 향상시켰음을 의미한다. 또한, RNABC‑PHENIX, RCrane‑PHENIX와 같은 기존 도구와 비교했을 때, ERRASER‑PHENIX는 모든 MolProbity 지표와 Rfree에서 우수한 성능을 보였다.
기능적 검증 사례로는 그룹 I 리보자임 활성 부위의 당 피크 교정이 있다. 기존 PDB 모델에서는 두 개의 서로 다른 피크(2′‑endo vs 3′‑endo)와 상이한 수소 결합 패턴이 보고되었으나, ERRASER‑PHENIX는 두 모델 모두를 동일한 2′‑endo 피크와 일관된 수소 결합 네트워크로 재구성했으며, 이는 후속 돌연변이 실험 결과와 일치한다.
이와 같이 ERRASER‑PHENIX는 저해상도 RNA 결정구조의 전반적인 기하학적 품질을 자동으로 향상시키며, 기존 정제 파이프라인에 쉽게 통합될 수 있다. 현재 Rosetta 3.4, ROSIE 웹 서버, 그리고 PHENIX 패키지에 포함되어 배포 중이다.
댓글 및 학술 토론
Loading comments...
의견 남기기