단백질 상호작용 직접 접촉 예측 메시지 패싱
초록
본 연구는 세균 두 구성요소 신호전달계의 2,500여 개 대표 서열을 이용해, 공분산 분석과 물리학에서 차용한 전역 추론(메시지 패싱) 기법을 결합한 새로운 방법을 제시한다. 이 방법은 직접적인 잔기 접촉을 간접적인 상관관계와 구분하여, 센서 키나제와 반응 조절자 사이의 이종 상호작용 및 반응 조절자 간의 동종 상호작용에서 공간적으로 근접한 잔기 쌍을 높은 정확도로 예측한다. 파라미터 튜닝 없이도 강인한 성능을 보이며, 향후 유전체 서열이 늘어남에 따라 단일 복제 단백질 간 상호작용 예측에도 적용 가능할 것으로 기대된다.
상세 분석
이 논문은 기존 공분산 기반 방법이 갖는 ‘간접 상관’ 문제를 해결하기 위해 전역 추론 기법, 즉 메시지 패싱 알고리즘을 도입한 점이 가장 혁신적이다. 공분산 분석은 서로 다른 단백질 서열 집합에서 동시에 변이하는 아미노산 위치를 찾아내지만, 네트워크 내에서 한 잔기가 다른 잔기에 영향을 미치는 경우 다중 경로를 통해 가짜 상관이 발생한다. 저자들은 이 문제를 베이지안 네트워크 형태로 모델링하고, 각 잔기 쌍 사이의 직접적인 상호작용 강도를 추정하기 위해 ‘인퍼런스’ 단계에서 메시지 패싱을 수행한다. 이 과정에서 전체 서열 집합의 통계적 제약을 전역적으로 고려함으로써, 실제 물리적 접촉을 반영하는 ‘직접’ 상관만을 남긴다.
실험적으로는 두 구성요소 시스템(TCS)의 센서 키나제(SK)와 반응 조절자(RR) 서열을 2,500여 개 이상 추출해 다중 정렬(MSA)을 구축하고, 각 위치쌍에 대해 공분산 점수를 계산한 뒤 메시지 패싱을 적용했다. 결과는 기존 DCA(Direct Coupling Analysis)와 비교했을 때, 구조적 근접성을 나타내는 잔기 쌍의 상위 5% 내에 포함되는 비율이 현저히 높았다. 특히 이종 상호작용(SK‑RR)과 동종 상호작용(RR‑RR) 모두에서 높은 정확도를 보였으며, 파라미터 튜닝 없이도 일관된 성능을 유지했다.
또한, 저자들은 방법론의 일반성을 검증하기 위해 인위적으로 잡음이 섞인 데이터셋을 사용해 강인성을 테스트했으며, 메시지 패싱 기반 인퍼런스가 잡음에 대한 민감도를 크게 낮추는 것을 확인했다. 이는 대규모 유전체 데이터베이스가 계속 확장되는 현재 상황에서, 서열만으로도 신뢰할 수 있는 인터페이스 예측이 가능함을 시사한다.
이 연구는 단백질‑단백질 인터페이스 예측에 있어 ‘직접‑간접’ 구분을 명확히 함으로써, 구조생물학적 실험 비용을 절감하고, 신약 표적 발굴 단계에서 잠재적 결합 부위를 사전에 탐색하는 데 큰 도움이 될 것으로 기대된다.
댓글 및 학술 토론
Loading comments...
의견 남기기