분자 유한 자동자를 이용한 규칙 기반 생화학 시스템 모델링 및 시뮬레이션
초록
본 논문은 단백질을 규칙 기반 연산 기계인 ‘분자 유한 자동자(MFA)’로 표현하는 새로운 형식론을 제안한다. MFA는 외부 입력에 따라 상태가 변하고, 단백질‑단백질 상호작용을 동기화된 재구성으로 모델링한다. 이를 통해 결정론적(ODE) 및 확률론적(갤리소프) 시뮬레이션이 가능하며, MAPK 캐스케이드와 스캐폴드 단백질을 예제로 사용해 모델링·시뮬레이션 과정을 시연한다.
상세 분석
MFA 형식론은 전통적인 반응식 기반 모델링이 직면한 조합 폭발 문제를 완화하기 위해 ‘상태 기계’를 단백질의 기능적 모듈로 추상화한다. 각 MFA는 유한 개의 내부 상태와 외부 입력(예: 리간드 결합, 인산화, 탈인산화 등)를 갖으며, 전이 함수는 입력에 따라 상태를 전환한다. 중요한 점은 두 개 이상의 MFA가 상호작용할 때, 해당 입력을 공유함으로써 ‘동기화된 전이’를 수행한다는 것이다. 이는 기존 규칙 기반 언어(Kappa, BioNetGen)의 패턴 매칭과 유사하지만, 자동자 이론을 도입함으로써 형식적 검증과 최적화가 보다 체계적으로 가능해진다.
시뮬레이션 측면에서는 MFA 네트워크를 연속적인 미분 방정식 형태로 전환해 결정론적 해석을 수행하거나, 전이 확률을 기반으로 갤리소프 알고리즘을 적용해 stochastic trajectory를 생성한다. 두 방법 모두 동일한 규칙 집합에서 파생되므로 모델 일관성이 유지된다. 논문은 MAPK 캐스케이드를 3단계 인산화 경로와 스캐폴드 단백질이 제공하는 공간적 제한을 포함하도록 설계하였다. MFA를 이용하면 스캐폴드가 각 MAPK 모듈에 동시에 결합·해리하는 복합체 형성을 ‘동기화 전이’ 하나로 기술할 수 있어, 전통적인 ODE 모델에서 필요했던 수십 개의 중간 종을 크게 줄일 수 있다.
또한 저자들은 MFA가 ‘컨텍스트 의존성’을 자연스럽게 표현한다는 점을 강조한다. 예컨대, 특정 인산화는 이미 특정 도메인이 결합된 상태에서만 발생하도록 전이 조건을 설정할 수 있다. 이는 실험적으로 관찰되는 ‘프리-어셈블리’ 혹은 ‘신호 제한’ 현상을 모델에 직접 반영하는 데 유리하다.
한계점으로는 MFA 정의가 복잡한 다중 도메인 단백질의 모든 가능한 상태를 포괄하려면 상태 수가 급증할 수 있다는 점이다. 이를 완화하기 위해 상태 압축 기법이나 계층적 자동자 설계가 필요하다. 또한 현재 구현은 규칙 집합을 수동으로 작성해야 하므로, 자동화된 추출 파이프라인이 향후 연구 과제로 남는다.
전반적으로 MFA는 규칙 기반 모델링의 표현력과 시뮬레이션 효율성을 동시에 추구하는 새로운 패러다임을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기