IVT 공정의 수율·품질 예측을 위한 모듈형 메카니즘 모델
초록
본 연구는 mRNA 백신·치료제 제조에 핵심인 인비트로 전사(IVT) 과정을 6개의 상호 연결된 모듈(시작·캡핑, 연장·절단, 종결·리드스루, mRNA 분해, Mg‑PPi 침전, PPi 가수분해)로 분해하고, 각 모듈에 대한 질량·반응속도식을 구축한다. 머신러닝 기반 다변량 잔차 분석과 Shapley 값 민감도 분석을 통해 모델 결함을 식별·보완하고, 가우시안 프로세스 기반 배치 베이지안 최적화를 적용해 파라미터 추정을 효율화하였다. 최종 모델은 mRNA 수율(MAE 0.95 g/L, Spearman 0.94)과 품질 지표인 무결성(MAE 4.01 %, ρ 0.86)·캡핑 효율(MAE 7.06 %, ρ 0.84)를 높은 정확도로 예측한다.
상세 분석
이 논문은 기존의 전사 메커니즘 모델을 확장하여, 실제 산업 규모 IVT 공정에서 발생하는 복합적인 화학·생물학적 현상을 포괄적으로 설명한다. 먼저, T7 RNA polymerase가 DNA 템플릿에 결합해 전사를 시작하고, 동시에 CleanCap AG와 같은 캡핑 시약이 5′ 말단에 결합하는 ‘시작·캡핑’ 모듈을 정의한다. 여기서는 RNAP·DNA·NTP·Mg²⁺ 복합체 형성 속도와 캡핑 효소의 경쟁적 결합을 미분 방정식으로 기술한다. 두 번째 모듈인 ‘연장·절단’은 전사 연장 속도(k_cat)와 NTP 소모, 그리고 비정상적인 중단(짧은 트랜스크립트) 발생을 고려한다. 특히, NTP 농도 감소와 Mg‑PPi 침전에 따른 효소 활성 억제 효과를 동적 평형식으로 연결한다. ‘종결·리드스루’ 모듈은 전사 종료 신호와 RNAP가 템플릿을 지나쳐 연장되는 경우를 모델링하며, 이는 전체 수율에 직접적인 영향을 미친다. ‘mRNA 분해’ 모듈은 RNase와 열·pH에 의한 가수분해를 포함해, 시간에 따라 무결성 감소를 예측한다. ‘Mg‑PPi 침전’ 모듈은 Mg²⁺와 무기 피로인산(PPi) 사이의 복합체 형성·침전 평형을 상세히 기술하고, 이는 Mg²⁺ 가용성을 감소시켜 전사 효율을 저하시킨다. 마지막으로 ‘PPi 가수분해’ 모듈은 pyrophosphatase가 PPi를 인산으로 전환하는 반응을 포함해, 침전 억제와 Mg²⁺ 재활용을 설명한다.
각 모듈은 질량 보존식과 Michaelis‑Menten·Hill 형태의 속도식을 결합해 비선형 미분 방정식 체계를 만든다. 모델 파라미터는 다양한 배치·피드배치 실험(튜브, 96‑웰, AMBR, EasyMax)에서 얻은 시간‑코스 데이터와 정적 농도 데이터를 동시에 활용해 추정한다. 여기서 핵심은 ‘다변량 잔차 분석’과 ‘Shapley 값 기반 민감도 분석’이다. 잔차 분석을 통해 특정 조건(예: 고 Mg²⁺ 농도, 저 pH)에서 시스템적 편향을 발견하고, 해당 편향이 ‘Mg‑PPi 침전’ 모듈의 평형 상수 과소평가와 연관됨을 확인한다. Shapley 값은 각 입력 변수(템플릿 농도, RNAP 활성, NTP 비율, Mg²⁺ 농도, pH, 온도 등)의 기여도를 정량화해, 특히 Mg²⁺와 PPi 농도가 수율과 캡핑 효율에 비선형적으로 큰 영향을 미침을 밝혀낸다.
파라미터 최적화는 가우시안 프로세스(GP) 기반 배치 베이지안 최적화를 적용해, 고비용 시뮬레이션을 병렬로 수행하면서 탐색·활용 균형을 유지한다. 이 접근법은 전통적인 그리드·랜덤 탐색 대비 5‑10배 빠른 수렴을 보이며, 최종 모델은 mRNA 수율을 0.95 g/L MAE, 무결성을 4.01 % MAE, 캡핑 효율을 7.06 % MAE 수준으로 예측한다.
전반적으로 이 연구는 ‘모듈형 메카니즘 + 머신러닝’ 하이브리드 프레임워크를 제시함으로써, 복잡한 바이오공정의 물리·화학적 이해와 데이터‑드리븐 최적화를 동시에 달성한다는 점에서 학술·산업 양측에 큰 의미를 가진다. 특히, 모델의 확장성을 강조해 새로운 캡핑 시약, 변형 뉴클레오티드(Ψ, m¹Ψ 등) 혹은 새로운 효소 시스템을 손쉽게 통합할 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기