단일 세포 형광 데이터로 보는 플라스미드 복제수 변동성 추정

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

플라스미드 복제수와 그 변동성을 형광 단백질 두 색을 이용한 단일 세포 유전자 발현 데이터로 정량화하는 방법을 제시한다. 세포 성장·분열, 연령 분포, 단백질 및 플라스미드·염색체의 무작위 분배 등을 모두 고려한 확률 모델을 구축하고, 염색체 복제수를 기준으로 플라스미드 복제수 노이즈를 자체 일관적으로 추정한다.

상세 분석

본 논문은 플라스미드 복제수 평균과 변동성(노이즈)을 단일 세포 수준에서 측정된 형광 강도 데이터를 통해 추정하는 정량적 프레임워크를 제시한다. 핵심 아이디어는 동일한 세포 내에 두 개의 형광 보고자를 배치하는 것이다. 하나는 플라스미드에 삽입된 유전자로부터 발현되는 GFP(또는 mCherry)이며, 다른 하나는 염색체에 삽입된 동일한 유전자로부터 발현되는 형광 단백질이다. 두 보고자는 동일한 전사·번역 메커니즘을 공유하므로, 차이는 복제수 차이에만 기인한다는 가정 하에 모델을 전개한다.

먼저, 유전자 발현 자체의 내재적·외재적 노이즈를 포아송·베르누이 과정으로 기술하고, 단일 세포 내 단백질 수 P는 복제수 N과 전사·번역 효율 ε의 곱에 노이즈 항을 더한 형태(P≈εN+η)로 표현한다. 여기서 η는 전사·번역 과정에서 발생하는 랜덤 변동을 의미한다.

다음으로 세포 성장·분열을 고려한다. 세포는 연속적인 로그 성장 후 일정 시점에 이분법적으로 분열하며, 분열 시 단백질은 베르누이 분할(확률 ½)에 따라 자식 세포에 무작위로 배분된다. 이 과정은 형광 강도 분포에 비대칭성을 도입한다. 또한, 세포 집단은 연령이 균일하지 않으며, 배양 초기에 동시 시작된 세포라도 성장 속도 차이와 세포 주기 단계 차이로 인해 연령 분포가 비균등하게 된다. 논문은 이 연령 분포를 λ(a)=2e^{-2a} (0≤a≤1) 형태의 지수 분포로 모델링하고, 이를 평균 형광값과 분산 계산에 포함시킨다.

플라스미드와 염색체의 복제·분배 메커니즘도 핵심 변수이다. 염색체는 복제 후 정확히 두 개로 분리되지만, 플라스미드는 복제 후 무작위 파티셔닝을 겪는다. 플라스미드 복제수 N_p는 평균 μ_p와 분산 σ_p^2를 갖는 확률 변수이며, 분배 시 각 자식 세포에 할당되는 복제수는 이항 분포 B(N_p,½)로 근사한다. 이러한 무작위 파티셔닝은 플라스미드 복제수 노이즈를 크게 확대한다.

모델은 최종적으로 두 형광 보고자의 평균 ⟨F_c⟩, ⟨F_p⟩와 공분산 Cov(F_c,F_p)를 이용해 다음 식을 도출한다.

σ_p^2/μ_p^2 = (Var(F_p)/⟨F_p⟩^2) – (Var(F_c)/⟨F_c⟩^2) – 2·(Cov(F_p,F_c)/(⟨F_p⟩⟨F_c⟩)) + Δ_growth

여기서 Δ_growth는 성장·분열, 연령 분포, 단백질 파티셔닝이 형광 변동에 미치는 보정항이다. 논문은 실험적으로 측정된 형광 데이터에 이 식을 적용하여 플라스미드 복제수 평균 μ_p와 변동성 σ_p/μ_p를 추정한다.

핵심 통찰은 염색체 기반 형광을 “내부 기준”으로 삼음으로써 전사·번역 효율 ε와 전반적인 세포 환경 변동을 상쇄하고, 순수하게 플라스미드 복제수의 통계적 특성만을 분리해낼 수 있다는 점이다. 또한, 성장·분열과 연령 분포를 명시적으로 모델링함으로써 기존 단순 모델이 과소평가하던 노이즈 원인을 정량화한다.

단일 세포 형광 데이터로 보는 플라스미드 복제수 변동성 추정

초록

상세 분석

댓글 및 학술 토론

의견 남기기