성장 포함 확률 흐름으로 단일세포 데이터에서 확률적 동역학 추정
초록
본 논문은 파괴적인 단일세포 오믹스 측정으로 얻은 교차단면 스냅샷 데이터를 활용해, 세포 분열·사멸을 포함하는 확률적 연속동역학을 추정하는 새로운 방법인 Unbalanced Probability Flow Inference(UPFI)를 제안한다. Lagrangian 형태의 Fokker‑Planck 방정식을 기반으로 스코어 매칭으로 밀도 기울기를 사전 학습하고, 이를 이용해 drift와 growth(피트니스)를 동시에 최적화한다. 시뮬레이션 및 실제 scRNA‑seq 데이터에서 기존 방법보다 높은 정확도를 보이며, 두 단계 학습 구조가 간단함을 강조한다.
상세 분석
본 연구는 단일세포 RNA‑seq과 같은 파괴적 측정법이 제공하는 시간별 스냅샷만으로, 세포 상태의 확률적 흐름과 동시에 세포 증식·사멸(즉, 질량 비보존)을 추정하는 문제에 접근한다. 기존의 Probability Flow Inference(PFI)는 Fokker‑Planck 방정식을 Lagrangian 프레임에서 풀어 drift와 diffusion을 추정했지만, 성장(term g) 를 무시한다는 한계가 있었다. 저자들은 이를 일반화하여, 성장률 g(t,x)=b(t,x)−d(t,x) 를 포함하는 비균형 확률 흐름 방정식(2)을 도입하고, 이를 다시 transport 형태인 식(3) 으로 변형한다. 핵심 아이디어는 ∇log ρ(t,x) 즉, 스코어 함수를 사전에 추정함으로써, drift와 diffusion을 포함한 “phase‑space velocity” u(t,x)=v(t,x)+∇·(D∇log ρ) 를 정의하고, Lagrangian 입장에서 ODE 시스템(4) 로 변환한다. 이렇게 하면 고차원 PDE 를 d+1 차원 ODE 로 축소할 수 있어 계산 효율성이 크게 향상된다.
스코어 추정은 denoising score matching을 사용해, 각 스냅샷에 대해 독립적으로 학습한다. 이후, 식(5)·(6) 에서 제시된 업데이트 규칙에 따라 각 샘플을 시간 t_i → t_{i+1} 로 이동시키고, 질량 가중치 m_k 를 성장률 g에 따라 지수적으로 조정한다. 이렇게 얻어진 가중 샘플 집합은 새로운 시점의 추정된 측정값 p ρ_{t_{i+1}} 를 구성한다. 최종 파라미터(v,g)는 추정된 측정값과 실제 스냅샷 사이의 차이를 unbalanced Sinkhorn divergence S_{ε,γ} 로 최소화한다. Sinkhorn divergence는 질량 불균형을 자연스럽게 다루며, 이산 측정값에 바로 적용 가능하다는 장점이 있다.
이론적 분석에서는 OU 프로세스와 quadratic fitness 를 이용해 identifiability 문제를 조명한다. Proposition 2.1 과 Corollary 2.2 에 따르면, drift와 growth는 서로 혼동될 수 있으며, 특히 autonomous drift 라도 비대칭 성분이 growth와 동일시될 수 있다. 따라서 실제 데이터에선 추가적인 제약(예: 성장률에 대한 외부 정보) 없이는 drift와 growth를 완전히 구분하기 어렵다.
실험에서는 (1) 저차원 이중안정(bistable) 모델, (2) 고차원 OU‑type 모델, (3) 실제 mouse embryonic stem cell scRNA‑seq 데이터 등을 대상으로 UPFI와 기존 PFI, DeepRUOT, unbalanced OT 기반 방법들을 비교한다. 정량적 평가지표(MMD, Wasserstein, Sinkhorn loss)와 시각적 흐름선 분석에서 UPFI가 특히 성장 효과를 정확히 복원하고, drift를 과대/과소 추정하는 오류를 크게 감소시킨다. 또한 두 단계 학습(스코어 → drift/growth) 구조가 안정적이며, 복잡한 하이퍼파라미터 튜닝이 필요 없다는 실용적 장점도 강조한다.
전체적으로 이 논문은 (i) 성장·사멸을 포함한 비균형 확률 흐름을 Lagrangian 프레임에서 ODE 로 변환, (ii) 스코어 매칭을 통한 사전 학습, (iii) unbalanced Sinkhorn loss 로 파라미터 최적화라는 세 가지 핵심 기술을 결합해, 파괴적 단일세포 스냅샷만으로도 생물학적으로 의미 있는 동역학 모델을 추정할 수 있음을 입증한다.
댓글 및 학술 토론
Loading comments...
의견 남기기