MIOFlow 2.0: 공간 전사와 단일세포 데이터를 연결한 확률적 세포 궤적 추정 프레임워크
초록
**
MIOFlow 2.0는 PHATE 기반 자동인코더 잠재공간에서 최적수송과 신경확률미분방정식(N‑SDE)을 결합해, 세포의 분기·증식·사멸·공간적 미세환경을 동시에 모델링한다. 이를 통해 단일세포와 공간 전사 데이터에서 연속적인 확률적 궤적을 복원하고, 미세환경에 의한 전이 차이를 정량화한다.
**
상세 분석
**
본 논문은 세포 궤적 추정에 세 가지 생물학적 현실—(1) 운명 선택의 확률적 분기, (2) 비보존적 인구 변동(증식·사멸), (3) 조직 미세환경의 조건부 영향—을 동시에 반영한 최초의 통합 프레임워크를 제시한다. 핵심 기술은 다음과 같다. 첫째, 고차원 전사 데이터를 PHATE‑거리 매칭 자동인코더로 저차원 매니폴드에 임베딩함으로써, 데이터 내의 비선형 구조와 전역·국부 기하학을 보존한다. 둘째, 임베딩된 공간에서 최적수송(OT) 비용을 계산하고, 이를 초기화값으로 사용해 비보존적(언밸런스) OT를 통해 성장률 함수를 학습한다. 성장률 모델은 시간에 따라 질량(세포 수)의 생성·소멸을 허용해, 전통적인 질량 보존 OT가 놓치는 증식·사멸 효과를 보정한다. 셋째, 신경확률미분방정식(N‑SDE)을 도입해 drift와 diffusion을 동시에 학습한다. drift는 deterministic한 전이 흐름을, diffusion은 전사 잡음 및 운명 선택의 확률성을 포착한다. N‑SDE는 연속적인 확률 흐름을 제공함으로써, 기존 deterministic flow‑matching이나 Gaussian 가정 기반 모델보다 복잡한 분기 구조를 자연스럽게 재현한다. 넷째, 공간 전사 데이터에서 추출한 네이버후드 특징(세포 유형 비율, 리간드‑수용체 상호작용, 밀도, 이웃 평균 임베딩)을 조건부 입력으로 사용해, 동일 전사 상태라도 미세환경에 따라 다른 벡터 필드를 생성한다. 이는 “같은 상태, 다른 운명”이라는 생물학적 현상을 모델링하는 데 필수적이다. 실험에서는 합성 데이터, 배아체 분화, 그리고 재생 능력이 뛰어난 도롱뇽(axolotl) 뇌 재생 데이터를 이용해 기존 TrajectoryNet, Waddington‑OT, Flow‑Matching 등과 비교하였다. MIOFlow 2.0는 (i) 경로 정확도(RMSE, F1‑score)에서 유의하게 우수하고, (ii) 성장률 추정이 실제 세포 수 변화를 잘 복원하며, (iii) 공간 조건부 분석을 통해 중간 스파이니 뉴런(MSN) 군집이 재생 경로를 조절한다는 새로운 생물학적 인사이트를 제공한다. 한계점으로는 (a) 대규모 공간 전사(수십만 셀)에서의 계산 비용, (b) 성장률 모델이 OT 초기화에 크게 의존해 초기 분포 선택에 민감함, (c) SDE 학습 시 노이즈 스케일 선택이 결과에 영향을 미친다는 점을 들 수 있다. 향후 연구는 효율적인 미니배치 OT, 베이지안 성장률 추정, 그리고 멀티오믹스(단백질·메틸화)와의 통합을 통해 모델의 확장성을 높일 수 있을 것이다.
**
댓글 및 학술 토론
Loading comments...
의견 남기기