공간오믹스 데이터 기반 맥락 인식 흐름 매칭으로 궤적 추정
초록
ContextFlow는 공간오믹스 데이터의 조직 구조와 리간드‑수용체 상호작용을 사전 지식으로 활용해 최적 수송(OT) 기반 흐름 매칭을 정규화한다. 전처리된 전이 가능성 행렬을 통해 생물학적으로 의미 있는 연속 궤적을 학습하며, 기존 방법보다 정량·정성 지표 모두에서 우수한 성능을 보인다.
상세 분석
본 논문은 공간오믹스 데이터에서 시간에 따른 세포 상태 변화를 추정하는 문제를 흐름 매칭(flow matching) 프레임워크에 맥락 정보를 통합함으로써 해결한다. 기존의 흐름 매칭은 소스와 타깃 분포 사이의 연속적인 확률 경로를 학습하기 위해 조건부 확률 경로와 속도 벡터 필드를 정의한다. 그러나 순수 OT 기반 커플링은 공간적·기능적 제약을 반영하지 못해 생물학적으로 비현실적인 전이를 생성한다는 한계가 있다. ContextFlow는 두 가지 주요 사전 지식을 도입한다. 첫째, 조직 내 국소적인 세포 배치와 유사한 발현 프로파일을 갖는 이웃 세포 간의 ‘공간적 부드러움’ 가정을 통해 전이 가능성을 정량화한다. 이를 위해 각 세포의 주변 마이크로환경 표현을 추출하고, 연속 시점 사이의 전이 비용에 가중치를 부여한다. 둘째, 리간드‑수용체 상호작용 네트워크를 이용해 세포 유형 간의 기능적 연결성을 모델링한다. 이러한 상호작용은 전이 가능성 행렬에 추가적인 제약으로 작용해, 실제 신호 전달 경로와 일치하는 전이만을 허용한다. 논문은 이 두 사전 정보를 비용 기반(cost‑based)과 엔트로피 기반(entropy‑based) 두 가지 방식으로 OT‑CFM에 통합한다. 비용 기반 방식은 전이 비용 행렬에 직접 사전 가중치를 더해 Sinkhorn 최적화를 수행하고, 엔트로피 기반 방식은 사전 정보를 엔트로피 정규화 항에 삽입해 확률적 커플링을 조정한다. 두 방식 모두 미니배치 OT와 결합해 O(N²) 복잡도로 학습이 가능하도록 설계되었다. 실험에서는 재생 및 발달 조직 데이터셋(세 개)에서 ContextFlow가 기존 최첨단 방법들(DeST‑OT, TO‑AST, P‑ASTE, CFM, MOTFM 등)보다 평균 궤적 정확도, 전이 일관성, 그리고 생물학적 코히런스 지표에서 유의미하게 우수함을 입증한다. 특히, 리간드‑수용체 기반 제약을 적용했을 때 전이 경로가 알려진 신호 전달 흐름과 일치하는 사례가 눈에 띈다. 전체적으로 이 연구는 공간적·분자적 맥락을 정규화 항에 효과적으로 녹여내어, 고차원 스냅샷 데이터에서 실제 조직 역학을 재구성하는 새로운 패러다임을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기