범용 공간 전사체 초해상도 프레임워크 SRast
초록
SRast는 저해상도 공간 전사체 데이터를 고해상도로 복원하는 새로운 프레임워크로, 유전자 의미 표현과 공간 기하 변환을 명확히 분리하고 자체 지도학습으로 잠재 분포를 정렬한다. 또한 단순체 상에서 비율을 예측하는 흐름 매칭(flow matching) 모델을 도입해 최적 수송 기반 변환을 학습, 지역 질량 보존을 엄격히 보장한다. 다양한 종·조직·플랫폼에 걸친 실험에서 제로샷 일반화와 물리적 일관성 면에서 최첨단 성능을 달성한다.
상세 분석
SRast는 기존 공간 전사체 초해상도 방법이 갖는 두 가지 근본적 한계를 동시에 해결한다. 첫 번째는 생물학적 이질성에 대한 무시로 인한 OOD(Out‑of‑Distribution) 일반화 부족이다. 이를 위해 저자들은 ‘전략적 디커플링(decoupling) 아키텍처’를 설계했으며, 유전자 의미(semantic)와 공간 기하(geometry)를 각각 독립적인 모듈에서 처리한다. 유전자 의미 모듈은 고차원 전사체 벡터를 저차원 잠재 공간에 매핑하면서, 셀 타입·발달 단계·환경 요인 등 내재된 변이를 보존한다. 공간 기하 모듈은 이 잠재 표현을 입력으로 받아, 저해상도 좌표를 고해상도 좌표로 변환한다. 두 모듈 사이의 교차 샘플 이동을 최소화하기 위해 SRast는 자체 지도학습(self‑supervised) 방식으로 잠재 분포를 정렬한다. 구체적으로, 동일 조직 내 서로 다른 슬라이스 혹은 서로 다른 플랫폼(Visium, Slide‑seq 등)에서 추출된 데이터에 대해 교차 엔트로피 기반의 정규화 손실을 적용해, 잠재 분포가 동일한 단순체(simplex) 위에 놓이도록 유도한다.
두 번째는 물리적 일관성 부재이다. 공간 전사체는 각 위치에서 측정된 mRNA 양이 전체 질량을 보존한다는 ‘지역 질량 보존(local mass conservation)’ 원칙을 따른다. SRast는 이를 수학적으로 단순체 상의 비율 예측 문제로 재정의한다. 즉, 각 픽셀(또는 스팟)의 전사체 프로파일을 확률 분포로 간주하고, 저해상도에서 고해상도로의 변환을 ‘비율 흐름(ratio flow)’ 형태로 모델링한다. 이를 구현하기 위해 최적 수송(optimal transport) 이론에 기반한 흐름 매칭(flow matching) 네트워크를 도입한다. 흐름 매칭은 연속적인 확률 흐름을 학습해, 시간 t=0에서 t=1로 이동할 때 질량이 보존되는 변환 φ를 생성한다. 학습 목표는 KL 발산과 연속성 방정식(continuity equation)을 동시에 최소화하는 것이며, 이는 기존 GAN 기반 초해상도 방법이 겪는 모드 붕괴와 비물리적 아티팩트를 방지한다.
SRast의 전체 파이프라인은 (1) 유전자 의미 인코더, (2) 공간 디코더, (3) 흐름 매칭 트랜스포머, (4) 비율 정규화 레이어로 구성된다. 인코더‑디코더 구조는 Transformer‑ 기반 어텐션 메커니즘을 활용해 장거리 상호작용을 포착하고, 흐름 매칭 트랜스포머는 연속적인 OT(Optimal Transport) 매핑을 학습한다. 또한, 학습 과정에서 ‘마스크드 셀 프리딕션(masked cell prediction)’ 과제를 삽입해, 모델이 부분적으로 관측된 스팟을 복원하도록 강제한다. 이러한 설계는 데이터 효율성을 크게 높이며, 소량의 라벨링된 고해상도 데이터만으로도 강력한 제로샷 전이 성능을 가능하게 한다.
실험 결과는 SRast가 8개의 공개 데이터셋(마우스 뇌, 인간 유방암, 파리 배아 등)에서 기존 SRT‑SR(Space‑Resolution Transcriptomics Super‑Resolution) 방법들을 압도한다는 것을 보여준다. 특히, 제로샷 설정에서 다른 모델이 평균 12% 이하의 Pearson 상관계수를 기록한 반면, SRast는 0.85 이상의 높은 상관을 유지한다. 물리적 일관성 평가지표인 ‘local mass error’를 측정했을 때도 SRast는 0.03 이하의 오류율을 기록, 거의 완벽에 가까운 질량 보존을 달성한다.
요약하면, SRast는 (1) 의미‑기하 디커플링을 통한 이질성 적응, (2) 자체 지도학습 기반 잠재 정렬, (3) 단순체 비율 흐름 매칭을 통한 물리적 제약 구현이라는 세 축을 결합해, 차세대 공간 전사체 초해상도 기술의 범용성과 신뢰성을 크게 향상시킨다.
댓글 및 학술 토론
Loading comments...
의견 남기기