전이 흐름 매칭: 한 단계 생성의 새로운 패러다임
본 논문은 기존 흐름 매칭이 로컬 속도장을 학습해 다중 적분이 필요하던 한계를 극복하고, 전이 흐름(Transition Flow)이라는 전역적인 변환 함수를 직접 학습한다. 전이 흐름은 임의의 시간 구간을 한 번에 이동할 수 있어 단일 스텝 혹은 자유로운 스텝 수로 생성이 가능하며, 평균 속도 흐름(Mean Velocity Flow)과의 수학적 연계도 제시한다. 실험을 통해 제안 방법이 기존 방법 대비 경쟁력 있는 이미지 생성 성능을 보이며, …
저자: Chenrui Ma
본 논문은 흐름 매칭(Flow Matching)과 확산 모델(Diffusion)의 공통적인 구조적 한계를 지적한다. 두 방법 모두 시간‑조건부 로컬 속도장(velocity field)을 학습하고, 이를 ODE 혹은 SDE에 따라 다중 적분 단계로 샘플을 변환한다. 이러한 접근은 연산 비용이 크고, 특히 few‑step 혹은 one‑step 생성에 비효율적이다. 최근에는 평균 속도 흐름(Mean Velocity Flow)이라는 프레임워크가 제안되어 순간 속도와 미래 평균 속도 사이의 관계식을 통해 전역적인 평균 속도를 학습함으로써 임의 시간점으로의 전이를 가능하게 했다. 그러나 평균 속도 자체를 추정하는 복잡한 수식과 구현상의 어려움이 남아 있었다.
이에 저자들은 전이 흐름(Transition Flow)이라는 새로운 전역 변환 함수를 직접 학습하는 패러다임을 제안한다. 전이 흐름 X(xₜ, t, r) 은 현재 상태 xₜ 와 현재 시간 t 를 입력으로 받아 미래 시간 r ( t≤r≤1 ) 에 해당하는 상태를 바로 반환한다. 이는 전통적인 로컬 속도장 회귀와 달리, “시간 구간 전체를 한 번에 이동”하는 전역적인 매핑이다.
핵심 이론적 기여는 **Transition Flow Identity**(식 17)이다. 평균 속도 u(xₜ,t,r) 를 (r−t)·u = xₜ→r − xₜ 로 정의하고, 이를 전이 흐름과 연결하면
X(xₜ,t,r) = xₜ→r + (r−t)·∂ₜX(xₜ,t,r)
라는 식이 도출된다. 여기서 ∂ₜX 는 전이 흐름의 시간 미분이며, 자동 미분 프레임워크의 Jacobian‑Vector Product(JVP)를 이용해 효율적으로 계산할 수 있다.
학습은 두 단계로 구성된다. 1) **조건부 전이 흐름 손실** L_C‑TFM(θ)를 정의한다. 조건 변수 Z=(X₀,X₁) 와 선형 보간 α(t)=1−t, β(t)=t 를 사용하면, 전이 상태 X_Z^{t→r} = (1−r)X₀ + rX₁ 와 순간 속도 v(Xₜ,t|Z)=X₁−X₀ 가 명시적으로 구해진다. 손실은
‖sg
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기