FlowBypass 역류 흐름 기반 훈련‑무료 이미지 편집
초록
본 논문은 역류 흐름(Rectified Flow) 모델에 기반한 “우회 경로(bypass)”를 도입해, 기존의 이미지 역전‑재구성 파이프라인에서 발생하는 누적 오류를 감소시킨다. 역전 과정에서 중간 시점 t_B 를 선택하고, 해당 시점의 이미지에 분석적으로 유도된 보정 벡터 b_t 를 더함으로써 직접 재구성 단계로 전이한다. 이 방법은 별도의 피처 조작 없이도 높은 프롬프트 정합성과 원본 영역의 고충실도를 동시에 달성한다. 실험 결과, 다양한 편집 태스크에서 최신 훈련‑무료 기법들을 능가한다.
상세 분석
FlowBypass는 훈련‑무료 이미지 편집의 핵심 한계인 “역전‑재구성 전체 경로를 순회하면서 발생하는 수치적 오차 누적”을 근본적으로 재구성한다. 기존 방법은 DDIM 기반 역전 과정을 거쳐 노이즈 ε 에 도달한 뒤, 동일한 노이즈를 조건 프롬프트에 따라 재구성한다. 이때 역전 단계는 시간 t 에 대한 ODE dx/dt = ĥvθ(x,t,C) 를 Euler 방식으로 근사하는데, x_t가 양변에 동시에 존재해 실제 속도 ĥvθ 를 이전 스텝 값으로 대체하게 된다. 이 근사 오차가 누적돼 최종 노이즈 x_T 가 왜곡되고, 재구성 단계에서 원본 이미지의 세부 정보가 손실된다.
논문은 이러한 문제를 “우회(bypass)”라는 새로운 중간 전이 메커니즘으로 해결한다. 구체적으로, 역전 경로 x_t 와 재구성 경로 y_t 를 각각
x_t = x_1 + ∫_t^1 ĥvθ(x_τ,τ,Cⁱⁿᵥ) dτ,
y_t = y_1 + ∫_t^1 ĥvθ(y_τ,τ,Cʳᵉᶜ) dτ
로 정의하고, 두 경로 차이 b_t = y_t – x_t 를 구한다. 미분하면
db_t/dt = ĥvθ(x_t + b_t, t, Cʳᵉᶜ) – ĥvθ(x_t, t, Cⁱⁿᵥ)
가 된다. 여기서 b_t 가 작은 오프셋이라고 가정하고 1차 테일러 전개를 적용하면
db_t/dt ≈ Q_t + P_t·b_t,
Q_t = ĥvθ(x_t, t, Cʳᵉᶜ) – ĥvθ(x_t, t, Cⁱⁿᵥ),
P_t = ∂ĥvθ/∂x (x_t, t, Cʳᵉᶜ)
가 된다. 이는 일차 선형 미분 방정식이며, 해는
b_t = ∫_t^1 Q_u·exp(∫_u^1 P_s ds) du
라는 닫힌 형태로 얻어진다. 이 식은 “우회 벡터”를 직접 계산할 수 있게 해 주며, 전체 역전‑재구성 경로를 거치지 않아도 된다.
실제 구현에서는 연속 시간
댓글 및 학술 토론
Loading comments...
의견 남기기