무작위 브리지 기반 고속 생성 모델링
초록
본 논문은 목표 분포를 특정 시점에 맞추도록 조건화된 확률 과정인 무작위 브리지를 이용해, 확률 분포 간의 단방향 전송을 구현한다. 일반적인 확률적 정의에서 시작해 가우시안·레비 브리지 등 구체적인 사례를 제시하고, 마코프·비마코프, 연속·불연속 등 다양한 동적 형태를 포괄한다. 실험에서는 가우시안 브리지를 활용해 MNIST와 CIFAR‑10에서 기존 DDPM 대비 10배 가량 적은 단계로 경쟁력 있는 FID 점수를 달성했으며, 계산 비용이 낮아 고속 생성에 적합함을 입증한다.
상세 분석
이 논문은 “무작위 브리지(random bridge)”라는 개념을 generative modeling에 적용함으로써 기존 확산 모델(DDPM)의 양방향 노이징‑디노이징 구조를 탈피한다. 핵심 아이디어는 두 확률분포 Φ(참조)와 Ψ(목표)를 연결하는 확률 과정 ξₜ를 정의하고, 이 과정이 임의의 “구동 과정” Zₜ(예: 가우시안, 포아송, 레비 등)의 조건부 분포와 일치하도록 설계한다는 점이다. 정의 2.2는 매우 일반적인 프레임워크를 제공한다. Φ‑Ψ 브리지는 (ξ₀, ξ_T)∼Γ(Φ,Ψ)라는 결합분포를 만족하고, 중간 시점의 조건부 분포가 구동 과정 Zₜ와 동일함을 보장한다. 이때 구동 과정이 마코프이면 ξₜ도 마코프가 되며, 비마코프 구동 과정은 비마코프 브리지를 만든다(정리 2.6).
특히 가우시안 브리지는 공분산 행렬 Σ와 정밀 행렬 Σ⁻¹을 이용해 ξₜ를 “예측형(anticipative)” 형태로 표현한다(식 7). 이는 ξₜ = Σ*{t,T} Y + (Zₜ − Σ*{t,T} Z_T) 로, Y는 목표 변수, Zₜ는 노이즈 과정이며, t<T에서는 Y가 완전히 관측되지 않으므로 노이즈가 섞인 정보 흐름으로 해석된다. 이 표현은 확률 필터링 이론과 직접 연결되며, 학습 단계에서는 Y를 추정하는 네트워크를 훈련시켜 ξₜ의 조건부 평균을 근사한다.
학습/샘플링 알고리즘은 크게 두 단계로 구성된다. (1) Φ‑초기화된 샘플 x를 뽑아 ξₓₜ를 시뮬레이션하고, (2) 네트워크가 ξₓₜ의 조건부 평균 E
댓글 및 학술 토론
Loading comments...
의견 남기기