슬라이스 최적수송을 이용한 분포 매칭 수렴 속도 분석
초록
본 논문은 슬라이스 최적수송(Sliced‑Wasserstein) 기반의 반복적 분포 매칭 알고리즘인 slice‑matching scheme의 수렴성을 정량적으로 분석한다. 특히 Gaussian 분포에 대해 Łojasiewicz·Polyak‑Łojasiewicz(PL) 부등식을 구축하고, 무작위 직교 기저를 이용한 업데이트에서 공분산 고유값을 제어함으로써 비비대칭적인 차원·스텝‑사이즈 의존성을 명시적인 수렴 속도로 제시한다. 실험을 통해 이론적 예측과 차원·스텝‑사이즈에 따른 수렴 거동을 검증한다.
상세 분석
본 연구는 sliced‑Wasserstein 거리의 목적함수 F(σ)=d²·SW²(σ,μ) 에 대해 PL(Polyak‑Łojasiewicz) 형태의 Łojasiewicz 부등식을 도출함으로써, 전통적인 비볼록 최적화에서 흔히 사용되는 구배‑손실 관계를 확장한다는 점에서 의미가 크다. PL 부등식은
F(σ)−F(μ) ≤ C·‖∇W F(σ)‖²_σ
와 같은 형태이며, 여기서 상수 C는 σ의 밀도 하·상한에 의존한다. 일반적인 확률분포에서는 이 상수를 시간에 따라 제어하기 어려우나, 저자들은 ‘elliptic’ 즉, Gaussian과 같이 선형 slice‑matching map을 갖는 경우에 초점을 맞춘다. Gaussian에서는 각 iteration에서 사용되는 무작위 직교 기저 P_k가 공분산 행렬을 회전시켜 고유값을 평균적으로 유지한다는 사실을 이용한다. 구체적으로, 업데이트 식
σ{k+1}=((1−γ_k)Id+γ_k T_{σ_k,P_{k+1}})♯σ_k
에서 T_{σ_k,P_{k+1}}는 각 방향 θ_i에 대한 1‑D 최적수송을 합성한 선형 변환이다. 이때 공분산 Σ_k는 Σ_{k+1}= (1−γ_k)²Σ_k + γ_k² Σ_μ + γ_k(1−γ_k)(Σ_k U_k + U_kᵀΣ_k) 형태로 전개되며, U_k는 P_k에 의해 정의된 회전 행렬이다. 기대값을 취하면 교차항이 사라지고
E
댓글 및 학술 토론
Loading comments...
의견 남기기