전송 알파 발산: 최적 수송 기반 새로운 확산 측도
초록
본 논문은 1차원 확률밀도함수의 차이를 측정하는 전송 알파 발산(Transport α Divergence)을 정의하고, 이를 Itakura‑Saito 발산, 전송 KL 발산, 그리고 Wasserstein‑2 공간에서의 볼츠만‑샤논 엔트로피 Hessian 거리와 연결한다. 양자밀도함수(quantile density) 기반의 표현, 3차 대칭 텐서와 α‑지오데식 도출, 그리고 다양한 예시(생성 모델, Cauchy 분포 등)를 제시한다.
상세 분석
논문은 먼저 기존의 α‑다이버전스와 정보기하학적 배경을 정리하고, 이를 최적 수송(Optimal Transport, OT) 프레임워크에 끌어들인다. 1차원에서는 OT의 최적 전송 맵이 누적분포함수(CDF)의 역함수인 분위수함수(quantile function)로 명시적으로 구해지므로, 전송 알파 발산을 분위수 밀도함수(QDF, Q′)의 비율에 대한 함수 형태로 정의한다. 구체적으로
(D_{T,\alpha}(p|q)=\int_{0}^{1} f_{T,\alpha}!\big(Q’_p(u)/Q’q(u)\big),du)
이며, 여기서 (f{T,\alpha}(z)=\frac{1}{\alpha^{2}}\big(z^{\alpha}-\alpha\log z-1\big)) (α≠0) 혹은 (\frac12(\log z)^2) (α=0)이다. 이 식은 α=1일 때 전송 KL 발산, α=0일 때 전송 Hessian 거리, α=±1일 때 전송 역 KL 발산 등 기존 발산들을 포함한다는 점에서 일반화된 형태임을 확인한다.
다음으로 저자는 이 발산의 2차·3차 미분 구조를 탐구한다. Hessian 행렬은 (g(u)=1/Q’q(u))와 동일하게 나타나며, 이는 Wasserstein‑2 공간에서의 Fisher‑Rao 메트릭과 일치한다. 3차 대칭 텐서는 (\alpha-3) 배율을 갖는 항으로 나타나, 이는 Amari‑Chentsov 텐서와 유사한 형태이며, α‑지오데식 방정식에 직접적인 영향을 준다. α‑지오데식은
(\ddot\gamma\alpha(t)+\Gamma^\alpha(\dot\gamma_\alpha(t),\dot\gamma_\alpha(t))=0)
으로 정의되고, 해는 ( \gamma_\alpha(t)=\big((1-t)Q_p^{1-\alpha^2}+t Q_q^{1-\alpha^2}\big)^{1/(1-\alpha)}) 와 같이 닫힌 형태를 가진다. α=0,±1,±3 등 특수값에서는 각각 Fisher‑Rao, 기하 평균, 지수 평균 등 알려진 지오데식으로 귀결된다.
또한 전송 알파 발산은 일반화된 Bregman 발산으로 해석될 수 있다. 즉, (D_{T,\alpha}(p|q)=\int_0^1 \big
댓글 및 학술 토론
Loading comments...
의견 남기기