신경망 기반 가우시안 콥ula를 이용한 변분 오토인코더

1. 서론 변분 오토인코더(VAE)는 인코더‑디코더 구조를 이용해 데이터 x와 잠재 변수 z 사이의 복합 확률 모델 p_θ(x,z)를 학습한다. ELBO를 최대화함으로써 사후분포 q_φ(z|x)를 근사하지만, 대부분의 VAE는 평균장(mean‑field) 가정을 적용해 q_φ(z|x)=∏_i q_φ(z_i|x) 로 단순화한다. 텍스트 생성과 같은 고차원 연속 잠재 공간에서는 이 가정이 실제 사후분포의 복잡한 상관관계를 무시하게 되고, KL 발산 항이 급격히 0에 수렴하면서 사후분포가 사전분포 N(0,I)와 동일해지는 ‘posterior collapse’ 현상이 빈번히 발생한다. 2. 관련 연구 기존 연구는 (1) 모델 구조를 변경해 디코더의 표현력을 제한하거나 (2) KL‑annealing, β‑VAE, cyclic‑KL 등 손실 함수를 조정해 KL 항을 억제하는 방법을 제시했다. 그러나 이러한 접근은 근본적인 확률 모델링 한계를 해결하지 못한다. 콥ula는 다변량 분포를 마진과 의존성 함수로 분리하는 이론적 도구이며, 특히 가우시안 콥ula는 공분산 행렬 Σ만으로 변수 간 상관관계를 표현한다. 이전에 콥ula‑VI나 Gaussian Copula‑VAE가 제안된 바 있지만, 이들은 주로 데이터 차원의 의존성을 모델링하거나, 사후분포 대신 사전분포에 적용했다. 3. 가우시안 콥ula 이론 Sklar 정리에 따라 임의의 연속 다변량 CDF F(x₁,…,x_d) 는 마진 CDF F_i(x_i)와 콥ula C(u₁,…,u_d) 로 분해된다. 마진을 표준 정규분포 Φ 로 고정하면 Gaussian Copula C_Σ(u)=Φ_Σ(Φ⁻¹(u₁),…,Φ⁻¹(u_d)) 로 표현되며, 여기서 Φ_Σ는 평균 0, 공분산 Σ인 다변량 정규분포의 CDF이다. 밀도는 c_Σ(u)=|Σ|^{-1/2} exp(-½ qᵀ M q) 로 계산되며, q_i=Φ⁻¹(u_i), M=Σ^{-1}−diag(Σ)^{-1}. 4. 제안 모델: Neural Gaussian Copula VAE 기존 VAE의 마진 q_φ(z_i|x)=N(μ_i,σ_i²) 를 유지하면서, 전체 사후분포를 q_φ(z|x)=c_Σ(u)·∏_i q_φ(z_i|x) 로 확장한다. 여기서 u_i=Φ(z_i) 로 변환한다. ELBO는 두 부분으로 나뉜다: (1) 재구성 기대값 E_{q}

신경망 기반 가우시안 콥ula를 이용한 변분 오토인코더

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기