리우빌리 PDE 기반 슬라이스 워셔스틴 흐름
초록
본 논문은 기존 확률적 스라이싱 워셔스틴 흐름(SWF)을 확률 미분 방정식(Fokker‑Planck)에서 결정론적 리우빌리 방정식으로 변환하고, 신경 ODE 기반 정규화 흐름을 이용해 밀도 추정을 수행한다. 또한 칸토리비치 포텐셜을 활용해 스라이싱 워셔스틴 베리센터를 효율적으로 근사함으로써 학습·테스트 수렴 속도와 분산을 크게 개선하고, 공정 회귀 문제에 적용해 정확도‑공정성 파레토 곡선에서 경쟁력을 입증한다.
상세 분석
이 연구는 두 가지 핵심 혁신을 제시한다. 첫째, 기존 SWF에서 사용되는 Fokker‑Planck 방정식의 확산 항을 제거하고, 상태‑의존적 확산 계수를 무시함으로써 리우빌리 방정식 형태의 순수 전송 모델을 만든다. 이 과정에서 확산 항을 대체하는 항으로 −½ σσᵀ∇log ρ 를 도입해 drift term을 재정의하고, 이를 신경 ODE(Neural ODE) 프레임워크에 통합한다. 신경 ODE는 연속적인 흐름을 학습하면서 동시에 로그밀도(log ρ)를 추정하도록 설계되어, 전통적인 Monte‑Carlo 샘플링에 비해 샘플 경로의 변동성을 크게 감소시킨다.
둘째, 베리센터 계산을 스라이싱 워셔스틴 거리의 평균화된 형태로 전환한다. 기존 워셔스틴 베리센터는 고차원에서 계산 복잡도가 급격히 증가하지만, 본 논문은 각 방향 θ에 대한 1‑차원 칸토리비치 포텐셜 ψ′ₜ,θ 를 적분해 전체 drift vₜ(x)를 구성한다. 이 drift는 다중 민감도 속성별 경험적 분포에 대한 포텐셜의 가중합으로, 베리센터를 위한 최적화 목표인 ½ ∑ₛ pₛ SW₂²(μ,νₛ)+λ H(μ) 를 직접 최소화한다. 알고리즘 1은 θ 샘플링, CDF/Quantile 변환, 그리고 위에서 정의한 drift와 로그밀도 업데이트를 반복함으로써 샘플을 점진적으로 베리센터에 수렴시킨다.
이론적으로는 리우빌리 방정식 기반 흐름이 Fokker‑Planck 방정식과 동등함을 증명하고, 엔트로피 정규화 λ H(μ) 를 포함한 변분 문제의 해가 위의 drift‑diffusion 형태를 만족함을 보인다. 실험에서는 합성 데이터와 두 개의 실제 데이터셋(Communities‑Crime, Health‑Care‑Spending)을 사용해 수렴 속도, 손실 및 분산을 정량적으로 비교한다. 특히 차원이 60~120인 고차원 상황에서 Liouville‑PDE 기반 SWF와 베리센터는 기존 확산 기반 SWF에 비해 손실 감소율이 20 % 이상이며, 샘플 분산도 현저히 낮다.
공정 회귀 적용에서는 강한 인구통계적 평등(strong demographic parity) 조건을 만족하도록 베리센터를 이용해 예측 분포를 조정한다. 정확도‑공정성 파레토 곡선에서 제안 방법은 기존 사전·사후 처리 방식보다 더 넓은 파레토 영역을 차지한다. 이는 베리센터가 민감도 속성별 분포 차이를 직접 최소화하면서도 원본 예측 정확도를 크게 손상시키지 않기 때문이다.
전반적으로, 확산 항을 제거한 결정론적 리우빌리 흐름과 신경 ODE 기반 밀도 추정, 그리고 칸토리비치 포텐셜을 활용한 스라이싱 베리센터 근사는 고차원 확률 모델링과 공정성 보정에 있어 계산 효율성과 통계적 안정성을 동시에 달성한다는 점에서 의미가 크다.
댓글 및 학술 토론
Loading comments...
의견 남기기