해밀토니안 몬테카를로의 기하학

본 논문은 해밀토니안 몬테카를로(HMC)의 근본적인 수학적 구조를 심볼릭 기하학의 관점에서 재조명한다. 접공간·공접공간, 심볼릭 형태, 그리고 측도 보존 성질을 이용해 허용 가능한 해밀토니안의 일반형을 도출하고, 목표 분포의 주변화와 조건부 모멘텀 분포 선택을 통해 효율적인 마코프 전이 커널을 설계하는 방법을 제시한다.

저자: Michael Betancourt, Leo C. Stein

본 논문은 해밀토니안 몬테카를로(Hamiltonian Monte Carlo, HMC)의 수학적 기반을 심볼릭 기하학(symplectic geometry) 관점에서 체계적으로 재구성한다. 먼저, 매끄러운 n 차원 다양체 M 에 대해 접공간 TM과 공접공간 T* M 을 정의하고, 이들 번들의 좌표 (qᵢ, vⱼ) 와 (qᵢ, pⱼ) 를 도입한다. 좌표 변환 q→Q 가 주어지면, 1‑형식 d qᵢ 와 모멘텀 좌표 pᵢ 가 각각 Jacobian 행렬에 의해 선형 변환되며, 이때 촉각형식 θ = −∑ pᵢ d qᵢ 와 그 외부 미분 ω = dθ = ∑ d qᵢ ∧ d pᵢ 가 좌표 독립성을 유지한다는 점을 증명한다. ω는 비퇴화이며 닫혀 있기 때문에 (T* M, ω) 는 심볼릭 다양체가 된다. 이제 임의의 스칼라 함수 H(q,p) 로부터 해밀토니안 벡터장 X_H 를 ω( X_H ,·)=dH 로 정의한다. X_H 가 정의하는 미분 방정식은 고전역학의 해밀토니안 방정식 ˙qᵢ=∂H/∂pᵢ, ˙pᵢ=−∂H/∂qᵢ 와 동일하며, 이 흐름은 H 자체를 보존한다(∂H/∂t=0). 또한 위상 부피 형태 Ω=ωⁿ 도 보존(L_{X_H}Ω=0) 하므로, Liouville 정리와 일치한다. 마코프 전이 커널을 만들기 위해 저자는 확률밀도 π(q,p)∝exp(−H(q,p)) 를 정의하고, 흐름 φ_t (시간 t 에 대한 해밀토니안 흐름) 를 이용해 제안 분포를 만든다. 흐름은 상세 균형을 만족하므로, 메트로폴리스 수용-거부 단계 없이도 정확히 목표 분포를 유지한다. 그러나 수치적 적분(예: Leapfrog)에서 발생하는 오차와 가역성 보장을 위해 (1) 메트로폴리스 보정, (2) 모멘텀 반사(p→−p) 를 포함한 가역성 조건 ˙q(q,−p)=−˙q(q,p), ˙p(q,−p)=+˙p(q,p) 을 도입한다. 이렇게 하면 제안 연산자는 상세 균형을 만족하고, 전이 커널은 에르고딕하게 목표 분포에 수렴한다. 핵심적인 질문은 “어떤 해밀토니안이 주어진 목표 분포 π(q) 와 호환되는가?”이다. 저자는 전체 공접공간에 대한 결합 분포를 π(q,p)=π(p|q)π(q) 로 분해하고, 조건부 모멘텀 분포 π(p|q) 를 자유롭게 선택할 수 있음을 보인다. 따라서 가장 일반적인 허용 가능한 해밀토니안은 H(q,p)=−logπ(p|q)−logπ(q)+C = T(q,p)+V(q)+C 이며, 여기서 T와 V 는 각각 스칼라 밀도이다. T는 모멘텀에 대한 사전 분포를 정의하고, V는 목표 분포의 로그-우도에 해당한다. 이 분해는 기존 물리학적 해밀토니안(예: kinetic+potential)과 동일하지만, 물리적 의미에 얽매이지 않고 베이지안 추론에 맞게 자유롭게 설계할 수 있다. 조건부 모멘텀 분포를 설계할 때 고려할 수 있는 전략으로는 (a) 표준 정규분포를 사용해 전통적인 HMC를 복원, (b) 위치 의존적인 질량 행렬 M(q) 를 도입해 Riemannian HMC 로 확장, (c) 목표 분포의 고차 통계량(예: 지역적 공분산) 을 반영한 비정규 사전으로 설계해 샘플링 효율을 극대화하는 방법 등이 있다. 이러한 설계 자유도는 흐름이 보존하는 심볼릭 구조와 충돌하지 않으며, Jacobian determinant 가 1인 심볼릭 동형사상(symplectomorphism) 하에서 측도 보존이 자동으로 유지된다. 마지막으로, 저자는 HMC의 전체 알고리즘을 다음과 같이 요약한다: (1) 목표 분포 π(q) 를 정의하고, (2) 적절한 π(p|q) 를 선택해 H를 구성, (3) Leapfrog 등으로 근사 해밀토니안 흐름을 시뮬레이션하고, (4) 메트로폴리스 수용-거부와 모멘텀 반사를 적용해 상세 균형을 보장, (5) 모멘텀을 새로 샘플링하거나 Gibbs 단계와 결합해 전체 체인을 에르고딕하게 만든다. 이 과정에서 심볼릭 기하학이 제공하는 보존 법칙과 좌표 불변성은 알고리즘의 정확성과 효율성을 이론적으로 보증한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기