고차원 베이지안 추정용 DAG‑위시트 분포와 그 응용
초록
본 논문은 임의의 방향성 비순환 그래프(DAG) 구조를 갖는 다변량 정규 모델에 대해, Cholesky 파라미터화된 공분산 행렬에 대한 다중 형태 파라미터(conjugate) 사전분포인 DAG‑위시트(DAG‑Wishart) 분포를 제안한다. 이 분포는 기존의 단일 형태 파라미터 위시트와 달리 정점 수만큼의 자유 형태 파라미터를 제공하며, 강한 하이퍼‑마르코프 성질을 통해 고차원에서도 폐쇄형 사후 평균과 분산을 얻을 수 있다. 제안 방법은 공분산/정밀도 추정과 DAG 구조 선택에 적용 가능하며, 수치 실험을 통해 Lasso‑DAG 대비 높은 정확도와 확장성을 보인다.
상세 분석
이 논문은 Gaussian DAG 모델에 대한 베이지안 추정의 근본적인 난제인 “불완전한 공분산/정밀도 행렬 공간에 대한 적절한 사전분포 정의” 문제를 해결한다. 기존 연구는 완전 그래프 혹은 분해가능(decomposable) 그래프에 한정된 하이퍼‑위시트(Hyper‑Wishart)나 IW‑PG(Inverse‑Wishart‑Power‑Graph)와 같은 단일 형태 파라미터 사전분포만을 제공했으며, 이는 DAG가 완전하거나 완전 그래프와 동형인 경우에만 적용 가능했다. 저자들은 Cholesky 분해를 이용해 정밀도 행렬 Ω=Σ⁻¹를 L·D⁻¹·Lᵀ 형태로 표현하고, L은 DAG의 부모 관계를 반영하는 하삼각 행렬, D는 양의 대각 행렬로 정의한다. 이 공간 Θ_D는 각 정점 i마다 (D_{ii}, L_{pa(i),i}) 쌍으로 완전히 분리될 수 있어, 정점별 독립적인 형태 파라미터 α_i를 도입할 수 있다.
논문은 먼저 완전 DAG에 대한 전통적인 Wishart(η,U) 분포를 Θ_D에 매핑하고, Jacobian Q_i= D^{p−i−2}을 통해 α_i=η+p−2i+3 형태의 다중 형태 파라미터를 얻는다. 여기서 중요한 점은 η가 하나뿐이지만, 매핑 과정에서 각 정점마다 독립적인 α_i를 정의함으로써 “다중 형태 파라미터”를 자연스럽게 도입한다는 것이다. 이후 이 아이디어를 일반 DAG에 확장한다. 완전 그래프와 달리 일반 DAG는 완전한 클리크 구조가 없으므로 기존의 IW‑PG와 같은 측정 기반 접근이 불가능하다. 대신 저자들은 Θ_D에서 직접 다중 형태 파라미터를 갖는 확률밀도
π(D,L) ∝ exp{−½ tr(LDLᵀU)} ∏{i=1}^p (D{ii})^{α_i/2−pa(i)/2−1}
를 정의하고, 이를 다시 공분산 공간 PD_D와 정밀도 공간 P_D로 “fold back”한다. 이때 사용되는 변환은 불완전 행렬(즉, DAG에 의해 자유롭게 정의되는 원소들)과 완전 행렬 사이의 일대일 대응을 보장하는 “완성 알고리즘”(reference
댓글 및 학술 토론
Loading comments...
의견 남기기