통합 중첩 라플라스 근사를 이용한 구조 방정식 모델의 근사 베이지안 추론
본 논문은 구조 방정식 모델(SEM)의 베이지안 추정을 위해 MCMC의 높은 계산 비용을 피하고자, INLA에서 영감을 얻은 간소화된 라플라스 근사와 스큐-노멀 분포를 결합한 근사 방법을 제안한다. 잠재 변수들을 완전히 적분해 낮은 차원의 파라미터 공간만을 대상으로 하며, 축별 프로파일링, 변분 베이지안 보정, 그리고 가우시안 코플라 차원 샘플링을 통해 요인 점수와 모델 적합 지표까지 효율적으로 추정한다. 정상 이론 SEM에 대해 거의 최대우도…
저자: Haziq Jamil, Håvard Rue
본 논문은 구조 방정식 모델(SEM)의 베이지안 추정을 위한 새로운 근사 방법론을 제시한다. 전통적으로 SEM의 베이지안 추정은 MCMC에 의존해 왔으며, 이는 잠재 변수 η를 샘플링해야 하기 때문에 차원이 n·q(표본 수×잠재 요인 수)만큼 늘어나 계산 비용이 급증하고, 체인 혼합도 저하와 수렴 문제를 야기한다. 저자는 이러한 한계를 극복하기 위해 두 가지 핵심 아이디어를 도입한다. 첫째, SEM을 잠재 가우시안 모델(LGM)으로 재구성하되, 잠재 변수를 완전히 적분해 marginal likelihood π(y|θ)만을 대상으로 한다. 이는 (1)–(2)식의 정규성에 의해 가능하며, 결과적으로 관측 데이터는 평균 μ(θ)=ν+Λ(I−B)^{−1}α와 공분산 Σ(θ)=Λ(I−B)^{−1}Ψ(I−B)^{−T}Λ^{T}+Θ 를 갖는 다변량 정규분포가 된다. 두 번째 아이디어는 INLA에서 영감을 받은 라플라스 근사와 스큐-노멀(SN) 분포를 결합해 비대칭성을 보정하는 것이다.
구체적인 절차는 다음과 같다.
1. **공동 라플라스 근사**: 파라미터 θ의 MAP 추정값 θ*와 헤시안 H를 계산한다. 파라미터 제약(양성, 구간)은 로그·피셔 변환을 통해 실수 공간으로 매핑하고, 변환에 대한 Jacobian을 최종 단계에서 보정한다. 이 단계에서 얻은 다변량 정규 근사 ˜π_G(θ|y)는 이후 단계의 기준이 된다.
2. **축별 프로파일링 및 조건 평균 경로(CMP)**: 각 파라미터 θ_j에 대해 주변밀도를 평가하기 위해 전통적인 라플라스 방식에서는 (m−1)차원 최적화와 헤시안 재계산이 필요하지만, 저자는 CMP를 사용해 이를 회피한다. CMP는 다변량 정규 근사에서 θ_j가 고정될 때 나머지 파라미터의 조건 평균을 직선 형태로 제공한다. 라플라스 근사의 정확한 주변밀도는 이 직선을 따라 평가된 공동밀도와 비례함을 보이는 Lemma 3.1을 이용한다. 따라서 θ_j의 그리드값마다 한 번의 로그밀도 평가만으로 충분히 정확한 프로파일을 얻는다.
3. **스큐-노멀 곡선 맞춤**: 프로파일링된 로그 주변밀도를 SN 분포 f_SN(x; ξ, ω, α)에 맞춘다. 여기서 ξ는 위치, ω는 스케일, α는 형태 파라미터이며, 비대칭성을 포착한다. 최적화는 최소 제곱법과 2차 미분(곡률) 정보를 활용해 효율적으로 수행한다.
4. **변분 베이지안(VB) 보정**: SN 근사는 여전히 라플라스 기반 근사이므로 위치 편향이 존재할 수 있다. 이를 보정하기 위해 평균-필드 형태의 변분 분포 q(θ) = ∏_j q_j(θ_j) 를 설정하고, KL(q‖π) 최소화를 통해 각 q_j의 평균을 재조정한다. 이 단계는 간단한 좌표 상승법으로 몇 번의 반복만에 수렴한다.
5. **가우시안 코플라 샘플링**: 최종적으로 얻은 주변분포들의 공분산 구조를 이용해 다변량 샘플을 생성한다. 코플라 방법은 각 파라미터의 마진을 SN 형태로 유지하면서, 전체 파라미터 벡터를 공동으로 샘플링한다. 이를 통해 요인 점수 η_s = V(θ)·
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기