통합 중첩 라플라스 근사를 이용한 구조 방정식 모델의 근사 베이지안 추론

본 논문은 구조 방정식 모델(SEM)의 베이지안 추정을 위한 새로운 근사 방법론을 제시한다. 전통적으로 SEM의 베이지안 추정은 MCMC에 의존해 왔으며, 이는 잠재 변수 η를 샘플링해야 하기 때문에 차원이 n·q(표본 수×잠재 요인 수)만큼 늘어나 계산 비용이 급증하고, 체인 혼합도 저하와 수렴 문제를 야기한다. 저자는 이러한 한계를 극복하기 위해 두 가지 핵심 아이디어를 도입한다. 첫째, SEM을 잠재 가우시안 모델(LGM)으로 재구성하되, 잠재 변수를 완전히 적분해 marginal likelihood π(y|θ)만을 대상으로 한다. 이는 (1)–(2)식의 정규성에 의해 가능하며, 결과적으로 관측 데이터는 평균 μ(θ)=ν+Λ(I−B)^{−1}α와 공분산 Σ(θ)=Λ(I−B)^{−1}Ψ(I−B)^{−T}Λ^{T}+Θ 를 갖는 다변량 정규분포가 된다. 두 번째 아이디어는 INLA에서 영감을 받은 라플라스 근사와 스큐-노멀(SN) 분포를 결합해 비대칭성을 보정하는 것이다. 구체적인 절차는 다음과 같다. 1. **공동 라플라스 근사**: 파라미터 θ의 MAP 추정값 θ*와 헤시안 H를 계산한다. 파라미터 제약(양성, 구간)은 로그·피셔 변환을 통해 실수 공간으로 매핑하고, 변환에 대한 Jacobian을 최종 단계에서 보정한다. 이 단계에서 얻은 다변량 정규 근사 ˜π_G(θ|y)는 이후 단계의 기준이 된다. 2. **축별 프로파일링 및 조건 평균 경로(CMP)**: 각 파라미터 θ_j에 대해 주변밀도를 평가하기 위해 전통적인 라플라스 방식에서는 (m−1)차원 최적화와 헤시안 재계산이 필요하지만, 저자는 CMP를 사용해 이를 회피한다. CMP는 다변량 정규 근사에서 θ_j가 고정될 때 나머지 파라미터의 조건 평균을 직선 형태로 제공한다. 라플라스 근사의 정확한 주변밀도는 이 직선을 따라 평가된 공동밀도와 비례함을 보이는 Lemma 3.1을 이용한다. 따라서 θ_j의 그리드값마다 한 번의 로그밀도 평가만으로 충분히 정확한 프로파일을 얻는다. 3. **스큐-노멀 곡선 맞춤**: 프로파일링된 로그 주변밀도를 SN 분포 f_SN(x; ξ, ω, α)에 맞춘다. 여기서 ξ는 위치, ω는 스케일, α는 형태 파라미터이며, 비대칭성을 포착한다. 최적화는 최소 제곱법과 2차 미분(곡률) 정보를 활용해 효율적으로 수행한다. 4. **변분 베이지안(VB) 보정**: SN 근사는 여전히 라플라스 기반 근사이므로 위치 편향이 존재할 수 있다. 이를 보정하기 위해 평균-필드 형태의 변분 분포 q(θ) = ∏_j q_j(θ_j) 를 설정하고, KL(q‖π) 최소화를 통해 각 q_j의 평균을 재조정한다. 이 단계는 간단한 좌표 상승법으로 몇 번의 반복만에 수렴한다. 5. **가우시안 코플라 샘플링**: 최종적으로 얻은 주변분포들의 공분산 구조를 이용해 다변량 샘플을 생성한다. 코플라 방법은 각 파라미터의 마진을 SN 형태로 유지하면서, 전체 파라미터 벡터를 공동으로 샘플링한다. 이를 통해 요인 점수 η_s = V(θ)·

통합 중첩 라플라스 근사를 이용한 구조 방정식 모델의 근사 베이지안 추론

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기