베이지안 추론을 활용한 전염병 모델링 입문
본 강의노트는 SIR 모델을 예시로 베이지안 추론과 MCMC, 특히 Metropolis‑Hastings 알고리즘을 이용해 전염병 모델의 파라미터(전파율 β, 회복율 γ)를 추정하는 방법을 단계별로 설명한다. 사전분포 설정, 가우시안 잡음 가정에 기반한 우도 함수 도출, 사후분포 샘플링 절차와 결과 해석까지 graduate 수준의 독자를 위해 자가학습이 가능하도록 구성하였다.
저자: Augustine Okolie
본 강의노트는 “왜 베이지안 추론이 필요한가?”라는 질문으로 시작한다. 전염병 모델링에서 핵심 파라미터인 전파율 β와 회복율 γ는 직접 관측하기 어렵고, 데이터는 잡음과 불완전성을 내포한다. 전통적인 빈도주의 접근은 단일 최적값(예: 최대우도)만을 제공하지만, 베이지안은 사전지식과 데이터를 결합해 파라미터 전체 분포, 즉 사후분포를 추정한다.
다음 장에서는 SIR 모델을 상세히 소개한다. 인구 N을 Susceptible(S), Infectious(I), Recovered(R) 세 구역으로 나누고, 미분방정식 \( \dot S = -\beta SI/N, \dot I = \beta SI/N - \gamma I, \dot R = \gamma I \) 으로 동역학을 기술한다. 해석적 해가 없으므로 Euler 방법과 Runge‑Kutta 4(RK4) 같은 수치적 ODE 솔버를 이용한다. 파라미터 β와 γ가 어떻게 감염곡선의 형태와 규모(R₀=β/γ)를 결정하는지 그래프와 표를 통해 설명한다.
베이지안 설정에서는 파라미터 벡터 θ=(β,γ)와 관측 데이터 y(시간별 감염자 수)를 정의하고, 베이즈 정리 \( P(θ|y) ∝ P(y|θ)P(θ) \) 를 제시한다. 우도 함수는 관측값이 모델 예측에 가우시안 잡음 \( ε_t∼N(0,σ^2) \) 을 더한 형태라고 가정한다. 따라서 로그우도는 \( -\frac{1}{2σ^2}\sum_t (I_{obs}(t)-I_{model}(t;θ))^2 \) 가 된다. 이는 최소제곱과 동일함을 강조하며, 베이지안이 단순히 최적화가 아니라 사전과 결합된 확률적 추정임을 부각한다.
사전분포는 β∼Uniform(0.05,1.0), γ∼Uniform(0.01,0.5) 로 설정해 “양수이며 비현실적인 값은 배제한다”는 최소한의 도메인 지식을 반영한다. 필요 시 외부 연구 결과를 이용해 정규분포 등 정보적 사전으로 교체 가능함을 언급한다.
MCMC 절차는 마코프 체인의 장기분포가 사후분포와 일치한다는 원리를 기반으로 한다. Metropolis‑Hastings 알고리즘을 구체적으로 제시한다. 1) 초기값 설정, 2) 대칭 가우시안 제안분포 \( q(θ'|θ^{(t)}) \) 에서 새로운 파라미터 제안, 3) 수식 \( α = \min\{1, \frac{P(y|θ')P(θ')}{P(y|θ^{(t)})P(θ^{(t)})}\} \) 로 수용비율 계산, 4) α 확률로 수용, 아니면 현재값 유지, 5) 반복. 여기서 정규화 상수 P(y) 가 약분되어 계산이 용이함을 강조한다.
버닝‑인 단계에서는 초기 체인이 고확률 영역에 도달하기 전까지의 샘플을 버린다. 저자는 버닝‑인 길이를 경험적으로 설정하고, 수렴 여부를 트레이스 플롯과 자기상관 함수로 확인할 것을 권고한다.
실험 섹션에서는 N=1000, 초기 감염 I₀=10, 실제 파라미터 β*=0.3, γ*=0.1 로 합성 데이터를 생성하고 σ=15 의 가우시안 잡음을 추가한다. MCMC는 8000 반복, 제안표준편차 δ=0.015 로 실행한다. 결과는 사후 평균 β̂≈0.298, γ̂≈0.102 로 실제값에 근접하고, 95 % credible interval이 각각 (0.25,0.35), (0.07,0.13) 정도로 추정 정확도를 보여준다. 또한, 베이지안 신뢰구간과 전통적 신뢰구간을 비교해 베이지안이 데이터가 적을 때도 사전 정보를 활용해 보다 안정적인 추정을 제공함을 논한다.
마지막으로 Metropolis‑Hastings 외에 Hamiltonian Monte Carlo, No‑U‑Turn Sampler(NUTS) 등 고급 샘플러를 간략히 소개한다. 복잡한 계층적 모델이나 대규모 파라미터 공간에서는 이러한 알고리즘이 효율성을 크게 향상시킨다. 논문은 “베이지안 추론은 모델링 불확실성을 정량화하고, 사전 지식을 체계적으로 통합하는 강력한 도구이며, MCMC는 이를 실용적으로 구현하는 핵심 엔진”이라는 결론으로 마무리한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기