ABC 거부와 ABC 순차적 몬테카를로를 활용한 파라미터 추정 및 모델 선택 튜토리얼
본 튜토리얼은 Approximate Bayesian Computation(ABC)의 네 가지 핵심 알고리즘—파라미터 추정을 위한 ABC 거부, 파라미터 추정을 위한 ABC SMC, 결합 공간에서의 ABC 거부 기반 모델 선택, 그리고 결합 공간에서의 ABC SMC 기반 모델 선택—을 도식적으로 설명한다. 각 방법의 절차, 장단점, 그리고 동적 시스템 시뮬레이션에 적용하는 방법을 단계별로 제시한다.
저자: Tina Toni, Michael P. H. Stumpf
본 튜토리얼은 Approximate Bayesian Computation(ABC) 방법론을 네 가지 핵심 알고리즘으로 정리하고, 각각을 동적 시스템 모델링에 적용하는 구체적인 절차를 도식적으로 제시한다. 첫 번째 알고리즘은 가장 기본적인 ABC 거부(ABC rejection) 방법으로, 사전분포 P(θ)를 정의하고 사전에서 파라미터 θ*를 무작위 추출한다. 추출된 파라미터를 이용해 시뮬레이션 모델 f(D|θ*)를 실행해 가상 데이터 D*를 생성하고, 실제 관측 데이터 D₀와 거리 함수 d(D₀,D*)를 계산한다. 허용오차 ε를 사전에 설정하고, d≤ε인 경우에만 θ*를 받아들여 사후분포 P(θ|d(D₀,D*)≤ε)를 근사한다. 허용오차가 작을수록 근사 정확도가 높아지지만, 거부율이 급격히 증가해 계산 효율이 떨어지는 단점이 있다.
두 번째 알고리즘은 ABC 거부의 비효율성을 보완하기 위한 Sequential Monte Carlo(ABC SMC) 방식이다. 여기서는 허용오차 스케줄 ε₁>ε₂>…>ε_T을 정의하고, 각 단계마다 N개의 입자를 받아들여 인구(population)를 구성한다. 첫 단계에서는 큰 ε₁을 사용해 사전에서 직접 샘플링하고, 입자마다 가중치 w₁을 부여한다. 이후 단계에서는 이전 인구에서 입자를 재샘플링하고, 교란 커널 K(θ|θ′) (예: 가우시안 랜덤 워크)를 적용해 새로운 파라미터 θ**를 제안한다. 제안된 파라미터에 대해 시뮬레이션을 수행하고 거리 기준 d(D₀,D**)≤ε_t을 만족하면 수용하고, 해당 입자에 대한 가중치를 재계산한다. 이렇게 단계별로 ε를 점진적으로 감소시키면서 인구를 업데이트하면, 전체 과정이 사후분포에 수렴하도록 설계된다. ABC SMC는 입자 재활용과 가중치 조정을 통해 거부율을 크게 낮추면서도 고차원 파라미터 공간을 효율적으로 탐색한다.
세 번째 알고리즘은 모델 선택을 위한 ABC 거부 방법이다. 여기서는 모델 인덱스 m과 파라미터 θ를 결합한 확장된 상태공간 P(m,θ)를 정의한다. 사전에서 (m,θ)쌍을 샘플링하고, 시뮬레이션을 통해 가상 데이터 D*를 생성한다. 거리 기준 d(D₀,D*)≤ε을 만족하면 해당 (m,θ)쌍을 수용하고, 모델별로 수용된 입자 수를 집계해 모델의 사후확률 P(m|D₀)≈(#accepted with model m)/N을 추정한다. 이 방법은 구현이 간단하지만, 충분히 많은 입자를 필요로 하며, 특히 모델 수가 많을 경우 입자 할당이 희소해져 추정 정확도가 떨어질 수 있다.
네 번째 알고리즘은 모델 선택을 위한 ABC SMC 방식이다. 첫 인구에서는 (m,θ)쌍을 사전에서 샘플링해 거리 기준을 만족하는 N개의 입자를 확보하고, 각 입자에 동일한 가중치 w₁=1/N을 부여한다. 이후 단계에서는 이전 인구에서 모델 m*를 확률 P_{t‑1}(m*)에 따라 선택하고, 모델 전이 커널 K_{M,t}(m|m*)를 적용해 새로운 모델 m**를 제안한다. 제안된 모델에 대해 이전 인구에서 파라미터 θ*를 선택하고, 파라미터 전이 커널 K_{P,t,m**}(θ|θ*)를 적용해 새로운 파라미터 θ**를 만든다. (m**,θ**)에 대해 시뮬레이션을 수행하고 거리 기준 d(D₀,D**)≤ε_t을 만족하면 입자를 수용하고, 해당 입자에 대한 가중치 w_t(m**,θ**)를 계산한다. 각 단계가 끝날 때마다 가중치를 정규화하고, 모델별 가중치를 합산해 중간 모델 사후분포 P_t(m)를 얻는다. 최종 인구 T에서는 결합 사후분포 P(m,θ|D₀)를 근사한다. 이 과정은 모델 전이와 파라미터 전이를 동시에 수행함으로써, 모델 간 경쟁과 파라미터 추정을 동시에 최적화한다.
논문은 각 알고리즘을 도식화한 그림(예: Figure 1~4)을 통해 흐름을 시각적으로 제시하고, 동적 시스템 시뮬레이션(결정론적 모델에 노이즈 추가, 확률론적 모델에 직접 시뮬레이션)에서의 적용 예시를 간략히 설명한다. 또한, 허용오차 ε 선택, 입자 수 N, 교란 커널 설계, 가중치 계산식 등 실용적인 구현 세부사항을 언급한다. 참고문헌으로는 ABC 거부와 ABC SMC의 원리와 응용을 다룬 주요 논문들을 제시하고, 특히 모델 선택에 관한 Grelaud et al. (2009)와 저자들의 자체 연구(Toni et al., 2009; Toni & Stumpf, 2010)를 인용한다. 전체적으로 이 튜토리얼은 ABC 기반 파라미터 추정 및 모델 선택을 처음 접하는 연구자에게 단계별 알고리즘 이해와 실제 구현에 필요한 핵심 정보를 제공한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기