시공간 로그가우시안 콕스 과정 추정을 위한 R 패키지 lgcp

본 논문은 시공간 로그가우시안 콕스(LGCP) 과정을 추정·예측하기 위한 R 패키지 **lgcp**를 소개한다. 패키지는 MCMC 기반의 메트로폴리스‑조정 라그랑주(MALA) 알고리즘을 활용해 실시간 예측과 파라미터 추정을 지원하며, 데이터 입력, 위험도 함수 추정, 공분산 파라미터 추정, 시뮬레이션 및 사후 처리까지 일련의 워크플로우를 제공한다.

저자: Benjamin M. Taylor, Tilman M. Davies, Barry S. Rowlingson

시공간 로그가우시안 콕스 과정 추정을 위한 R 패키지 lgcp
본 논문은 시공간 로그가우시안 콕스 과정(LGCP)을 이용한 질병 감시·예측을 목표로, 이를 R 환경에서 구현한 패키지 **lgcp**를 상세히 소개한다. LGCP는 사건 발생 강도 R(x,t)=exp{Y(x,t)} 로 표현되며, 여기서 Y(x,t)는 평균 −σ²/2, 공분산 Σ(s₁,t₁;s₂,t₂)=σ²·r(‖s₁−s₂‖;φ)·exp{−θ|t₁−t₂|} 를 갖는 Gaussian 과정이다. 공간 위험도 λ(s)와 시간 위험도 μ(t)는 각각 인구 위험도와 평균 사건율을 나타내며, 사용자는 데이터 기반 커널 밀도 추정(lambdaEst)과 로컬 가중 다항 회귀(muEst) 등을 통해 이들을 추정한다. 패키지는 먼저 입력 데이터를 (x_i, y_i, t_i) 형태의 공간‑시간 점패턴(stppp) 객체로 변환한다. 이후 spatstat의 이미지 객체를 spatialAtRisk 클래스로, 시간 벡터를 temporalAtRisk 클래스로 강제 변환해 위험도 함수를 정의한다. 파라미터 σ, φ, θ는 모멘트 매칭 방식으로 추정한다. 구체적으로, 공간 상관 파라미터는 평균화된 비동질 K‑함수와 g‑함수를 계산(ginhomAverage, KinhomAverage)하고, 이를 이론적 공분산 함수와 시각적으로 맞추는 rpanel GUI(spatialparsEst)를 통해 사용자가 직접 선택한다. 시간 상관 파라미터 θ는 사건 카운트 시계열의 자동상관함수를 이용해 추정한다. 이산화된 격자 상에서 Y는 다변량 정규분포로 근사되며, 공분산 행렬 Σ는 대칭 순환 행렬 C에 내장시켜 FFT(Discrete Fourier Transform)를 이용해 빠르게 계산한다. 이를 통해 Σ^{1/2}를 얻어 MALA(Metropolis‑Adjusted Langevin Algorithm) 제안분포를 구성한다. MALA는 Γ_t=Λ^{−1/2}Q(Y_t−μ) 로 정의된 변환 변수에 대해 Gaussian 전이밀도와 그 기울기를 이용해 효율적인 메트로폴리스 샘플링을 수행한다. 스케일 파라미터 h는 목표 수용률 0.574에 맞추어 자동 조정된다(Andrieu & Thoms, 2008). lgcp는 이러한 MCMC 샘플을 이용해 미래 시점 t+k에 대한 강도 R(x,t+k)의 공동 예측분포를 추출한다. 사용자는 특정 위치·시간에서 강도가 사전 정의된 임계값을 초과할 확률을 직접 계산해 실시간 경보를 생성할 수 있다. 또한, ncdf 패키지를 통해 대용량 NetCDF 형식의 사후 샘플을 저장·시각화하고, 다양한 spatstat 함수와 연동해 잔차 분석, 시뮬레이션, 모델 검증 등을 수행한다. 패키지 구조는 크게 네 단계로 나뉜다. (1) 데이터 읽기·변환, (2) 위험도 함수 추정, (3) 파라미터 추정, (4) MCMC 실행·사후 처리. 각 단계는 함수와 GUI가 제공되어 비전문가도 비교적 손쉽게 분석 파이프라인을 구축할 수 있다. 현재 버전은 베이지안 파라미터 사후 추정, 비정규 격자 지원, 다중 시계열 모델링 등 향후 기능을 로드맵에 포함하고 있다. 결론적으로, lgcp는 시공간 점과정 모델링의 이론적 배경, 고속 수치 연산, 사용자 친화적 인터페이스를 하나의 패키지에 통합함으로써, 질병 감시·예측, 환경 위험 평가 등 실시간 시공간 분석이 필요한 분야에 강력한 도구를 제공한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기