브리즈번 대기 입자 수 농도 베이지안 시공간 모델
초록
본 연구는 시간은 촘촘하지만 공간은 희소한 패널 설계 데이터를 대상으로, 베이지안 반반정형 시공간 모델을 제안한다. 브리즈번 지역 초등학교와 장기 관측소에서 수집한 초미세 입자(PNC) 데이터를 이용해, 공통 일주·일일 주기와 각 현장의 고유 변동을 penalised random walk 로 계층적으로 모델링하고, R‑INLA 를 통해 효율적인 근사 베이지안 추정을 수행한다. 결과는 교통량과 신입자 입자 형성에 따른 PNC 피크를 설명하고, 학교 간 평균 PNC 차이를 공간적으로 해석한다.
상세 분석
이 논문은 “split‑panel design”이라 불리는 제한된 장비로 시간‑공간을 동시에 커버하는 실험 설계의 통계적 한계를 극복하기 위해, 베이지안 반반정형(spatio‑temporal) 모델을 개발하였다. 데이터는 브리즈번 대도시권에 위치한 여러 정부 초등학교에서 2주간 연속적으로 측정된 초미세 입자 수 농도(PNC)와, 도시 전역에 설치된 3개의 장기 관측소 데이터를 결합한 형태이다. 시간 축에서는 1시간 간격의 고해상도 시계열이 존재하지만, 공간 축에서는 각 학교마다 한 번에 측정된 단일 위치(학교 부지)만 존재한다는 점에서 전통적인 시공간 kriging 이 적용되기 어렵다.
모델 구조는 크게 두 부분으로 나뉜다. 첫째, 시간적 변동을 설명하기 위해 “penalised random walk (RW2)” 를 계층적으로 도입하였다. 전체 데이터에 공통적인 일일·주간 주기를 포착하는 전역 RW2와, 각 현장별 잔차를 설명하는 현장‑특이 RW2를 동시에 추정함으로써, 교통량에 의한 아침·오후 러시와 신입자 입자 형성 이벤트 등 복합적인 시간 패턴을 정밀하게 분리한다. 둘째, 공간적 변동은 학교별 평균 PNC와 학교 내부 위치(예: 교정 내 측정점) 간 차이를 모델링하기 위해 Gaussian Markov Random Field (GMRF)를 사용한다. 이때 INLA (Integrated Nested Laplace Approximation) 를 활용해 고차원 잠재 변수의 사후분포를 빠르게 근사한다.
베이지안 추정 과정에서 사전분포는 비정보적이면서도 RW2와 GMRF의 부드러움을 제어하는 하이퍼파라미터에 대해 적절히 정규화된 로그‑정규 사전분포를 부여하였다. R‑INLA 를 통한 근사는 MCMC 대비 수십 배 빠른 계산 속도를 제공하면서도, 사후 평균·표준편차, 95% 신뢰구간 등을 정확히 제공한다. 모델 검증은 교차검증과 posterior predictive checks 로 수행했으며, 예측 오차가 낮고, 실제 관측치와의 일치도가 높아 모델의 적합성을 입증하였다.
주요 통계적 인사이트는 다음과 같다. (1) 전역 RW2가 포착한 일일 주기는 약 24시간 주기로, 주중과 주말 사이에 뚜렷한 차이를 보이며, 이는 교통 패턴과 직접 연관된다. (2) 현장‑특이 RW2는 특정 학교에서의 급격한 피크(예: 오전 7시9시, 오후 4시6시)를 강조하며, 이는 해당 지역 교통량과 인근 도로의 차량 종류(디젤 vs 가솔린)와 연관될 가능성이 있다. (3) 공간적 GMRF 결과는 학교 간 평균 PNC 차이가 10~30 % 수준으로 존재함을 보여, 도시 내 미세입자 배출원의 이질성을 반영한다. (4) 모델을 도시 규모로 확장하면, 추가적인 관측소가 포함될 경우 GMRF의 공간 상관 구조가 더 정교해져, 교통·산업·기상 요인에 따른 도시 전반의 초미세 입자 분포를 추정할 수 있다.
이와 같이, 베이지안 반반정형 모델은 시간‑공간 데이터가 불균형하게 수집된 상황에서도, 복합적인 주기성·지역성·불확실성을 동시에 추정할 수 있는 강력한 도구임을 입증한다. 특히, R‑INLA 기반의 근사 베이지안 추정은 실무에서 대규모 환경 데이터 분석에 적용 가능하도록 계산 효율성을 크게 향상시킨다.