교환가능 가우시안 프로세스로 보는 단계적 정책 효과 평가

본 논문은 교환가능 다중작업 가우시안 프로세스(Exchangeable Multi‑task Gaussian Processes)를 활용해 패널 데이터에서 정책 개입의 인과 효과를 추정하는 새로운 프레임워크를 제시한다. 연구는 두 가지 실증적 상황을 다룬다. 첫 번째는 미국 캘리포니아 주에 1988년 이후 도입된 Proposition 99(프롭 99) 정책을 단일 치료 단위로 보는 경우이며, 두 번째는 그리스 전역의 주유소를 대상으로 한 정책이 각 주유소마다 서로 다른 시점에 적용되는 단계적(staggered) 채택 상황이다. 두 경우 모두 치료 전후의 관측 데이터를 이용해 미처치 잠재 결과(y_i★(0)) 를 추정하고, 이를 실제 치료 결과(y_i★(1)) 와 비교해 시점별 및 누적 효과를 도출한다. 1. **문제 정의 및 인과 프레임워크** - 패널은 i = 1,…,m 개체와 t = 1,…,T 시점으로 구성된다. 각 개체‑시점에 대해 관측값 y_it와 공변량 x_it가 있다. 치료는 w_it∈{0,1} 로 표시되며, 단일 치료 단위(i★)는 특정 시점 T₀ 이후 w_i★t=1, 나머지는 전 기간 동안 w_it=0이다. - 잠재 결과 y_it(0)와 y_it(1) 를 정의하고, 치료 효과 δ_it = y_it(1)−y_it(0) 를 추정한다. 주요 추정량은 치료 후 시점별 평균 효과 τ_i★,t와 누적 효과 C_i★, 평균 효과 δ_i★ 등이다. - 인과 추정을 위해 다섯 가지 가정을 제시한다: 단일 급격한 개입, 시간적 비간섭, 공변량 비처리 의존성, 결과 비예측성, 치료 비예측성. 이 가정들은 미처치 잠재 결과를 통계적으로 식별 가능하게 만든다. 2. **기존 방법과 한계** - 차분‑차분(DiD)·고정효과 모델은 선형·상호작용이 제한적이며, 비선형 추세를 포착하지 못한다. - 합성대조군(Synthetic Control)과 그 변형(SDID, GSC)은 가중합을 통해 대조군을 구성하지만, 가중치가 고정되고 비선형 동태를 반영하기 어렵다. - 베이지안 구조시계열(BSTS) 모델은 상태공간 구조를 사용하지만, 다중 개체 간 상호작용을 명시적으로 모델링하지 않는다. 3. **교환가능 GP 모델** - **모델 구조**: 전체 평균 과정 μ(t)와 개체별 편차 δ_i(t)를 각각 GP로 지정한다. 즉, y_it = μ(t) + δ_i(t) + ε_it, ε_it∼N(0,σ²). - **교환가능성**: 모든 개체가 동일한 사전 분포를 공유하도록 설계돼, 데이터가 부족한 개체도 다른 개체의 정보를 “빌려” 예측한다. 이는 다중 작업(Multi‑task) GP의 핵심 아이디어이며, Kronecker 구조를 이용해 공통 시간 커널 k_time와 개체 커널 k_unit을 결합한다. - **커널 선택**: RBF, Matern, Periodic, 그리고 이들의 곱·합 형태를 사용해 비선형 추세, 계절성, 급격한 변화를 모두 포착한다. 스터거드 채택 상황에서는 치료 인디케이터 w_it를 추가 입력으로 사용해 시간‑의존적 효과를 모델링한다. - **추정 방법**: 고차원 공분산 행렬의 역연산 비용을 줄이기 위해 Kronecker 구조와 변분 추정(Variational Inference) 또는 inducing point 기반 스파스 GP를 적용한다. 하이퍼파라미터는 최대우도(MLE) 혹은 MCMC로 학습한다. 4. **사후 예측 및 인과 효과 계산** - 치료 전 데이터와 통제군 데이터를 이용해 사후 분포 p(μ,δ|D₀) 를 얻는다. - 치료 후 시점에 대해 미처치 잠재 결과 y_i★(0) 의 사후 평균 m₀,t와 분산 v₀,t 를 추출하고, 실제 치료 결과 y_i★(1) 와 차이를 구한다. 차이는 정규분포 N(τ_i★,t, σ²_i★,t) 로 바로 표현된다. - 시점별 효과, 누적 효과, 평균 효과를 각각 평균과 신뢰구간(95 % Credible Interval) 형태로 보고한다. 5. **플라시보 검증** - 사전 기간에 가짜 개입 시점을 설정하고, 해당 시점 이후 데이터를 “미처치”로 가정해 모델이 얼마나 정확히 복원하는지 평가한다. - 평가 지표는 RMSE, MAE, 그리고 신뢰구간 커버리지이다. 교환가능 GP는 기존 DiD, 합성대조군, BSTS 대비 낮은 RMSE와 높은 커버리지를 보이며, 특히 비선형 추세가 강한 경우 성능 차이가 두드러진다. 6. **실증 적용** - **Prop99**: 캘리포니아 주의 연간 알코올 소비량 데이터를 사용해 1988년 이후 정책 효과를 추정한다. 교환가능 GP는 사전 기간(1970‑1988)의 추세를 정확히 학습하고, 정책 시행 후 평균 소비량 감소 3.2 % (95 % CI: −4.5 % ~ −1.9 %) 를 발견한다. 이는 기존 합성대조군이 제시한 2.1 % 감소보다 큰 효과를 시사한다. - **그리스 주유소**: 주유소별 주간 판매량을 52주 동안 관찰하고, 각 주유소가 정책을 도입한 시점이 다르다. 교환가능 GP는 각 주유소별 치료 시점에 따라 동적인 효과를 추정하며, 평균적으로 정책 도입 후 4주 내에 매출이 5.8 % 상승(95 % CI: 3.2 % ~ 8.4 %) 함을 보여준다. 7. **결론 및 향후 연구** - 교환가능 다중작업 GP는 비선형·비정상적 추세, 복잡한 공변량, 그리고 다수 치료 시점이라는 현실적인 정책 평가 상황을 모두 포괄한다. - 향후 연구에서는 비정상적 시계열(예: 구조적 변곡점)과 고차원 공변량(예: 텍스트 데이터) 통합, 그리고 정책 효과의 이질성(heterogeneous treatment effects) 분석을 위한 계층적 GP 확장 등을 제안한다.

교환가능 가우시안 프로세스로 보는 단계적 정책 효과 평가

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기