스팸오버와 비준수 상황에서 인과효과를 식별하는 랜덤 포화 실험 방법

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 그룹 내 스팸오버와 일방적 비준수가 동시에 존재하는 실험에서, 직접효과와 간접효과(스팸오버)를 개별 치료 효과(처리받은 사람)와 비처리자에게 각각 식별·추정하는 방법을 제시한다. 랜덤 포화 설계와 “개인화된 제안 반응”(IOR) 가정 하에 무작위 포화와 개별 제안을 도구변수로 활용해 무작위화된 무작위 효과를 추정하고, 일관성·점근정규성을 갖는 IV 추정량을 제시한다. 프랑스 청년 고용지원 실험에 적용해, 프로그램 수용자에게는 직접적인 긍정 효과가 있지만, 주변인의 수용 증가가 비수용자에게는 고용률을 낮추는 부정적 스팸오버를 발생시킴을 발견한다.

상세 분석

이 논문은 기존의 랜덤 포화 실험(Randomized Saturation Design, RSD)이 갖는 두 가지 주요 변동원—개인에게 주어지는 치료 제안(Z)과 그룹 내 제안 비율(포화 S)—을 이용해 스팸오버와 비준수(non‑compliance)를 동시에 다루는 새로운 식별 전략을 제시한다. 핵심 가정은 네 가지이다. 첫째, 부분 간섭(partial interference): 각 개인은 하나의 알려진 그룹에만 속하고, 스팸오버는 그 그룹 내부에서만 발생한다. 이는 군집 무작위화 설계와 일치하며, 그룹 간 간섭을 무시함으로써 모델을 단순화한다. 둘째, 익명 상호작용(anonymous interactions): 개인의 잠재적 결과는 이웃들의 치료 수용 비율(¯D)만에 의존하고, 구체적인 이웃의 정체는 무시한다. 이는 네트워크 정보가 부족한 실험에서 현실적인 가정이며, Manski(2013)의 익명 상호작용 모델과 연결된다. 셋째, 일방적 비준수(one‑sided non‑compliance): 치료는 오직 제안을 받은 사람에게만 가능하고, 제안을 받지 않은 사람은 절대로 치료를 받지 않는다. 이는 “encouragement design”에서 흔히 관찰되는 상황이며, 치료를 받을 수 있는 잠재적 집단을 ‘컴플라이어’와 ‘절대 비수용자(never‑takers)’로 구분한다. 넷째, 개인화된 제안 반응(IOR): 개인의 치료 수용 결정은 이웃들의 실제 제안(Z)과는 독립적이다. 즉, 개인은 자신의 제안만을 보고 행동한다. 이 가정은 온라인 플랫폼 등에서 이웃의 제안이 관찰되지 않거나 지연되는 경우에 타당하며, 전략적 행동을 완전히 배제하지는 않지만, 정보 비대칭을 전제로 한다.

위 가정 하에 저자들은 무작위 포화와 개인 제안을 결합한 도구변수를 구성한다. 구체적으로, 그룹 크기 n과 그룹 내 컴플라이어 비율 ¯c를 조건부로 고정하면, 이웃들의 평균 제안(¯Z)과 평균 수용(¯D)은 순전히 실험 설계에 의해 결정된다. 따라서 ¯Z와 ¯D는 개인의 무작위 효과(α_i, β_i 등)와 독립적이며, 이를 이용해 **직접 효과(direct effect)**와 **간접 효과(indirect effect)**를 식별한다. 직접 효과는 개인의 치료 수용이 자신의 결과에 미치는 영향이며, 간접 효과는 이웃들의 평균 수용이 개인 결과에 미치는 영향을 의미한다.

논문은 이러한 식별 전략을 **랜덤 계수 모델(random coefficients model)**에 통합한다. 잠재적 결과는 다음과 같이 표현된다.

Y_{ig} = X_{ig}′γ + τ_i D_{ig} + ρ_i ¯D_{ig} + ε_{ig},

여기서 τ_i와 ρ_i는 각각 개인별 직접·간접 효과를 나타내는 무작위 계수이며, X_{ig}는 사전 특성이다. 비준수와 이질성(heterogeneity)을 허용하기 위해 τ_i와 ρ_i를 무작위 효과로 두고, IOR 가정에 의해 도구변수(¯Z, S)와 독립성을 확보한다. 이 구조는 기존의 “naïve IV”가 이질성을 무시하고 편향될 위험을 극복한다.

식별 정리는 크게 두 단계로 전개된다. (1) 조건부 독립성: 그룹 크기 n과 컴플라이어 비율 ¯c를 고정하면, ¯Z와 ¯D는 개인의 무작위 효과와 독립이다. (2) 배경 평균 근사: 큰 그룹에서는 실제 컴플라이어 비율 ¯c를 직접 관측할 수 없지만, 제안을 받은 사람들의 평균 수용률 b_c ≈ ¯c 로 근사한다. 이를 통해 실현 가능한 도구변수(¯Z, S, b_c)를 사용해 IV 회귀를 수행한다.

추정 방법은 두 단계 최소제곱(2SLS) 형태이며, 첫 단계에서는 D와 ¯D를 위 도구변수로 회귀하고, 두 번째 단계에서는 Y를 예측된 D와 ¯D에 회귀한다. 저자들은 그룹 수 G와 그룹 크기 n이 동시에 커지는 asymptotic 환경을 가정하고, 추정량이 일관성(consistency)과 점근 정규성(asymptotic normality)을 만족함을 정리와 증명을 통해 보인다. 또한, 시뮬레이션을 통해 중간 규모(수백 그룹, 각 그룹 10~30명)에서도 편향이 거의 없고, 표준오차가 정확히 추정됨을 확인한다.

실증 적용에서는 프랑스 청년 고용지원 프로그램(크레폰 등, 2013)을 사용한다. 실험은 여러 도시를 그룹으로 나누고, 각 도시마다 다른 포화 수준(0~~1)을 무작위 할당했다. 결과는 다음과 같다. (1) 직접 효과: 프로그램을 실제로 이용한(complier) 청년들의 고용 확률이 약 5~~7%p 상승했다. (2) 간접 효과: 같은 도시 내 다른 청년들의 프로그램 이용률이 증가할수록, 비수용자들의 고용 확률은 약 2~3%p 감소했다. 이는 “노동 시장 교체(displacement)” 현상을 반영한다. 흥미롭게도, 직접 효과가 간접 효과를 상쇄해 전체 ITT 효과는 거의 0에 가깝게 나타났다. 따라서 정책 입안자는 단순히 프로그램 제공량을 늘리는 것이 아니라, 스팸오버를 최소화할 수 있는 설계(예: 맞춤형 매칭, 지역별 보조금 조정 등)를 고려해야 함을 시사한다.

마지막으로 논문은 기존 연구와의 차별점을 강조한다. Kang & Imbens(2016)와 Imai et al.(2020)는 “personalized encouragement” 혹은 “complier average direct effect(CADE)”를 정의했지만, 이들은 스팸오버와 직접 효과를 혼합하거나 특정 포화 수준에 종속된 “reduced‑form” 효과만을 제공한다. 반면, 현재 연구는 IOR 가정 하에 구조적(structural) 직접·간접 효과를 별도로 식별함으로써, 정책 분석에 직접 활용 가능한 “treatment‑on‑the‑treated”와 “treatment‑on‑the‑untreated” 효과를 제공한다. 또한, Vázquez‑Bare(2021)의 쌍(pair) 모델을 일반화해 다인구 그룹에서도 적용 가능하게 만든 점이 큰 기여이다.

스팸오버와 비준수 상황에서 인과효과를 식별하는 랜덤 포화 실험 방법

초록

상세 분석

댓글 및 학술 토론

의견 남기기