두 단계 치료 비순응 상황에서 누적 평균 처리 효과 식별: 다사이트 도구변수 활용
초록
**
본 논문은 초기 무작위 배정이 이루어진 1단계 치료 후 2단계에서 비순응이 발생하는 경우, 전통적인 배제제한과 순차적 무조건성을 완화하면서도 누적 평균 처리 효과(ATE)를 식별할 수 있는 새로운 다사이트 도구변수(MS2T‑IV) 방법을 제안한다. 시뮬레이션과 테네시 학급 규모 연구 재분석을 통해 제안 방법의 타당성과 실용성을 검증한다.
**
상세 분석
**
이 연구는 두 단계로 구성된 교육·보건·사회 프로그램에서 흔히 나타나는 두 가지 인과적 난제를 동시에 해결한다. 첫째, 1단계 치료(예: 유치원 소규모 학급) 후 2단계에서 비순응이 발생하면, 전통적인 ITT 분석은 누적 효과를 과소평가한다. 둘째, 1단계 치료 자체가 결과에 직접적인 영향을 미치므로 표준 IV 접근법이 요구하는 배제제한(exclusion restriction)이 깨진다. 저자들은 이러한 제약을 완화하기 위해 다사이트 무작위 배정을 활용한 MS2T‑IV 전략을 고안한다. 핵심 아이디어는 각 사이트별로 1단계 무작위 배정을 도구변수로 사용하면서, 2단계 치료 수령(D)와 중간 결과(V)를 명시적으로 모델링하고, V가 D와 Y 사이의 포스트트리트먼트 교란 변수임을 인정한다. 이를 위해 β₀ₖ, β₁ₖ, β₂ₖ라는 사이트별 비순응·ITT·컴플라이언스 파라미터를 정의하고, 각각을 관측공변량 X와 잠재적 교란 U에 조건부 기대값으로 표현한다. 이렇게 하면 비순응이 확률적(stochastic)이라는 가정 하에, 전통적인 컴플라이언트 평균 처리 효과(CATE) 대신 누적 ATE를 직접 추정할 수 있다.
식별 단계에서는 (1) Z가 V와 D에 미치는 직접 효과와 (2) V가 D와 Y에 매개하는 경로를 모두 포함하는 구조 방정식을 세운다. 이후 각 사이트별로 2‑SLS(두 단계 최소제곱) 혹은 GMM(일반화 모멘트 방법)을 적용해 β 파라미터와 누적 효과 δₐₜₑ를 추정한다. 중요한 점은, 이 과정에서 잠재적 교란 U는 Z와 독립이라는 무작위 배정 가정만으로 충분히 제거된다는 것이다. 따라서 순차적 무조건성(Sequential Ignorability) 가정이 필요 없으며, 배제제한 역시 V와 D가 Y에 직접 영향을 미치는 것을 허용한다.
시뮬레이션 결과는 비순응 비율이 30%까지 상승하고, 비선형 누적 효과가 존재할 때도 MS2T‑IV 추정량이 편향이 거의 없고 평균제곱오차가 낮음을 보여준다. 기존 IPTW나 전통 IV 방법은 비순응과 포스트트리트먼트 교란이 동시에 존재할 경우 크게 왜곡된 추정치를 제공한다.
실증 적용에서는 테네시 학급 규모(STAR) 데이터를 사용한다. 1단계(유치원)에서는 무작위 배정이 완전히 준수되었으나, 2단계(1학년)에서는 약 20%의 학생이 학급 규모를 전환했다. MS2T‑IV 분석 결과, 두 해 연속 소규모 학급에 배정된 경우 평균 점수 향상이 약 0.12표준편차(표준오차 0.04)로, 기존 ITT 추정치(0.07)보다 크게 나타났다. 이는 1단계 치료가 2단계 결과에 직접적인 영향을 미치며, 비순응을 적절히 보정했을 때 누적 효과가 더 크게 드러난다는 점을 시사한다.
이 논문은 다사이트 설계와 두 단계 치료 구조를 결합한 새로운 인과 추정 프레임워크를 제시함으로써, 정책 평가·임상 시험·사회 프로그램 등에서 복합적인 비순응과 직접 효과 문제를 동시에 다룰 수 있는 실용적인 도구를 제공한다. 향후 연구에서는 다단계(>2) 치료, 시간에 따라 변하는 교란, 그리고 비선형 매개 효과를 포함하는 확장 모델이 기대된다.
**
댓글 및 학술 토론
Loading comments...
의견 남기기