기관입소 효과를 보정한 물질남용 치료 효과 추정: 주성분 층화법 적용
본 연구는 치료 후 기관입소(감옥, 치료시설 등)로 인해 관측이 제한되는 상황에서, 주성분 층화(principal stratification) 방법을 확장하여 치료 효과를 추정한다. 청소년 물질남용 치료 프로그램(주거형 vs. 외래형)의 12개월 후 약물 사용 지표에 적용한 결과, 모델이 정확히 작동하려면 강력한 가정이 필요함을 시뮬레이션을 통해 확인하고, 실제 데이터에 적용할 때는 가정 위배 위험을 신중히 검토해야 함을 강조한다.
저자: Beth Ann Griffin, Daniel F. McCaffrey, Andrew R. Morral
본 논문은 물질남용 치료와 형사 사법 개입을 받은 대상자들이 치료 후 기관입소(감옥, 치료시설, 병원 등)라는 사후 교란에 노출될 가능성이 높다는 점에서 출발한다. 기관입소는 피험자의 자유를 제한하고, 약물 사용이나 범죄 행위와 같은 주요 결과를 억제하거나 관측을 불가능하게 만든다. 기존의 치료 효과 추정 방법은 이러한 사후 교란을 충분히 통제하지 못하고, 가정이 현실과 맞지 않을 경우 편향된 추정치를 제공한다는 문제점을 지적한다.
이에 저자들은 프랑가키스와 루빈(2002)이 제안한 ‘주성분 층화(principal stratification)’를 기반으로, 사후 교란인 기관입소를 잠재적 교란 상태로 모델링하는 새로운 통계적 프레임워크를 제시한다. 먼저, 전통적인 Neyman‑Rubin 인과 모델을 소개하고, 치료 할당 T(1=치료, 0=대조)와 두 개의 잠재적 결과 Y1, Y0를 정의한다. SUTVA와 무조건적 무작위 할당을 전제로 할 때, 관측된 평균 차이는 평균 치료 효과의 불편 추정량이 된다. 그러나 기관입소가 발생하면 Y가 관측되지 않거나 억제되므로, Y1과 Y0가 동시에 관측될 수 없는 ‘잠재적 입소 상태’ S(t) (t=0,1)를 도입한다.
주성분 층화는 각 피험자를 (S(0), S(1))이라는 두 차원으로 구분한다. 예를 들어, (0,0)은 어느 조건에서도 입소하지 않은 ‘Never‑Institutionalized’ 층, (1,0)은 치료 조건에서만 입소하는 ‘Complier‑like’ 층, (0,1)은 대조 조건에서만 입소하는 ‘Defier‑like’ 층, (1,1)은 양쪽 모두 입소하는 ‘Always‑Institutionalized’ 층으로 정의한다. 이러한 층 내에서는 잠재적 결과가 동일하게 정의되므로, 특정 층에 제한된 분석을 통해 비편향적인 치료 효과를 추정할 수 있다.
하지만 실제 데이터에서 기관입소는 이진이 아니라 ‘입소 일수’라는 연속형 변수로 측정된다. 저자들은 이를 반영하기 위해 입소 일수를 잠재적 연속형 변수 Z(t)로 모델링하고, Z(t)와 Y(t) 사이의 관계를 베이지안 혼합 모델로 설정한다. 구체적으로, (i) 치료 할당 T, (ii) 잠재 입소 일수 Z0, Z1, (iii) 관측된 결과 Yobs = Y(T)·I{Z(T)=0}+Ycensored·I{Z(T)>0} 형태의 관측 메커니즘을 정의한다. 베이지안 사후 추정은 Gibbs 샘플링과 Metropolis‑Hastings 알고리즘을 이용해 수행되며, 주요 관심 파라미터는 ‘Never‑Institutionalized’ 층의 평균 치료 효과 ΔNI이다.
시뮬레이션 연구에서는 세 가지 시나리오를 검증한다. 첫째, 잠재 입소 상태와 치료 효과가 독립적인 경우(이상적인 상황)에서는 모델이 실제 Δ를 정확히 복원한다. 둘째, 입소 일수가 치료 효과와 상관관계가 있는 경우(예: 입소가 치료 효과를 억제)에는 모델이 약간의 편향을 보이지만, 충분한 데이터와 강한 식별 정보가 있으면 여전히 유의미한 추정이 가능하다. 셋째, 모델 가정(예: SUTVA 위배, 무조건적 무작위 할당 위배)이 약간이라도 위배되면 추정치는 크게 왜곡된다. 특히, 입소 일수와 결과 사이의 연관성이 약할 경우 식별이 불가능해진다.
실제 적용 데이터는 ‘Adolescent Treatment Models (ATM)’ 연구에서 추출한 1,256명의 청소년을 대상으로 한다. 이들은 10개의 커뮤니티 기반 치료 프로그램(6개 주거형, 4개 외래형)에 신규 입원한 사례이며, 12개월 후 약물 사용을 측정한 ‘Substance Frequency Scale (SFS)’와 지난 90일 동안의 기관입소 일수를 기록했다. 기술 통계에 따르면, 주거형 치료군은 52%가 최소 1일 이상 입소했으며 평균 SFS는 9.0점, 외래형은 38% 입소, 평균 SFS는 9.7점으로, 주거형이 더 낮은 약물 사용을 보였지만 동시에 입소 비율이 높았다. 입소 일수가 늘어날수록 SFS 점수가 감소하는 억제 효과가 시각적으로 확인되었다.
주성분 층화 모델을 적용한 결과, ‘Never‑Institutionalized’ 층(입소하지 않은 피험자)에서는 두 치료군 간 평균 SFS 차이가 통계적으로 유의하지 않았다(ΔNI≈0). 반면 전체 평균 차이는 -0.7점으로 주거형이 더 효과적인 것으로 보였지만, 이는 입소 억제 효과에 의해 과대평가된 것으로 해석된다. 또한, ‘Complier‑like’ 층에서는 주거형이 입소 후 약물 사용이 크게 감소하는 경향을 보였으나, 이 층의 표본 크기가 작아 추정 불확실성이 크다.
논문의 결론은 다음과 같다. (1) 기관입소와 같은 사후 교란을 잠재적 교란 상태로 전환해 주성분 층화로 분석하면, 특정 층에 한정된 인과 효과를 비편향적으로 추정할 수 있다. (2) 다중 수준 교란을 다루기 위해서는 잠재 입소 일수를 연속형으로 모델링하고, 충분한 식별 정보를 확보해야 한다. (3) 실제 데이터 적용 시 강력한 가정이 충족되지 않을 가능성이 높으며, 특히 SUTVA와 무조건적 무작위 할당이 위배될 경우 결과 해석에 큰 주의가 필요하다. (4) 정책 입안자는 전체 평균 효과만을 보고 결정을 내리기보다, 입소 여부에 따라 효과가 어떻게 달라지는지를 고려해야 한다. 향후 연구에서는 더 풍부한 사전 정보(예: 입소 전 위험 요인)와 다중 시점 데이터를 활용해 식별력을 강화하고, 베이지안 사전 분포를 통해 가정 민감도를 정량화하는 방향이 제시된다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기