디파일러를 세는 방법: 평균 효과를 넘어선 증거를 드러내는 설계 기반 모델
초록
이 논문은 이진 처치와 결과만을 이용해 실험 설계 자체를 활용함으로써 표본 내 잠재 결과의 공동분포(항상수용자, 순응자, 디파일러, 절대수용자)의 가능성을 추정한다. 설계 기반 우도(likelihood)를 정의하고, 동일한 주변분포를 갖는 여러 공동분포 중 어느 것이 관찰된 데이터를 가장 많이 생성하는지를 계산한다. 이를 시각화하고 실제 보건 실험에 적용해, 전통적인 평균 효과 추정이나 프레셰 한계만으로는 드러나지 않는 이질성(특히 디파일러 존재 가능성)을 밝혀낸다.
상세 분석
본 연구는 전통적인 인과 추정이 평균 치료 효과(ATE)와 프레셰 경계에만 의존하는 한계를 지적한다. 저자들은 ‘디자인 기반’ 접근법을 채택해, 무작위 배정 설계 자체가 잠재 결과의 조합을 제한한다는 점에 주목한다. 구체적으로, n명의 표본 각각에 대해 (Yᵢ¹, Yᵢ⁰)∈{0,1}² 라는 고정된 잠재 결과를 가정하고, Zᵢ∈{I,C}는 완전 무작위(교체 없이) 배정된다. 이때 표본 내 각 개인은 네 가지 유형(항상수용자, 순응자, 디파일러, 절대수용자) 중 하나에 귀속된다.
핵심은 ‘공동분포 우도’를 정의하는데 있다. 동일한 주변분포(즉, 관측된 처치군·통제군의 성공률) 를 갖는 모든 가능한 공동분포를 열거하고, 각 공동분포가 실제 무작위 배정 과정에서 관측된 데이터(예: 처치군 2/3 성공, 통제군 1/3 성공)를 생성할 수 있는 배정 조합의 수를 셈으로써 우도를 계산한다. 이 수는 ‘엔트로피’와 동등하게 해석되며, 배정이 가능한 경우의 수가 많을수록 해당 공동분포가 데이터와 더 잘 맞는다고 본다.
예시에서는 6명의 환자를 대상으로 3명을 처치군에 배정한 완전 무작위 설계를 사용하였다. 주변분포는 처치군 2명, 통제군 1명의 성공을 보여준다. 세 가지 대표적인 공동분포(① 무디파일러·단조성 가정, ② 한 명의 디파일러, ③ 두 명의 디파일러) 각각에 대해 가능한 배정 조합을 계산하면 우도는 40%, 30%, 60%가 된다. 따라서 가장 높은 우도를 갖는 ③번 경우(두 명의 디파일러, 네 명의 순응자)가 데이터 생성에 가장 설득력 있다.
이 접근법은 다음과 같은 중요한 통찰을 제공한다. 첫째, 동일한 평균 효과와 프레셰 경계 하에서도 디파일러 존재 가능성을 구분할 수 있다. 둘째, 유형 수가 적고(예: 순응자와 디파일러만) 각 유형이 처치·통제에 균등히 배정될 때 우도가 상승한다는 ‘유형 균형’ 원리를 제시한다. 셋째, 전통적인 단조성(monotonicity) 가정이 불필요하거나 과도하게 제한적일 수 있음을 실증적으로 보여준다.
방법론적으로는 전수 탐색(grid search)과 최대우도 추정(maximum design‑based likelihood estimation, DBMLE)을 구현한 R 패키지 ‘dbmle’를 제공한다. 이 패키지는 사용자에게 표본 크기·배정 비율·관측된 성공률을 입력하면 가능한 공동분포와 그 우도를 자동으로 계산하고, 시각화(그림 1과 유사)까지 지원한다.
한계점도 명시한다. 표본이 작을 경우 우도 차이가 우연에 의해 크게 변동할 수 있으며, 실제 잠재 결과가 고정된다는 ‘디자인 기반’ 가정이 현실에서 완전히 성립하지 않을 가능성이 있다. 또한, 이 방법은 이진 처리·결과에 국한되며, 다중 수준 처리나 연속형 결과에는 직접 적용하기 어렵다. 그럼에도 불구하고, 정책 입안자가 ‘누가 실제로 해를 입는가’에 대한 정성적 판단을 보완하는 도구로서 가치가 크다.
댓글 및 학술 토론
Loading comments...
의견 남기기