도‑계산 재조명 인과식별과 메타합성의 새로운 지평
초록
본 논문은 1995년 제시된 도‑계산(do‑calculus)의 최신 연구 동향을 정리한다. 기존의 완전성 증명과 그래프 기반 식별 기준을 요약하고, 최근의 세 가지 확장 분야인 매개효과 분석, 전이가능성(transportability), 그리고 새롭게 정의된 메타합성(meta‑synthesis)을 조명한다. 특히 메타합성에서 제기되는 이질적 연구들의 통합 문제와 이를 해결하기 위한 도‑계산 기반 전략을 중점적으로 논의한다.
상세 분석
도‑계산은 인과 그래프 모델에서 ‘do‑연산’(조작)과 관측 변수를 구분함으로써 비모수적 인과 효과를 식별할 수 있게 하는 일련의 변환 규칙이다. 본 논문은 먼저 Huang‑Valtorta(2006)와 Shpitser‑Pearl(2006)이 제시한 두 가지 완전성 증명을 비교한다. Huang‑Valtorta는 도‑계산 규칙을 이용해 모든 식별 가능한 인과 효과를 도출할 수 있음을 보였으며, 그 증명은 ‘정규형 변환(normal form transformation)’에 기반한다. 반면 Shpitser‑Pearl은 ‘정규화된 인과 쿼리(normalized causal query)’와 ‘시퀀셜 적용(sequential application)’을 통해 동일한 완전성을 확보한다. 두 증명 모두 그래프 구조의 ‘백도어 경로(back‑door path)’와 ‘프런트도어 경로(front‑door path)’ 차단 조건을 핵심으로 삼지만, 접근 방식에서 차이를 보인다.
그 다음 Tian‑Shpitser(2010)의 그래프 기준은 도‑계산 없이도 인과 효과 식별 가능성을 판정할 수 있는 알고리즘을 제공한다. 이 알고리즘은 ‘c‑component 분해(c‑component decomposition)’와 ‘hedge 구조’를 탐색해 식별 불가능성을 조기에 발견한다는 점에서 실용적이다. 논문은 이러한 기존 이론을 바탕으로 세 가지 새로운 적용 분야를 소개한다.
첫 번째는 매개효과 분석이다. Pearl(2012)은 도‑계산을 이용해 직접·간접 효과를 명시적으로 분리하고, 비선형·비정규 모델에서도 식별 가능성을 검증한다. 여기서는 ‘중간 변수(mediator)’가 존재할 때 ‘do‑연산’과 관측 연산을 교차 적용해 효과를 분해하는 구체적 절차가 제시된다.
두 번째는 전이가능성이다. Pearl‑Bareinboim(2011)은 서로 다른 환경(예: 인구통계학적 차이)에서 수집된 데이터를 하나의 목표 환경으로 옮기는 문제를 다룬다. 도‑계산은 ‘selection‑bias’를 모델링하는 ‘s‑노드’를 도입해, 원본 환경과 목표 환경 사이의 구조적 차이를 정량화하고, 필요한 조정 변수를 식별한다.
세 번째이자 가장 혁신적인 분야는 메타합성이다. 메타합성은 이질적인 연구들(다양한 표본, 측정 도구, 실험 설계)을 하나의 통합 인과 추정치로 결합하는 작업을 의미한다. 기존 메타분석은 주로 평균 효과를 합산하지만, 인과 구조가 다르면 단순 평균은 편향을 초래한다. 논문은 메타합성을 위해 ‘공통 인과 그래프(common causal graph)’를 정의하고, 각 연구별 ‘selection‑bias’와 ‘measurement‑error’를 도‑계산 규칙으로 보정한다. 핵심 아이디어는 각 연구를 ‘부분 그래프’로 보고, 이들을 ‘합성 그래프(synthesis graph)’에 연결해 전체 인과 효과를 도출하는 것이다. 이를 위해서는 (1) 연구 간 변수 매핑, (2) 환경 특이적 s‑노드 삽입, (3) ‘hedge’ 검출을 통한 식별 가능성 사전 검증이 필요하다. 또한, 메타합성 과정에서 발생하는 ‘다중 충돌(multiple colliders)’과 ‘조건부 독립성 위반’을 자동으로 탐지하는 알고리즘을 제안한다. 이러한 절차는 기존 메타분석이 놓치던 구조적 편향을 최소화하고, 목표 환경에 대한 보다 신뢰할 수 있는 인과 추정을 가능하게 한다.
마지막으로 논문은 메타합성의 실용적 도전 과제로 (i) 이질적 데이터 포맷 통합, (ii) 변수 정의 불일치, (iii) 제한된 표본 크기에 의한 불확실성 전파 등을 제시하고, 베이지안 모델링과 샘플링 기반 추정법을 결합한 하이브리드 접근법을 제안한다. 전체적으로 도‑계산이 인과 식별의 이론적 토대를 제공함과 동시에, 복합 현실 문제에 적용될 수 있는 강력한 도구임을 강조한다.