검증 가능한 반사실 진술의 완전 규명
초록
본 논문은 반사실 진술을 물리 실험을 통해 확률적으로 추정할 수 있는 경우, 즉 “검증 가능한 반사실”을 완전하게 정의한다. 저자는 테스트 가능성을 판단하는 알고리즘을 제시하고, 검증 가능한 경우 실험 데이터로부터 해당 반사실의 확률을 계산하는 구체적 식을 제공한다. 이를 위해 구조적 인과 모델과 do‑연산, 식별 이론을 통합한 새로운 프레임워크를 구축한다.
상세 분석
논문은 먼저 반사실 진술을 전통적인 가능 세계 논리와 현대 인과 추론의 두 관점에서 재정의한다. 가능 세계 접근은 논리적 일관성만을 요구하지만, 물리적 실험과 연결하기엔 구체적인 확률 구조가 부재한다는 한계가 있다. 반면 인과 모델은 변수 간의 구조적 관계와 외생 변수의 분포를 명시함으로써 “어떤 조작이 이루어졌을 때”라는 조건을 명확히 할 수 있다. 저자는 이러한 구조적 인과 모델(Structural Causal Model, SCM)을 기반으로 반사실 진술을 “잠재적 결과(potential outcome)와 동일시”하고, 이를 확률적으로 표현하기 위해 do‑연산과 counterfactual operator를 결합한다.
핵심 기여는 “검증 가능성(testability)”의 정의이다. 검증 가능성은 두 가지 조건을 만족해야 한다. 첫째, 해당 반사실이 포함하는 모든 변수와 조작이 실제 실험 설계에서 관측 가능하거나 조작 가능해야 한다. 둘째, 반사실의 확률이 관측 데이터의 함수로 식별(identifiable)될 수 있어야 한다. 이를 수학적으로는 식별 조건을 만족하는 함수 f가 존재하여 P(counterfactual) = f(P(observed)) 형태가 되는지를 검증한다.
저자는 식별 가능성을 판단하기 위한 완전한 절차를 제시한다. 절차는 (1) 인과 그래프에서 반사실에 관련된 변수와 경로를 추출, (2) back‑door와 front‑door 기준을 적용해 교란을 차단, (3) do‑연산을 이용해 조작된 분포를 변환, (4) 기존 식별 정리(예: Pearl’s do‑calculus, Tian‑Pearl 식별 알고리즘)를 활용해 최종 식을 도출한다. 이 과정은 알고리즘적으로 구현 가능하도록 의사코드와 복잡도 분석을 제공한다.
또한, 검증 가능한 반사실의 확률을 실험 데이터에 매핑하는 구체적 식을 유도한다. 예를 들어, “A를 취했을 때 B가 발생할 확률”이라는 반사실은 P(B|do(A)) 로 표현되며, 이는 관측 분포 P(B|A)와 교란 변수 Z의 조건부 분포를 이용해 P(B|do(A)) = Σ_z P(B|A, Z=z)P(Z=z) 로 식별된다. 논문은 이러한 식을 일반화해 다중 변수, 연속 변수, 비선형 구조까지 포괄하는 공식들을 제시한다.
실험 섹션에서는 시뮬레이션과 실제 의료 데이터(예: 약물 투여와 부작용) 두 가지 사례를 들어 검증 가능성 판단 알고리즘과 확률 추정 식의 적용 과정을 보여준다. 시뮬레이션에서는 알려진 SCM을 사용해 진실된 반사실 확률을 계산하고, 제안된 방법이 정확히 동일한 값을 복원함을 확인한다. 실제 데이터에서는 기존 인과 추론 방법과 비교해 더 좁은 신뢰구간과 낮은 편향을 기록한다.
결과적으로 논문은 반사실 진술을 과학적 논증에 활용할 때 “검증 가능성”이라는 명확한 기준을 제공함으로써, 무분별한 가설 제시를 방지하고 실험 설계와 데이터 분석을 일관되게 연결한다는 점에서 이론적·실용적 의미가 크다.