인과 주장 견고성의 그래프적 측정과 알고리즘

초록

본 논문은 인과 주장(예: 약물이 질병을 예방한다는 주장)의 견고성을 형식적으로 정의하고, 인과 그래프 모델에서 가정 위반에 대한 민감도를 정량화하는 그래프 조건을 제시한다. 또한, 해당 견고성 정도를 효율적으로 계산할 수 있는 알고리즘을 설계·분석한다.

상세 분석

논문은 먼저 인과 주장(causal claim)을 “데이터와 인과 모델(가정)의 결합을 통해 도출된 명제”로 정의하고, 견고성(robustness)을 “특정 가정이 위배되더라도 주장 자체가 변하지 않는 정도”로 규정한다. 이를 위해 저자는 구조적 인과 모델을 다이렉트드 아시클리컬 그래프(DAG) 형태로 표현하고, 각 에지와 노드에 대응되는 가정을 ‘조건부 독립성’과 ‘함수적 형태’ 두 축으로 분류한다.

핵심 이론적 기여는 ‘견고성 차수(degree of robustness)’라는 정량적 지표이다. 이 지표는 특정 인과 주장에 대해, 어떤 최소 집합의 가정이 위배될 경우에도 주장이 유지되는지를 판단한다. 그래프 이론적 관점에서, 저자는 “d‑separation”과 “c‑component” 개념을 확장하여, 주장에 영향을 미치는 최소 절단 집합(minimal cut set)을 찾는 방법을 제시한다. 특히, 주장에 직접 연결된 경로들 중 ‘키 경로(key path)’와 ‘보조 경로(auxiliary path)’를 구분하고, 보조 경로가 모두 차단될 때만 주장이 무너지도록 설계된 그래프 구조가 견고성을 보장한다는 정리를 증명한다.

알고리즘적 측면에서는 두 단계의 절차가 제시된다. 첫 번째 단계는 주어진 DAG와 주장 변수 집합을 입력받아, 모든 가능한 가정 위반 시나리오를 탐색하지 않고도 최소 차단 집합을 찾는 ‘그래프 기반 전처리(Pre‑processing)’이다. 여기서는 토폴로지 정렬과 마코프 블랭킷(Markov blanket) 계산을 활용해 후보 집합을 급격히 축소한다. 두 번째 단계는 ‘조합적 검증(Combinatorial Verification)’으로, 후보 집합 각각에 대해 가정 위반이 주장의 식별 가능성에 미치는 영향을 선형 시간 복잡도 안에서 평가한다. 이 과정에서 저자는 ‘증명 가능한 견고성(Provably Robust)’과 ‘조건부 견고성(Conditionally Robust)’을 구분하고, 각각에 대한 복잡도 상한을 O(|V|+|E|)와 O(2^k·|V|) (k는 최소 차단 집합 크기)로 제시한다.

실험 섹션에서는 의료 데이터(예: 항암제 효과)와 사회과학 설문 데이터를 이용해 제안된 알고리즘을 기존의 민감도 분석 기법과 비교한다. 결과는 특히 가정 위반이 희소한 상황에서 제안 방법이 동일한 정확도를 유지하면서도 계산 시간을 10배 이상 단축함을 보여준다. 또한, 그래프 구조가 복잡할수록(다중 경로와 피드백 루프가 존재할 때) 견고성 차수가 낮아지는 경향을 정량적으로 확인한다.

이 논문은 인과 추론 분야에서 ‘가정에 대한 의존성’을 명시적으로 측정하고, 실무자가 정책·치료 결정 시 어느 정도의 가정 위반을 감수할 수 있는지를 객관적으로 판단할 수 있는 도구를 제공한다는 점에서 학문적·실용적 의의가 크다.