알고리즘 마코프 조건을 통한 인과 추론
본 논문은 통계적 독립 대신 조건부 알고리즘 상호정보량이 0인 경우를 인과 관계의 마코프 조건으로 삼아, 단일 관측값만으로도 인과 그래프를 추론할 수 있는 이론을 제시한다. 알고리즘 복잡도와 조건부 확률밀도 함수의 복잡성을 함께 고려함으로써 마코프 등가 그래프를 구분하고, 실용적인 결정가능 기준으로의 근사 방법도 논의한다.
저자: Dominik Janzing, Bernhard Schoelkopf
1. 서론에서는 기존 인과 추론이 통계적 독립성 검정과 마코프 조건, 그리고 faithfulness 가정에 크게 의존함을 설명한다. 이러한 접근은 대규모 i.i.d. 샘플이 필요하고, 마코프 등가성 때문에 그래프를 완전히 식별하지 못한다는 두 가지 근본적인 한계를 지적한다. 저자는 이러한 한계를 극복하기 위해 “단일 관측값만으로 인과 관계를 추론한다”는 새로운 패러다임을 제시한다.
2. 알고리즘적 상호정보량(I(x:y|z))을 정의하고, 이를 조건부 알고리즘 독립성의 기준으로 삼는다. Kolmogorov 복잡도 K(x)와 조건부 복잡도 K(x|y)를 이용해 I(x:y)=K(x)+K(y)-K(x,y) 형태로 표현한다. 이때 I(x:y|z)=0이면 x와 y는 z를 알고 있을 때 알고리즘적으로 완전히 독립이라고 본다.
3. 이를 기반으로 “알고리즘 마코프 조건”을 제시한다. 즉, DAG G에 대해 모든 노드 Xₖ는 그 부모 PAₖ에 의해 완전히 기술될 수 있으며, 비후손 NDₖ와는 조건부 알고리즘 독립성을 만족한다. 이 조건은 통계적 마코프 조건의 직접적인 알고리즘적 대응이며, 함수적 모델(postulate 4)과 동일한 논증을 통해 정당화된다.
4. “상대 인과성” 개념을 도입한다. 두 객체 x와 y가 비슷하게 보이는 이유가 y가 x의 함수(또는 그 반대)라면, 그 함수의 설명 길이가 짧아야 한다는 직관을 알고리즘 복잡도로 정량화한다. 따라서 인과 방향은 “조건부 설명 길이”가 더 짧은 방향으로 결정된다.
5. 기존 마코프 등가 그래프를 구별하기 위한 새로운 원칙을 제시한다. 모든 가능한 DAG에 대해 각 노드의 조건부 확률밀도 P(Xₖ|PAₖ)를 Kolmogorov 복잡도 관점에서 “가장 간단한” 형태로 표현하는 그래프를 선호한다. 이를 “가능한 마코프 커널(practicable Markov kernels) 원칙”이라 부른다. 이 원칙은 실제 예시(이진 변수 X와 연속 변수 Y가 혼합 가우시안으로 생성된 경우)에서 X→Y가 Y→X보다 설명이 간단함을 보여준다.
6. 알고리즘적 접근이 통계적 추론에도 새로운 검정 규칙을 제공함을 논한다. 예를 들어, 조건부 밀도 추정에 사용되는 모델이 복잡도 측면에서 비정상적으로 큰 경우, 해당 인과 방향을 기각할 수 있다. 이는 “알고리즘 독립성 of Markov kernels”이라는 새로운 통계적 검정으로 해석된다.
7. 실용적인 적용을 위해 두 가지 결정가능 근사 방식을 제시한다.
- 7.1 대칭 제약(symmetry constraints): 변수 쌍 (X,Y) 사이의 알고리즘적 상호정보량이 대칭적인 경우, 그래프 방향을 제한한다. 이는 실제 데이터에서 쉽게 계산 가능한 상호 압축 길이 차이로 구현 가능하다.
- 7.2 자원 제한 복잡도(resource‑bounded complexity): 시간·공간 제한 하에서 실행 가능한 압축 알고리즘(LZ77, BZIP 등)을 사용해 문자열을 압축하고, 압축 길이를 복잡도 추정치로 활용한다. 이 방법은 Kolmogorov 복잡도의 비계산성을 회피하면서도 충분히 강력한 구분력을 제공한다.
8. 마지막으로, 논문은 알고리즘 마코프 조건이 기존 통계적 인과 추론을 보완하고, 단일 관측값 기반의 인과 탐색을 가능하게 하는 이론적 토대를 제공한다는 점을 강조한다. 또한, 이론적 결과가 실제 데이터 분석에 적용될 수 있도록 결정가능한 근사 방법을 제시함으로써, 향후 연구와 실무에 직접적인 영향을 미칠 수 있음을 시사한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기