일반화된 도구변수 방법

초록

본 논문은 비실험적 관측치와 전문가가 제공하는 질적 도메인 지식을 결합하여 직접 인과 효과를 추정하는 새로운 방법을 제시한다. 도메인 지식은 선형 관계를 전제로 한 방향성 비순환 그래프(DAG) 형태로 인코딩되며, 일부 변수는 관측되지 않을 수 있다. 기존 도구변수(IV) 방법이 요구하는 풍부한 조건부 독립성 가정이 충족되지 않는 경우에도 적용 가능한 일반화된 IV 조건을 제시하고, 이를 통해 식별 가능성을 검증한다.

상세 분석

이 연구는 선형 구조 방정식 모델(linear structural equation model, SEM)과 방향성 비순환 그래프(DAG)를 결합한 프레임워크를 기반으로 한다. 전통적인 도구변수(IV) 방법은 외생 변수와 도구 변수 사이에 강한 독립성 및 배제 제한(exclusion restriction)이라는 두 가지 핵심 가정을 필요로 한다. 그러나 실제 사회과학·경제학 데이터에서는 이러한 가정이 충족되기 어려운 경우가 많으며, 특히 조건부 독립성이 충분히 드러나지 않는 복잡한 네트워크에서는 기존 IV가 적용 불가능하다.

논문은 이러한 한계를 극복하기 위해 “일반화된 도구변수”(Generalized Instrumental Variables, GIV) 개념을 도입한다. GIV는 단일 변수 대신 변수 집합을 도구로 활용하며, 이 집합이 만족해야 하는 식별 조건을 행렬식(rank) 조건으로 표현한다. 구체적으로, 관측 가능한 변수 집합 Z와 관심 변수 X, 그리고 결과 변수 Y 사이에 존재하는 구조적 관계를 나타내는 계수 행렬을 고려한다. GIV는 다음 두 가지 핵심 요건을 만족해야 한다. 첫째, Z가 X에 대한 충분한 변동성을 제공해야 하며, 이는 Z와 X 사이의 회귀 계수 행렬이 풀랭크(full rank)임을 의미한다. 둘째, Z가 Y에 직접적인 경로를 갖지 않아야 하는 배제 제한이 행렬식 형태로 표현된다; 즉, Z와 Y 사이의 직접 효과를 나타내는 부분 행렬이 영 행렬이어야 한다.

이러한 행렬식 조건은 기존의 “조건부 독립성” 가정보다 훨씬 약한 형태이며, DAG 상에서 조건부 독립성이 드러나지 않더라도 변수 집합 Z가 충분히 풍부하면 식별이 가능함을 보인다. 논문은 GIV 식별 조건을 그래프 이론적 용어로도 해석한다. 예를 들어, Z가 X와 Y 사이의 모든 “백도어 경로”(back‑door paths)를 차단하고, 동시에 X에 대한 “프론트도어 경로”(front‑door paths)를 제공하는 경우 GIV가 존재한다는 것이다. 이는 Pearl의 도구변수와 프론트도어 기준을 일반화한 형태로, 복합적인 경로 구조에서도 식별 가능성을 확보한다.

또한, 저자는 GIV를 이용한 두 단계 최소제곱(2SLS) 추정량을 제시하고, 이 추정량이 일관성(consistency)과 무편향성(unbiasedness)을 유지함을 증명한다. 특히, 관측되지 않은 교란 변수(U)가 존재하더라도, GIV가 만족하는 경우 U와의 상관관계가 추정에 영향을 미치지 않는다. 이는 전통적인 IV가 요구하는 “완전 외생성”(perfect exogeneity)보다 완화된 가정이다.

마지막으로, 논문은 GIV의 적용 가능성을 보여주기 위해 시뮬레이션과 실제 데이터 사례를 제공한다. 시뮬레이션에서는 조건부 독립성이 거의 없지만 변수 집합 Z가 충분히 큰 경우 GIV가 정확한 인과 효과를 복원함을 확인한다. 실제 사례에서는 경제학에서 흔히 나타나는 “가격‑수요” 모델에 관측되지 않은 공급 충격을 포함시킨 뒤, 복수의 외생 변수 집합을 도구로 사용해 가격의 수요에 대한 직접 효과를 추정한다. 결과는 기존 IV 방법보다 낮은 편향과 더 작은 표준 오차를 보이며, GIV의 실용성을 입증한다.

이와 같이, 본 논문은 DAG와 선형 SEM을 기반으로 한 일반화된 도구변수 프레임워크를 제시함으로써, 조건부 독립성이 부족한 복잡한 인과 구조에서도 직접 효과를 식별하고 추정할 수 있는 새로운 방법론을 제공한다.