학습된 표현으로 반사실 추론 구현

관찰 데이터에서 인과 효과를 추정하기 위해, 저자들은 도메인 적응과 표현 학습을 결합한 새로운 프레임워크를 제안한다. 입력을 저차원 표현으로 변환하고, 치료군과 대조군의 분포 차이를 최소화하는 불균형 패널티를 추가함으로써, 사실(factual) 데이터로 학습한 모델이 반사실(counterfactual) 상황에서도 높은 예측 정확도를 보이게 만든다. 선형 가중치 선택 방식과 깊은 신경망 기반 방식 두 가지 구현을 제시하고, 이론적 상한과 실험을 …

저자: Fredrik D. Johansson, Uri Shalit, David Sontag

본 논문은 관찰 연구에서 인과 관계를 추정하는 핵심 문제인 반사실 추론을 다루며, 기존의 직접 모델링 접근법이 사실(factual) 데이터와 반사실(counterfactual) 데이터 간 분포 차이로 인해 일반화 오류가 크게 발생한다는 점을 지적한다. 이를 해결하기 위해 저자들은 반사실 추론을 ‘공변량 이동(covariate shift)’ 문제로 재정의하고, 도메인 적응에서 사용되는 불균형(discrepancy) 거리 개념을 도입한다. 문제 설정은 이진 치료(t∈{0,1})를 가정하고, 각 컨텍스트 x에 대해 잠재적 결과 Y₀(x), Y₁(x) 를 정의한다. 관찰된 데이터는 (xᵢ, tᵢ, yᵢ^F) 형태이며, 여기서 yᵢ^F = tᵢ·Y₁(xᵢ)+(1−tᵢ)·Y₀(xᵢ)이다. 반사실 예측을 위해서는 동일한 x에 대해 반대 치료 1−tᵢ에 대한 결과를 추정해야 하는데, 이는 사실 데이터와 반사실 데이터가 서로 다른 치료 할당 메커니즘 P(t|x) 에 의해 생성되므로 분포가 다를 수 있다. 저자들은 입력 x를 저차원 표현 Φ(x) 로 매핑하고, 이를 기반으로 h(

학습된 표현으로 반사실 추론 구현

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기