근접성 강화 균형으로 보는 치료 효과 추정
초록
관측 데이터에서 이질적 치료 효과(HTE)를 추정할 때 발생하는 치료 선택 편향을 완화하기 위해, 저자들은 지역 근접성을 활용한 최적 수송 기반 정규화와 차원 축소를 결합한 CFR‑Pro 모델을 제안한다. 쌍별 근접성 정규화(PPR)와 정보 서브스페이스 투사(ISP)를 통해 전역 정렬만을 목표로 하는 기존 방법들의 한계를 극복하고, 실험에서 경쟁 모델들을 크게 앞선 성능을 보였다.
상세 분석
본 논문은 관측 데이터에서 HTE(이질적 치료 효과) 추정 시 가장 큰 장애물인 치료 선택 편향을 두 가지 관점에서 접근한다. 첫 번째는 “지역 근접성”이다. 기존의 CFR( Counterfactual Regression) 계열 방법들은 치료군과 대조군의 분포 차이를 최소화하기 위해 전역적인 OT(Optimal Transport) 혹은 Wasserstein 거리만을 사용한다. 그러나 실제 데이터에서는 비슷한 특성을 가진 개체들이 비슷한 결과를 보이는 경향이 강하며, 이런 근접성을 무시하면 매칭이 비효율적이고 학습 신호가 왜곡된다. 저자들은 이를 보완하기 위해 Gromov‑Wasserstein 개념을 차용한 쌍별 근접성 정규화(PPR)를 설계한다. PPR은 전역 비용 ⟨π,D⟩에 가중치 κ를 두고, 각 군 내부의 거리 구조 차이 ‖D⁰_{ik}−D¹_{jl}‖²를 추가 비용으로 포함한다. 이로써 동일 군 내에서 비슷한 이웃을 가진 샘플들이 서로 매칭될 확률이 높아지고, 근접성을 유지한 균형이 이루어진다.
두 번째는 “차원의 저주” 문제이다. 고차원 표현 공간에서는 거리 추정이 불안정하고, 충분한 샘플이 없을 경우 OT 비용 자체가 편향될 위험이 있다. 이를 해결하기 위해 저자들은 정보 서브스페이스 투사(ISP)를 도입한다. ISP는 원본 표현 ψ(X)를 선형 혹은 비선형 사전 학습된 매핑 𝑈에 투사하여, 차원 d’≪d인 서브스페이스 R’ = 𝑈ᵀψ(X) 를 만든다. 이 서브스페이스는 치료 효과와 가장 높은 상관성을 보이는 특징만을 보존하도록 학습되며, 거리 계산의 정밀도 손실을 최소한의 샘플 복잡도 증가로 교환한다. ISP와 PPR을 동시에 적용함으로써, 저차원에서도 근접성을 정확히 측정하고, 전역·국부 정렬을 동시에 달성한다.
학습 목표는 세 부분으로 구성된다. (1) 사실적 결과 예측 손실 L_F(ψ,ϕ) – 치료군·대조군 각각에 대해 별도 outcome 네트워크 ϕ₁,ϕ₀를 학습한다. (2) OT 기반 불균형 정규화 L_OT = Disc_R’(R_T=1,R_T=0) + λ·PPR, 여기서 λ는 근접성 정규화 강도를 조절한다. (3) ISP 손실 L_ISP는 서브스페이스가 정보량을 유지하도록 하는 정규화(예: 최대 분산 혹은 교차 엔트로피)이다. 전체 목적함수는 L = L_F + α·L_OT + β·L_ISP 로 최적화된다.
실험에서는 IHDP, Twins, Jobs 등 공개 베이스라인을 사용해 PEHE와 ATE 오차를 평가하였다. CFR‑Pro는 기존 CFR, ESCFR, SITE 등을 크게 앞서며, 특히 고차원 특성을 가진 Jobs 데이터셋에서 차원 축소 효과가 두드러졌다. 민감도 분석에서는 κ와 λ, 서브스페이스 차원 d’에 대한 튜닝이 성능에 미치는 영향을 상세히 보여주었으며, PPR 없이 ISP만 사용하거나 그 반대인 경우 모두 성능 저하가 관찰되었다.
이러한 설계는 근접성을 유지하면서도 샘플 효율성을 높이는 두 축을 동시에 만족시키며, HTE 추정에 있어 “전역 정렬 + 지역 근접성”이라는 새로운 패러다임을 제시한다는 점에서 학술적·실무적 의의가 크다.
댓글 및 학술 토론
Loading comments...
의견 남기기