공변량 불일치 상황에서 이중 보정 기반 RCT‑OS 이질효과 추정법

본 논문은 무작위 임상시험(RCT)과 관찰연구(OS) 간에 일부 공변량이 서로 다를 때, 두 데이터를 결합해 조건부 평균 치료효과(CATE)를 보다 정밀하게 추정하는 방법을 제안한다. 기존 R‑OSCAR를 확장한 MR‑OSCAR는 (1) 관찰연구에서 공유 공변량을 이용해 시험에 없는 변수들을 예측·보간하고, (2) 보간된 변수와 시험 전용 변수를 포함한 예측 모델을 RCT 데이터에 맞춰 보정한다. 이중 보정 과정을 통해 무작위 대비는 그대로 유…

저자: Samhita Pal, Jared D. Huling, Amir Asiaee

1. **연구 배경 및 문제 정의** - 이질 치료 효과(CATE)는 정밀 의료·예방에 핵심이지만, 무작위 임상시험(RCT)은 표본이 작아 이질성을 탐지하기 어려운 경우가 많다. 반면 관찰연구(Observational Study, OS)는 대규모이며 풍부한 공변량을 제공하지만, 비무작위 설계로 인한 교란이 존재한다. - 기존 데이터 융합 방법은 두 데이터셋이 동일한 공변량을 가정한다. 실제 임상·역학 연구에서는 RCT와 OS가 서로 다른 변수 집합을 수집하는 ‘공변량 불일치(covariate mismatch)’가 흔히 발생한다. 이 경우, 직접적인 가중치 보정이나 회귀 결합은 핵심 효과 조절 변수를 놓쳐 편향을 초래한다. 2. **방법론적 기여: MR‑OSCAR** - **공변량 분할**: 전체 변수 X를 RCT‑only(U), 공유(Z), OS‑only(V)로 구분한다. - **Assumption 1 (RCT 내부 타당성)**: SUTVA, 무작위화 독립성, 양쪽 치료군에 대한 최소 확률 보장. - **Assumption 2 (전이 가능성)**: V|Z의 조건부 분포가 RCT와 OS에서 동일하고, RCT 내에서는 U⊥V|Z. 이는 V를 Z만으로 예측해도 편향을 유발하지 않음을 의미한다. - **1단계 – 보간(Imputation)**: OS에서 ĝ: Z→V 를 학습하고, RCT에 Z를 입력해 V̂=ĝ(Z) 를 생성한다. - **2단계 – 보정(Calibration)**: OS에서 전체 변수 (U, Z, V̂) 로 각 치료군별 결과 모델 μ̂_o,a 를 학습한다. 이후 RCT 데이터에 대해 μ̂_o,a 를 적용하고, 실제 RCT 결과와의 차이를 불일치 함수 δ_a(Z,U) 로 추정한다. 이는 OS‑derived 예측을 RCT에 맞추는 역할을 한다. - **CMO와 pseudo‑outcome**: 보정된 CMO μ̂_r(x_r)=∑_{a}π_{r,−a}(x_r)·μ̂_r,a(x_r) 를 사용해 pseudo‑outcome τ̂_m = A·

공변량 불일치 상황에서 이중 보정 기반 RCT‑OS 이질효과 추정법

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기