공변량 보정으로 강화된 윌콕슨 두 표본 검정: 효율성·범용성 모두 잡는다!
📝 Abstract
We apply covariate adjustment to the Wincoxon two sample statistic and Wincoxon-Mann-Whitney test in comparing two treatments. The covariate adjustment through calibration not only improves efficiency in estimation/inference but also widens the application scope of the Wilcoxon two sample statistic and Wincoxon-Mann-Whitney test to situations where covariate-adaptive randomization is used. We motivate how to adjust covariates to reduce variance, establish the asymptotic distribution of adjusted Wincoxon two sample statistic, and provide explicitly the guaranteed efficiency gain. The asymptotic distribution of adjusted Wincoxon two sample statistic is invariant to all commonly used covariate-adaptive randomization schemes so that a unified formula can be used in inference regardless of which covariate-adaptive randomization is applied.
💡 Analysis
**
1. 연구 배경 및 필요성
- 비모수 검정의 한계: 전통적인 윌콕슨‑Mann‑Whitney 검정은 공변량 정보를 전혀 활용하지 않으며, 특히 공변량‑적응 랜덤화가 적용된 임상시험에서는 기존 asymptotic 결과가 적용되지 않는다.
- 규제기관 권고: ICH‑E9, EMA, FDA 등은 “가능한 최소 가정 하에 공변량을 활용하라”는 입장을 명시하고 있어, 모델‑프리 보정에 대한 요구가 높다.
2. 핵심 아이디어
- 공변량 보정식
\
📄 Content
한국어 번역 (2000자 이상)
n개의 단위(예: 환자)로 구성된 무작위 표본을 고려한다. 각 단위는 정확히 하나의 처리 (j)에 할당되며, 그 결과는 알려지지 않은 연속분포 (F_{j})를 따르는 결과 (Y_{j})를 만든다 ((j=1,\dots ,J,;J\ge 2)). 예를 들어, (J)개의 의약품 효과를 조사하는 임상시험에서 단위는 보통 환자이다. 가장 간단한 처리 할당 방법은 단순 무작위화(simple randomization) 로, 사전에 정해진 확률 (\pi {j}>0;( \sum{j=1}^{J}\pi _{j}=1))에 따라 (n)개의 단위를 무작위로 할당한다.
(A\in{1,\dots ,J})를 처리 할당 변수라 하고, 표본의 (i)번째 단위에 대한 할당을 (A_{i})라 하자 ((i=1,\dots ,n)). (A_{i}=j)이면 단위 (i)는 처리 (j)에 할당되고, 관측된 결과는
[ Y_{iA_{i}}=Y_{ij}\sim Y_{j} ]
라 표기한다. (Y_{iA_{i}};(i=1,\dots ,n))을 이용해 미지의 분포 (F_{1},\dots ,F_{J})의 특성을 추정·추론할 수 있다.
두 고정 처리 (j)와 (k)를 비교할 때, Wilcoxon‑Mann‑Whitney 순위합 검정(Lehmann, 1975, pp. 5‑9)은 두 표본 t‑검정에 대한 비모수적 대안으로 널리 사용된다. 특히 결과 (Y_{j}) 혹은 (Y_{k})가 정규분포가 아니거나 분산이 크게 차이날 경우 t‑검정이 비판받는다. Wilcoxon‑Mann‑Whitney 검정 통계량은
[ U_{jk}= \frac{1}{n_{j}n_{k}}\sum_{i:A_{i}=j}\sum_{i’:A_{i’}=k} I!\left(Y_{ij}\le Y_{i’k}\right) \tag{1} ]
으로 정의된다. 여기서 (I(\cdot))는 사건의 지시함수, (n_{t})는 (A_{i}=t)인 단위 수((t=j,k))이다. (1)의 (U_{jk})는 Wilcoxon 두 표본 통계량(Serfling, 1980, p. 175)이라 불리며, 치료 효과 (\theta_{jk}=E(U_{jk})=P(Y_{j}\le Y_{k}))를 추정하는 두 표본 U‑통계량의 특수 경우이다. 귀무가설 (H_{0}:F_{j}=F_{k}) (즉, 두 처리군 모집단이 동일) 하에서는 (\theta_{jk}=1/2)가 되므로, (U_{jk})가 1/2에서 크게 벗어날 때 (H_{0})를 기각한다. 자세한 내용은 §3.1에 있다.
많은 연구에서 결과와 관련된 공변량(covariate) 정보가 존재한다. 임상시험에서는 환자의 연령, 성별, 지역, 직업, 교육 수준, 질병 단계 등 치료와 무관한 기저 공변량이 흔히 수집된다. 이러한 공변량을 활용해 추정·추론 효율을 높이는 것을 공변량 조정(covariate adjustment) 이라 한다.
하지만 (1)의 Wilcoxon 두 표본 통계량은 공변량을 전혀 사용하지 않는다. 따라서 공변량 조정을 통해 개선될 여지가 있다. 만약 결과와 공변량 사이의 올바른 모델을 지정할 수 있다면, 모델 적합을 통해 (U_{jk})를 개선할 수 있다. 그러나 모델 기반 접근법은 모델이 올바르게 지정되었다는 가정에 크게 의존한다. 실제 적용에서는 올바른 모델을 찾기 어려운 경우가 많아, 모델‑프리(model‑free) 공변량 조정 방법에 대한 관심이 최근 증가하고 있다. 규제 기관(ICH E9, 1998; EMA, 2015; FDA, 2021)도 “조정되지 않은 추정에 필요한 최소 통계 가정과 거의 동일한 가정 하에” 공변량을 활용할 것을 권고한다.
Wilcoxon 두 표본 통계량 (U_{jk})의 일관성(consistency)과 점근 정규성(asymptotic normality)은 단순 무작위화와 (n\to\infty)만을 가정하면 성립한다(Jiang, 2010).
본 논문의 목적은 모델‑프리 공변량 보정(covariate calibration) 을 이용해 (1)의 (U_{jk})와 관련 Wilcoxon‑Mann‑Whitney 검정을 개선하는 것이다. 공변량 보정은 Cassel et al. (1976)에서 설문 조사 문제에 처음 제안되었으며, Särndal et al. (2003)에서 체계적으로 정리되었다. 이 방법은 표본 평균 함수나 일반화 추정 방정식(Generalized Estimating Equations) 기반 추정량의 효율성을 크게 높이는 것으로 알려져 있다(다수 연구 참고).
우리의 공변량 조정은 (U_{jk})와 조정된 공변량 사이의 공분산을 직접 이용하며 어떠한 가정도 필요하지 않는다. 이는 조정되지 않은 (U_{jk})보다 점근적으로 효율이 높음을 보장하고, 단순 무작위화뿐 아니라 모든 일반적인 공변량‑적응 무작위화(covariate‑adaptive randomization) 스키마(섹션 2.1)에서도 동일하게 적용된다. 또한 처리 종류가 두 개를 초과할 때((J>2))에도 추가 효율을 제공한다.
2.2 공변량 보정식 도출
처리 할당을 위한 기호와 무작위화 방식을 소개한 뒤, (1)의 (U_{jk})에 대한 공변량 보정식을 다음과 같이 정의한다.
[ U_{jk}^{\text{adj}} = U_{jk} + \beta_{j}^{\top}(X_{j}-X) + \beta_{k}^{\top}(X_{k}-X), \tag{2} ]
여기서
- (X)는 공변량 벡터, (X_{i})는 (i)번째 단위의 공변량 값,
- (X_{t};(t=j,k))는 처리군 (t)에 속한 단위들의 공변량 평균,
- (X)는 전체 표본의 공변량 평균,
- (\beta_{j},\beta_{k})는 비임의(non‑random) 벡터로, 분산을 최소화하도록 선택한다(후에 추정).
식 (2)는 “(U_{jk})에 0의 추정량을 더한다”는 의미이며, 이는 공변량을 이용해 (U_{jk})를 보정한다는 점에서 **공변량 보정(calibration)**이라 부른다.
최적 (\beta) 선택
단순 무작위화 하에서 (\operatorname{Var}(U_{jk}^{\text{adj}}))를 계산하면
[ \operatorname{Var}(U_{jk}^{\text{adj}}) = \operatorname{Var}(U_{jk}) -2,\beta_{j}^{\top}C_{jk} -2,\beta_{k}^{\top}C_{kj} +\beta_{j}^{\top}\Sigma\beta_{j} +\beta_{k}^{\top}\Sigma\beta_{k}, \tag{3} ]
where
- (\Sigma=\operatorname{Var}(X)) (정규성 가정 없이 유한하고 비특이),
- (C_{jk}= \operatorname{Cov}(U_{jk},X_{j})), (C_{kj}= \operatorname{Cov}(U_{jk},X_{k})).
위 식을 (\beta_{j},\beta_{k})에 대해 최소화하면
[ \beta_{j}^{}= \Sigma^{-1}C_{jk}, \qquad \beta_{k}^{}= \Sigma^{-1}C_{kj}, \tag{4} ]
가 최적값임을 알 수 있다. 이때
[ \operatorname{Var}(U_{jk}^{\text{adj}}) = \operatorname{Var}(U_{jk}) - C_{jk}^{\top}\Sigma^{-1}C_{jk} - C_{kj}^{\top}\Sigma^{-1}C_{kj} \le \operatorname{Var}(U_{jk}), ]
이며 등호는 (C_{jk}=C_{kj}=0) (즉, (U_{jk})와 공변량이 전혀 상관없을 때)만 성립한다.
다중 처리 경우((J>2))
두 처리만 비교하더라도, 제안된 보정은 모든 (J)개의 처리군에 속한 공변량을 사용한다. 만약 (j)와 (k)군에 속한 공변량만 사용한다면,
[ U_{jk}^{\text{adj*}} = U_{jk} + \beta_{jk}^{\top}(X_{jk}-X), \tag{5} ]
와 같이 표현될 수 있다(여기서 (X_{jk})는 (j)와 (k)군의 공변량 평균). 그러나 (4)에서 얻은 (\beta)를 전체 공변량으로 구성한 경우가 더 작은 분산을 제공한다. 이는 (\pi_{k}/(\pi_{j}+\pi_{k})<1-\pi_{j})인 경우((J>2))에 해당한다.
(\beta)의 추정
실제 적용에서는 (\Sigma, C_{jk}, C_{kj})를 표본 기반으로 추정한다.
- (\hat{\Sigma}) = 전체 표본 공변량 공분산 행렬,
- (\hat{C}{jk}= \widehat{\operatorname{Cov}}(U{jk},X_{j})),
- (\hat{C}{kj}= \widehat{\operatorname{Cov}}(U{jk},X_{k})).
그 결과
[ \hat{\beta}{j}= \hat{\Sigma}^{-1}\hat{C}{jk}, \qquad \hat{\beta}{k}= \hat{\Sigma}^{-1}\hat{C}{kj}, ]
를 사용해 최종 보정 통계량을
[ U_{jk}^{C}= U_{jk} + \hat{\beta}{j}^{\top}(X{j}-X) + \hat{\beta}{k}^{\top}(X{k}-X) \tag{6} ]
로 정의한다. 일관성(consistency) 때문에 (n)이 충분히 크면 (\operatorname{Var}(U_{jk}^{C})\le\operatorname{Var
이 글은 AI가 자동 번역 및 요약한 내용입니다.