생존 분석에서 단일·다중 분위수 비교를 위한 임상시험 설계
초록
본 논문은 Kosorok(1999)의 분위수 동등성 검정을 기반으로, 오른쪽 검열된 데이터에서 단일 및 다중 분위수를 비교하기 위한 새로운 검정력 공식과 표본 크기 계산식을 제시한다. 검정 통계량의 분산 추정에 필요한 생존 시간 밀도는 기존 커널 추정 대신 재표본화(resampling) 방법으로 추정한다. 이론적 결과를 시뮬레이션으로 검증하고, 비비례 위험을 보이는 실제 임상시험 데이터에 적용하여 실용성을 입증한다.
상세 분석
이 연구는 두 치료군 간의 특정 분위수(p‑quantile) 차이를 검정하기 위해 Kosorok이 제시한 비모수 검정의 asymptotic 특성을 활용한다. 단일 분위수 검정에서는 (\sqrt{n}(\hat F^{-1}1(p)-\hat F^{-1}2(p))) 가 평균 0, 분산 (\sigma^2)인 정규분포에 수렴함을 보이고, (\sigma^2)는 각 군의 생존함수 (S_k), 누적위험 (\Lambda_k), 그리고 해당 분위수에서의 밀도 (f_k)에 의해 결정된다. 검정통계량 (T_n)는 (\hat\sigma) 로 표준화된 형태이며, 귀무가설 하에서 표준정규, 대립가설 하에서는 평균 (\sqrt{n}\Delta/\hat\sigma)인 정규분포를 따른다. 이를 이용해 검정력 근사식 (1-\beta\approx 1-\Phi(q{1-\alpha/2}-\sqrt{n}\Delta/\hat\sigma)+\Phi(-q{1-\alpha/2}-\sqrt{n}\Delta/\hat\sigma)) 를 도출한다.
다중 분위수( J 개) 검정에서는 벡터 (\mathbf{Z}n=\sqrt{n}(\hat{\mathbf{F}}^{-1}1-\hat{\mathbf{F}}^{-1}2)) 가 공분산 행렬 (\Psi=\Upsilon{F1}+\Upsilon{F2}) 를 갖는 다변량 정규분포에 수렴한다. 여기서 (\Upsilon{Fk}) 의 원소는 개별 분위수와 교차 분위수 간의 공분산을 포함하며, ((1-p_j)(1-p_l)) 와 누적위험, 검열분포에 의존한다. 검정통계량 (T_n=\mathbf{Z}_n^\top\hat\Psi^{-1}\mathbf{Z}_n) 는 귀무가설에서 (\chi^2_J) 분포, 대립가설에서는 평균이 (\Psi^{-1/2}\xi) ( (\xi=\sqrt{n}\Delta) 벡터)인 비중심 chi‑square 분포에 근사한다. 따라서 검정력은 비중심 chi‑square 누적분포함수로 표현된다.
핵심 기술적 기여는 두 가지이다. 첫째, 위와 같은 검정력 및 최소표본크기 공식들을 명시적으로 도출함으로써, 기존 Kosorok 검정이 설계 단계에서 활용되지 못했던 문제를 해결한다. 둘째, 분산 추정에 필요한 밀도 (f_k(F^{-1}_k(p))) 를 커널 추정 대신 재표본화 방법으로 추정한다. 이 방법은 Gaussian 잡음을 이용해 중심화된 변수들을 생성하고, 최소제곱으로 해당 점에서의 밀도만을 직접 추정한다. 시뮬레이션 결과, 재표본화 방식이 MSE 면에서 커널 방식보다 우수함을 보였다.
시뮬레이션에서는 지수분포와 조각별 지수분포(비비례 위험) 두 시나리오를 사용해 검정력 곡선을 비교하였다. 특히, 비비례 위험 상황에서 기존 위험비 검정이 힘을 잃는 반면, 분위수 기반 검정은 원하는 효과 크기(시간 차)와 검정력 사이의 관계를 명확히 제공한다. 실제 적용 예시로는 면역항암제 임상시험(OAK) 데이터를 이용해 중위수와 75번째 분위수를 동시에 검정했으며, 비비례 위험에도 불구하고 유의한 차이를 발견하였다.
전반적으로 이 논문은 검정력 공식화, 표본 크기 산정, 그리고 실용적인 밀도 추정 방법을 통합함으로써, 오른쪽 검열 데이터에서 분위수 차이를 활용한 임상시험 설계와 분석을 위한 완전한 도구키트를 제공한다.
댓글 및 학술 토론
Loading comments...
의견 남기기