경쟁위험 상황에서의 심혈관 결과시험: Cox vs. Fine‑Gray 모델의 시뮬레이션 비교

읽는 시간: 9 분
...

📝 Abstract

Cardiovascular outcome trials commonly face competing risks when non-CV death prevents observation of major adverse cardiovascular events (MACE). While Cox proportional hazards models treat competing events as independent censoring, Fine-Gray subdistribution hazard models explicitly handle competing risks, targeting different estimands. This simulation study using bivariate copula models systematically varies competing event rates (0.5%-5% annually), treatment effects on competing events (50% reduction to 50% increase), and correlation structures to compare these approaches. At competing event rates typical of CV outcome trials (~1% annually), Cox and Fine-Gray produce nearly identical hazard ratio estimates regardless of correlation strength or treatment effect direction. Substantial divergence occurs only with high competing rates and directionally discordant treatment effects, though neither estimator provides unbiased estimates of true marginal hazard ratios under these conditions. In typical CV trial settings with low competing event rates, Cox models remain appropriate for primary analysis due to superior interpretability. Pre-specified Cox models should not be abandoned for competing risk methods. Importantly, Fine-Gray models do not constitute proper sensitivity analyses to Cox models per ICH E9(R1), as they target different estimands rather than testing assumptions. As supplementary analysis, cumulative incidence using Aalen-Johansen estimator can provide transparency about competing risk impact. Under high competing-risk scenarios, alternative approaches such as inverse probability of censoring weighting, multiple imputation, or inclusion of all-cause mortality in primary endpoints warrant consideration.

💡 Analysis

**

1. 연구 배경 및 필요성

  • 경쟁위험의 실무적 중요성

    • 비심혈관 사망이 MACE 관찰을 차단하면 “관찰되지 않은 사건”이 발생해 추정치에 편향을 초래할 수 있다.
    • NEJM 등 고위험 저널은 경쟁위험을 고려한 분석을 권고하지만, “얼마나 많은 비율이 될 때”가 명확히 제시되지 않아 연구자들이 혼란을 겪는다.
  • Cox vs. Fine‑Gray의 근본적 차이

    • Cox 모델은 조건부 위험비(hazard ratio, HR) → “이벤트가 아직 발생하지 않은 환자 집단”에 대한 치료 효과.
    • Fine‑Gray 모델은 서브디스트리뷰션 위험비(subdistribution HR, sHR) → “전체 코호트(경쟁 사건을 겪은 환자 포함)”에 대한 누적 발생률 차이.
    • 두 모델이 목표로 하는 estimand이 다르므로, 단순히 “대체” 관계로 보기 어렵다.

2. 시뮬레이션 설계 핵심 포인트

요소설정실무적 의미
사건 발생률 (λ₁, λ₂)λ₁ = 0.035/yr (MACE), λ₂ = 0.005–0.05/yr (비CV 사망)실제 CVOT에서 비CV 사망 비율은 약 1%/yr 수준
치료 효과 (θ₁, θ₂)θ₁ = 0.80 (20% 위험 감소), θ₂ = 0.5–1.5치료가 경쟁 사건에 미치는 영향(감소·중립·증가) 탐색
상관구조 (α → τ)τ = 0, 0.167, 0.333, 0.5공통 위험인자(연령·합병증 등)와 사건 간 연관성 반영
표본·추적기간n=500 (1:1 무작위), 추적 3–5년대규모 CVOT(수천 명)와 동일한 경향성을 보임(추가 시뮬레이션 결과 확인)
  • Copula 기반 데이터 생성: Gumbel‑Hougaard copula는 사건 간 양의 의존성을 자연스럽게 모델링하면서 각 사건의 마진은 지수분포를 유지한다. 이는 실제 임상 데이터에서 관찰되는 “공통 위험 요인”을 재현하는 데 적합하다.

3. 주요 결과 해석

  1. 대부분의 시나리오에서 Cox와 Fine‑Gray가 일치

    • 경쟁 사건 비율이 ≤1%/yr(실제 CVOT 평균)일 때 평균 절대 차이(|HR‑sHR|) < 0.02.
    • 이는 두 모델이 실질적인 차이를 만들지 않음을 의미한다. 따라서 기존에 널리 사용돼 온 Cox 모델을 그대로 유지해도 해석상의 손해가 거의 없다.
  2. 차이가 발생하는 조건

    • 경쟁 사건 비율 ≥2%/yr (고위험 환자군, 예: 중증 CKD·당뇨 복합군)
    • 치료가 경쟁 사건에 반대 방향 효과(θ₂ ≈ 1.5) → 비CV 사망이 증가하면서 MACE 위험이 감소하는 경우.
    • 강한 상관(τ≈0.5) → 두 사건이 동일 위험 요인에 크게 의존할 때 차이가 확대.
  3. 편향(bias) 문제

    • 경쟁 사건 비율이 높고 치료가 두 사건에 서로 다른 영향을 미칠 때, 두 모델 모두 주변 위험비(marginal HR)를 편향한다.
    • 이는 “전체 인구에 대한 진정한 치료 효과”를 추정하려면 IPCW, 다중보간, 혹은 구조적 모델링이 필요함을 시사한다.

4. 실무적 권고

상황권고 분석법이유
전형적인 CVOT (비CV 사망 ≤1%/yr)Cox 모델 (사전 계획대로)해석이 직관적이며, Fine‑Gray와 거의 동일한 추정치 제공
경쟁 사건 비율 2%~5%/yrFine‑Gray 보조 분석 + Aalen‑Johansen 누적 발생률누적 위험을 시각화해 경쟁 위험의 실질적 영향 파악
치료가 경쟁 사건에 반대 방향 효과IPCW, 다중보간, 혹은 전체 사망 포함 복합 종단점두 사건 모두를 동시에 고려해 편향 최소화
규제·라벨링 목적Cox 모델 (규제기관이 선호)기존 라벨링 및 허가 절차와 일관성 유지
민감도 분석Fine‑Gray는 동일한 추정값을 검증하는 것이 아니라 다른 estimand을 제공동일 데이터에 대한 두 estimand을 명시적으로 보고ICH E9(R1) 가이드라인에 부합하도록 “estimand‑strategy”를 명확히 기술

5. 한계 및 향후 연구 방향

  • 표본 규모: 본 시뮬레이션은 n=500을 기본으로 했지만, 실제 대규모 CVOT(수천 명)에서도 동일한 패턴이 관찰됨을 추가 실험으로 확인하였다. 다만, 극히 드문 사건(예: 연 0.1% 수준)에서는 추정 변동성이 커질 수 있다.
  • 시간‑변하는 위험비: 본 연구는 비례위험 가정을 유지했지만, 실제 임상에서는 치료 효과가 시간에 따라 변할 수 있다. 시간‑변하는 Fine‑Gray 모델이나 가변 효과 Cox 모델이 필요할 수 있다.
  • 다중 경쟁 사건: 비CV 사망 외에도 신장 사망, 암 사망 등 다중 경쟁 위험이 존재할 경우, 다중 상태 모델(multistate model) 혹은 복합 서브디스트리뷰션 모델이 더 적합할 수 있다.

6. 결론

  • 핵심 메시지: 경쟁 위험 비율이 낮은(≈1%/yr) 대부분의 심혈관 결과시험에서는 기존에 널리 사용되는 Cox 비례위험 모델이 충분히 타당하며, Fine‑Gray 모델은 별도의 estimand을 제공하는 보조 분석으로 활용하는 것이 바람직하다.
  • 전략적 접근: 연구 설계 단계에서 예상 경쟁 위험 비율을 사전 추정하고, 그에 따라 “Cox‑first, Fine‑Gray‑second” 전략을 채택한다. 고위험 상황에서는 보다 복합적인 방법론(IPCW, 다중보간, 전체 사망 포함)으로 전환한다.
  • 규제·보고 관점: ICH E9(R1) 프레임워크에 따라 estimand, estimator, sensitivity analysis를 명확히 구분해 보고하면, 편집자·심사자의 요구를 충족시키면서도 과학적 투명성을 확보할 수 있다.

📄 Content

심혈관 결과 시험(CVOT)에서 경쟁 위험에 대한 분석적 고려

심혈관 결과 시험(CVOT)은 일반적으로 주요 심혈관 사건(MACE‑3: 심혈관 사망, 비치명성 심근경색, 비치명성 뇌졸중)을 포함하는 복합 종단점을 평가한다. 환자가 1차 종단점에 도달하기 전에 비심혈관(Non‑CV) 사망으로 사망하면, 이러한 경쟁 사건은 1차 결과를 관찰할 수 없게 만들며, 경쟁 위험 시나리오를 초래한다. 대부분의 CVOT에서 비심혈관 사망은 주요 경쟁 위험으로 간주된다.

대부분 보고된 CVOT에서 표준 분석 방법은 Cox 비례 위험 모델(Cox, 1972)을 사용하며, 비심혈관 사망을 독립 검열(independent censoring)으로 취급한다. 최근 대규모 시험인 SELECT(Lincoff et al., 2023)와 FLOW(Perkovic et al., 2024)에서도 이러한 접근법이 적용되었다. 그러나 경쟁 사건이 1차 종단점과 정보적으로 연관되어 있을 경우—예를 들어, 심혈관 사망과 비심혈관 사망이 연령, 동반질환 부담, 질병 중증도와 같은 공통 위험인자를 공유할 때—독립 검열 가정은 부적절할 수 있다.

고위 저널, 특히 New England Journal of Medicine(NEJM) 의 편집자와 리뷰어는 CVOT에서 경쟁 위험 처리 방식을 점점 더 면밀히 검토하고 있다. NEJM의 통계 보고 지침은 “주요 결과 발생을 방해하는 경쟁 사건이 상당히 많이 발생할 경우, Fine‑Gray 모델과 같은 대안적 분석 방법을 고려할 수 있다”(NEJM, 2022)고 명시한다. 지침은 경쟁 사건에 의한 검열이 정보적일 수 있음을 평가하도록 강조하지만, 다음과 같은 핵심 질문은 남아 있다.

  • “‘상당히 많은’ 경쟁 사건이란 어느 정도 비율을 의미하는가?”
  • “Cox 모델과 Fine‑Gray 모델 중 어느 것을 선택해야 하는가? 선택이 시험 결론에 미치는 영향은 어느 정도인가?”
  • “경쟁 사건과 1차 사건 사이의 의존성이 결과에 어떤 영향을 주는가?”
  • “Fine‑Gray 모델이 경쟁 위험을 다루는 최선의 모델인가?”

NEJM 지침은 이러한 결정에 대한 정량적 기준을 제공하지 않으며, 연구자들은 경쟁 위험 방법이 실제로 가치를 더하는 시점과 불필요한 복잡성을 초래하는 시점을 판단하기 어렵다.


1. 경쟁 위험 분석 방법의 두 가지 접근법

경쟁 사건이 존재할 때 흔히 사용되는 두 가지 분석 접근법은 **근본적으로 다른 추정량(estimand)**을 목표로 한다. 아래 표 1은 Cox 비례 위험 모델과 Fine‑Gray 부분위험(subdistribution hazard) 모델 사이의 주요 차이점을 요약한다.

구분Cox 비례 위험 모델Fine‑Gray 부분위험 모델
경쟁 사건 처리독립 검열로 간주가중치를 부여해 부분위험에 포함
가정사건특이 위험이 비례, 경쟁 사건에 의한 검열은 독립사건특이 위험이 비례, 경쟁 사건을 부분위험에 포함
추정량1차 사건이 아직 발생하지 않은 사람들 중 즉시 위험률1차 사건이 발생하거나 경쟁 사건을 겪은 사람들을 포함한 부분위험률
해석“이벤트가 아직 발생하지 않은 환자들 중, 치료가 1차 사건 발생률에 미치는 영향”“전체 집단(이벤트 미발생 + 경쟁 사건 발생 포함)에서 1차 사건 발생률에 대한 치료 효과”
임상적 직관직관적이며 치료 메커니즘과 자연스럽게 연결부분위험 자체는 임상적으로 해석하기 어려움(다수 논문에서 지적)

Cox 비례 위험 모델

Cox 모델은 CVOT에서 가장 널리 사용되는 방법으로, 경쟁 사건을 검열된 관측치로 취급한다. 이 모델은 1차 CV 사건이 아직 발생하지 않은 환자들 사이에서 순간 위험(위험률)을 추정한다. 위험비(HR)는 “아직 사건이 없고, 경쟁 사건도 겪지 않은 환자들”을 기준으로 치료가 1차 사건 발생률에 미치는 영향을 나타낸다. 해석은 “이벤트가 아직 발생하지 않은 환자들 중, 치료가 1차 CV 사건 발생률에 어떤 영향을 미치는가?”라는 질문에 직접 답한다.

예시: SOUL 시험에서 Cox 분석을 통해 MACE‑3에 대한 위험비가 0.86(95 % CI 0.77‑0.96)으로 보고되었으며, 비심혈관 사망은 연간 환자당 약 1.4건으로 관찰되었다(McGuire et al., 2025).

Fine‑Gray 부분위험 모델

Fine‑Gray 모델은 경쟁 위험을 명시적으로 다루기 위해 제안된 방법이다. 이 모델은 **부분위험(subdistribution hazard)**을 추정하며, 이는 누적 발생률(cumulative incidence function)과 직접 연결된다. 부분위험비(sHR)는 “위험이 아직 발생하지 않았거나 경쟁 사건을 겪은 환자들을 포함한 전체 집단”에서 1차 사건이 발생할 순간 위험을 나타낸다. 부분위험 자체는 임상적 해석이 어려운 반면, 누적 발생률에 대한 치료 효과를 직접 제공한다(다수 연구에서 언급됨: Austin & Fine, 2017; Austin et al., 2021; Armbruster et al., 2024; Gregson et al., 2024).

예시: FIGARO‑DKD 시험에서 finerenone의 1차 복합 CV 결과에 대한 Cox 위험비는 0.87(95 % CI 0.76‑0.98)이며, Fine‑Gray 분석에서도 동일하게 0.87(95 % CI 0.77‑0.98)으로 나타났다(Pitt et al., 2021). FDA 라벨은 Cox 결과만을 포함하고 있어, 경쟁 사건 비율이 낮을 때는 Cox 모델이 규제당국에 의해 주된 분석법으로 받아들여진다.


2. 경쟁 위험 상황에서 추정량의 일관성 문제

경쟁 위험이 존재하고 치료가 두 사건 유형 모두에 영향을 미칠 경우, **Cox 모델도 Fine‑Gray 모델도 전체 모집단에 대한 ‘마진 위험비(marginal hazard ratio)’**를 일관되게 추정하지 못한다는 점이 종종 간과된다. 방대한 방법론 문헌이 존재하지만, 실제 CVOT에서 어느 상황에서 두 모델의 선택이 시험 결론에 실질적인 영향을 미치는지는 명확히 제시되지 않는다. 또한, 두 추정량이 모두 마진 위험비를 회복하지 못하는 조건을 이해하는 것은 방법 선택에 중요한 함의를 가진다.

본 시뮬레이션 연구는 이러한 격차를 메우고자, CVOT에 현실적으로 적용 가능한 파라미터 범위를 기반으로 Cox 비례 위험 모델과 Fine‑Gray 부분위험 모델을 체계적으로 비교한다.

연구 목표

  1. 현실적인 시나리오에서 Cox와 Fine‑Gray 추정치 간 차이를 정량화한다.
  2. 모델 선택이 시험 해석에 실질적인 영향을 미치는 파라미터 임계값을 규명한다.
  3. 두 추정량 모두 마진 위험비를 일관되게 회복하지 못하는 상황을 규명한다.
  4. CVOT에서 분석 방법 선택을 위한 근거 기반 가이드라인을 제공한다.

3. 시뮬레이션 설계

3.1 데이터 생성 메커니즘

  • 공동분포: 1차 사건 시간 (T_1) (MACE‑3)와 경쟁 사건 시간 (T_2) (비심혈관 사망)를 Gumbel‑Hougaard copula를 이용해 상관관계를 부여한다. 이는 지수형 주변분포를 유지하면서 두 사건 간 의존성을 자유롭게 조정할 수 있다.
  • 모델식: 치료 할당 (Z) (1 = 치료, 0 = 대조) 하에 공동생존함수는

[ S(t_1,t_2|Z)=\exp!\Big{-\big[\lambda_1\theta_1^{Z}t_1\big]^{\alpha} -\big[\lambda_2\theta_2^{Z}t_2\big]^{\alpha}\Big}^{1/\alpha} ]

여기서 (\lambda_1,\lambda_2)는 기본 사건율, (\theta_1,\theta_2)는 각각 1차 사건과 경쟁 사건에 대한 치료 위험비, (\alpha)는 copula 의존 파라미터(켄달 τ와 관계: (\tau=1-1/\alpha))이다.

3.2 시뮬레이션 절차

  1. 무작위 배정: 각 환자에 대해 (Z_i\sim\text{Bernoulli}(0.5)).
  2. 공동 균등 변수 생성: Gumbel‑Hougaard copula를 이용해 ((U_{1i},U_{2i})) 생성 (R 패키지 gumbel 사용).
  3. 사건 시간 변환: (T_{1i}= -\log(U_{1i})/(\lambda_1\theta_1^{Z_i})), (T_{2i}= -\log(U_{2i})/(\lambda_2\theta_2^{Z_i})).
  4. 행정 검열: (C_i\sim\text{Uniform}(3,5))년(2년 입원 기간 + 최대 5년 추적).
  5. 관측값 결정:
    • ( \tilde{T}i = \min(T{1i},T_{2i},C_i) )
    • 사건 유형: 1 = MACE‑3, 2 = 비심혈관 사망, 0 = 검열.

각 시나리오마다 500명(1:1 비율) 환자를 2,000번 반복한다. 대규모(10,000명) 시뮬레이션에서도 동일한 패턴이 관찰되었으며, 계산 효율성을 위해 500명을 기본으로 설정하였다.

3.3 파라미터 설정

파라미터값(범위)의미
(\lambda_1)0.035 / 년연간 MACE‑3 발생률 3.5%
(\theta_1)0.80치료가 1차 사건 위험을 20% 감소
(\alpha) (의존도)1.0, 1.2, 1.5, 2.0τ = 0, 0.167, 0.333, 0.5 (독립→강한 상관)
(\lambda_2)0.005 ~ 0.05 / 년연간 비심혈관 사망률 0.5% ~ 5%
(\theta_2)0.5, 0.7, 0.9, 1.0, 1.

이 글은 AI가 자동 번역 및 요약한 내용입니다.

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키