간격 검열 질병 데이터를 이용한 질병‑사망 모델의 판별력 평가
초록
본 연구는 간격 검열된 질병 발생 시점을 가진 Illness‑Death 모델에서 시간별 AUC(incident/dynamic, cumulative/dynamic)를 평가할 때, 간격 검열을 무시하면 판별력이 과대·과소 평가될 수 있음을 시뮬레이션과 실제 소프트 조직 육종 데이터로 입증한다.
상세 분석
Illness‑Death 모델은 0(무질병), 1(질병), 2(사망) 세 상태로 구성되며, 전이 강도 λ₀₁(t), λ₀₂(t), λ₁₂(t) 로 표현된다. 질병 발생 시점이 정확히 관찰되지 않고 사전 정의된 추적 방문 사이에 발생하면, 해당 시점은 간격 검열(interval‑censoring) 형태가 된다. 기존 연구에서는 이러한 검열을 무시하면 회귀계수·기저위험도·생존율이 편향된다는 점을 강조했지만, 판별성(Discrimination) 평가에 미치는 영향은 충분히 탐구되지 않았다.
본 논문은 두 가지 AUC 정의—incident/dynamic와 cumulative/dynamic—를 Illness‑Death 모델에 확장하였다. incident/dynamic AUC는 특정 시점 s에서 아직 질병이 없고 살아 있는 대상 중, 시점 t(>s)까지 질병이 발생할 확률을 이진 마커 X(t) 로 두고 ROC 곡선을 그린다. cumulative/dynamic AUC는 시점 s부터 t까지 질병이 한 번이라도 발생했는지를 마커로 사용한다. 간격 검열을 고려하지 않은 Cox 모델은 X(t)를 진단 시점으로 고정하고, λ₀₁(t) 전이를 모델링하지 않으므로 전이 확률을 정확히 추정하지 못한다. 반면, msm 패키지의 piecewise‑constant, SmoothHazard 패키지의 Weibull 및 M‑spline 구현은 전이 강도를 시간에 따라 명시적으로 모델링하고, 관찰된 상태 구간을 이용해 전체 가능도(likelihood)를 계산한다.
시뮬레이션에서는 Weibull 형태의 전이 강도(α, k)와 일정 간격(예: 6개월) 검열을 가정하고, 1,000명 규모의 데이터셋을 1,000번 반복했다. 결과는 간격 검열을 무시한 Cox 모델이 AUC를 과대평가(incident AUC 평균 0.78→0.85)하거나 과소평가(누적 AUC 평균 0.71→0.65)하는 경향을 보였으며, 편향 정도는 검열 간격이 길어질수록 커졌다. 반면, msm‑piecewise, Weibull, M‑spline 모델은 실제 AUC와 거의 일치하는 추정값을 제공했으며, 특히 M‑spline은 비선형 위험 변화를 잘 포착해 가장 낮은 평균 제곱오차를 기록했다.
실제 데이터는 2,232명의 고등급 연부 조직 육종 환자를 대상으로, 수술 후 전이(원격 전이) 발생을 간격 검열된 질병 마커로 사용했다. 추적 방문은 3개월, 6개월, 12개월 등 불규칙하게 이루어졌으며, 전이 발생 시점이 정확히 알려지지 않았다. Cox 모델은 전이 발생이 사망 위험을 크게 증가시킨다고 (HR≈2.3) 보고했지만, 검열을 고려한 Illness‑Death 모델은 HR≈1.7 정도로 낮추어, 과대 추정이 있었음을 시사한다. AUC 분석에서도 Cox 모델은 2년 시점에서 incident AUC=0.82, cumulative AUC=0.74를 제시했지만, 검열을 반영한 모델은 각각 0.78, 0.71 수준으로 감소하였다. 이는 임상 의사결정에서 과도한 위험 인식을 방지하고, 보다 현실적인 예측을 제공한다는 점에서 중요한 함의를 가진다.
결론적으로, 간격 검열된 질병 데이터에서는 전이 강도와 전이 확률을 정확히 추정하기 위해 Illness‑Death 모델을 사용하고, AUC 계산 시에도 검열 정보를 통합해야 한다. 이를 무시하면 모델의 판별력이 왜곡되어, 임상 연구 및 위험 예측 모델 개발에 부정적 영향을 미칠 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기