잠재 치유율 마커 기반 새로운 생존 모델
초록
본 논문은 치료가 불가능한 환자를 포함한 생존 데이터를 위해, 환자들을 동일한 잠재 치유율을 공유하는 위험군으로 분류하는 혼합 모델을 제안한다. 잠재 치유율 마커를 다항 로지스틱 회귀로 모델링하고, EM 알고리즘으로 파라미터를 추정한다. 전립선암 임상시험 데이터에 적용해 기존 치유율 모델보다 적합도가 우수함을 보였으며, 위험군 수 결정 및 예측 분류 알고리즘 개발에도 활용 가능함을 입증한다.
상세 분석
제안된 모델은 기존의 혼합 치유율 모델이 가지는 한계를 극복하기 위해 ‘잠재 치유율 마커’를 도입한다. 각 환자는 관측된 공변량에 따라 다중 클래스(위험군) 중 하나에 할당되며, 이때 할당 확률은 다항 로지스틱 회귀식으로 표현된다. 동일 위험군에 속한 환자들은 동일한 치유율 파라미터를 공유하므로, 군별 치유율을 직접 추정할 수 있다. 모델은 두 단계 혼합 구조를 갖는다. 첫 단계는 군 할당을 위한 잠재 변수 Z_i(카테고리형)이며, 두 번째 단계는 각 군별 생존 시간의 분포를 비치유 환자에 대해 일반적인 비례위험 혹은 가속위험 형태로 기술한다. 파라미터 추정은 기대-최대화(EM) 알고리즘을 이용한다. E‑step에서는 현재 파라미터값을 바탕으로 각 환자의 군 할당 확률과 치유 여부 확률을 계산하고, M‑step에서는 이 기대값을 사용해 로지스틱 회귀계수와 군별 생존 파라미터를 업데이트한다. 모델 선택을 위해서는 BIC와 AIC를 활용해 최적 위험군 수(K)를 결정한다. 시뮬레이션 결과는 표본 크기와 군 수가 증가할수록 파라미터 추정이 편향이 적고 일관성을 보이며, 기존의 단일 치유율 모델보다 위험군 구분 정확도가 현저히 높음을 보여준다. 실제 전립선암 임상시험 데이터에 적용했을 때, 제안 모델은 로그우도와 검정통계량 면에서 기존의 혼합 치유율 모델(Cure‑Mixture) 및 표준 Cox 모델보다 우수한 적합도를 기록했다. 특히, 위험군별 치유율 차이가 명확히 드러나면서 임상적 의사결정에 필요한 위험군 구분이 가능해졌다. 또한, 추정된 로지스틱 회귀계수를 이용해 새로운 환자의 위험군을 예측하는 분류 알고리즘을 제시했으며, 교차검증을 통해 높은 예측 정확도를 확인했다. 이와 같이 잠재 치유율 마커 기반 모델은 치유율이 존재하는 생존 데이터에서 위험군을 통계적으로 정량화하고, 임상 현장에서 실용적인 예측 도구로 활용될 수 있는 강점을 가진다.
댓글 및 학술 토론
Loading comments...
의견 남기기