조건부 재검사에서 바이오마커 변동성 분해와 재측정 시점 결정

본 연구는 혈액 기증자 헴oglobin 검사의 초기 결과가 기준값 이하일 때만 재검사를 시행하는 상황에서, 관측된 연속형 바이오마커 측정값의 변동성을 ‘인구 변동성’과 ‘측정 절차 변동성’으로 분리하는 방법을 제시한다. 정규성을 가정한 두 가지 빈도주의 접근법이 실제 데이터에서 편향을 보이는 한계를 확인하고, 측정 오차를 중위험 t‑분포로 모델링한 베이지안 계층 모델을 구축하였다. 베이지안 분석 결과, 여성에서는 전체 변동성의 22 %, 남성에…

저자: Supun Manathunga, Mart P. Janssen, Yu Luo

본 논문은 임상 현장에서 흔히 발생하는 ‘조건부 재검사’ 상황을 통계적으로 모델링하고, 이를 통해 연속형 바이오마커 측정값의 변동성을 두 가지 근원, 즉 인구 수준의 진짜 값 변동과 측정 절차에서 발생하는 오차로 분리하는 방법을 제시한다. 서론에서는 혈액 기증자 헴oglobin 검사를 사례로 들며, 초기 측정값이 WHO 기준 이하일 경우에만 재측정을 시행하는 현재 관행이 ‘순차 검사 편향(sequential testing bias)’을 초래할 수 있음을 지적한다. 이러한 편향은 오분류 위험(거짓 양성·거짓 음성)을 왜곡하고, 불필요한 기증자 탈락이나 철분 결핍 위험을 증가시킨다. 이론적 배경에서는 바이오마커의 진짜 값 T_i를 평균 μ와 인구 변동 ε_pop으로 표현하고, 측정값 x_i,j는 T_i와 측정 오차 ε_meas_j의 합으로 정의한다(식 1). 두 변동원은 독립이라고 가정한다면 전체 측정값의 분포는 인구 분포와 측정 오차 분포의 컨볼루션이 된다. 비조건부 반복 측정이 가능한 경우, 두 번 측정된 차이 Δ_i의 분산은 2σ²_meas가 되므로 σ²_meas를 직접 추정할 수 있다(식 6). 그러나 실제 데이터에서는 첫 번째 측정값이 임계값 c 이하일 때만 재측정이 이루어지므로, ε_meas₁은 선택 편향을 받아 Δ_i의 조건부 분산이 감소한다. 정규성을 가정하면 이 편향을 식(11)‑(12)로 정량화할 수 있다. 정규성 전제 하에 두 가지 빈도주의 추정법을 개발하였다. 첫 번째는 조건부 기대값을 이용해 ρ=σ²_pop/σ²_total를 식(19)로 계산하는 ‘조건부 기대법’이며, 두 번째는 관측된 쌍에 대한 이중정규분포의 로그우도식을 최대화해 ρ를 추정하는 ‘최대우도법’이다. 시뮬레이션에서는 두 방법 모두 ρ와 σ²_meas를 정확히 복원했지만, 재측정 확률이 초기값에 따라 연속적으로 변하는 경우(식 23)에는 조건부 기대법이 편향을 보이고, 최대우도법은 견고함을 유지한다. 실제 데이터는 미국 Vitalant 혈액 기증센터에서 2017‑2022년 사이에 수집된 1 863 159명의 최초 기증 방문을 대상으로 한다. 남성 849 469명, 여성 1 013 690명으로 성별에 따라 기준값(남성 13 g/dL, 여성 12.5 g/dL)이 다르며, 초기 측정값이 기준 이하인 경우에만 동일일에 재측정이 이루어졌다. 남성에서는 2.1 %가 재측정, 여성에서는 12.2 %가 재측정되었다. 빈도주의 방법을 적용한 결과, 인구 변동성 추정치와 측정 오차 추정치 사이에 성별 및 방법에 따라 유의한 차이가 나타났다. 특히 측정 오차가 남성(0.61 (g/dL)²)과 여성(0.34 (g/dL)²)에서 크게 달라, 정규성 가정이 위배될 가능성을 시사한다. 이러한 한계를 극복하기 위해 베이지안 계층 모델을 도입하였다. 인구 수준의 진짜 헴oglobin은 정규분포 N(μ,σ²_pop)로, 측정 오차는 자유도 ν를 갖는 t‑분포 t_ν(0,σ²_meas)로 가정한다. 이는 중위험 꼬리와 이상치에 대한 강건성을 제공한다. 사전분포는 비정보적이면서도 σ²_meas와 ν에 대한 적절한 제약을 부여하도록 설계되었다. MCMC를 통해 사후분포를 추정한 결과, 전체 변동성 중 측정 오차가 차지하는 비율은 여성 22 %, 남성 25 %이며, 인구 표준편차는 각각 1.07 g/dL와 1.28 g/dL로 추정되었다. 베이지안 모델은 조건부 재검사 절차가 임계값 기반이든 확률적이든 관계없이 적용 가능하며, 관측된 1회 혹은 다회 측정값을 이용해 개인별 오분류 위험을 사후 확률로 직접 계산할 수 있다. 논의에서는 조건부 재검사가 측정 오차를 과소평가하게 만드는 메커니즘을 재차 강조하고, 빈도주의 방법이 정규성 위배 시 편향을 크게 보일 수 있음을 지적한다. 베이지안 접근법은 보다 유연한 분포 가정과 불확실성 전파를 가능하게 하여, 실제 임상 데이터에 보다 적합한 추정치를 제공한다. 또한, 제안된 프레임워크는 혈액 기증 외에도 혈압, 혈당, 콜레스테롤 등 임계값 기반 검사가 적용되는 다양한 임상 상황에서 재검사 정책을 근거 기반으로 설계하고, 개인 맞춤형 위험 평가를 수행하는 데 활용될 수 있다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기