가우시안 프로세스 기반 적응형 샘플 사이즈 탐색으로 임상 예측 모델 설계 최적화

본 논문은 임상 예측 모델 개발을 위한 샘플 사이즈 추정에 Gaussian Process surrogate 모델을 적용한 pmsims 패키지를 소개하고, 세 가지 탐색 엔진(GP‑기반, 이분법, 하이브리드)의 성능을 비교한다. GP‑기반 엔진이 가장 안정적인 샘플 사이즈를 제공하며, 기존 분석적(pmsampsize) 및 시뮬레이션 기반(samplesizedev) 방법에 비해 목표 성능을 더 정확히 달성하고 계산 비용을 절감한다는 결과를 제시한다…

저자: Oyebayo Ridwan Olaniran, Diana Shamsutdinova, Sarah Markham

가우시안 프로세스 기반 적응형 샘플 사이즈 탐색으로 임상 예측 모델 설계 최적화
본 논문은 임상 예측 모델 개발 단계에서 필수적인 샘플 사이즈 결정 문제를 해결하기 위해 pmsims 라는 R 패키지를 제안하고, 그 성능을 체계적으로 검증한다. 기존의 분석적 샘플 사이즈 계산 도구(pmsampsize)와 비적응형 시뮬레이션 기반 도구(samplesizedev)는 모델 종류와 데이터 생성 메커니즘에 제한이 있거나 계산 비용이 크게 소요되는 단점이 있다. 이를 보완하고자 저자들은 Gaussian Process(GP) surrogate 모델을 활용한 적응형 탐색 엔진을 핵심으로 설계하였다. pmsims는 세 가지 핵심 구성요소(데이터 생성, 모델 적합, 성능 평가)를 사용자가 자유롭게 정의할 수 있게 하며, 이를 기반으로 샘플 사이즈 n 에 대한 성능 함수 G(n) 을 시뮬레이션한다. 성능 평가는 평균 기준(mean)과 확률 보장 기준(assurance, 예: 80% 확률) 두 가지를 지원한다. 데이터 생성 단계에서는 예측 변수 X 를 표준 정규분포에서 독립적으로 샘플링하고, 선형 예측자 η = Xᵀβ + β₀ 를 구성한다. 이때 신호 변수와 잡음 변수를 구분하고, 목표 사건 발생률·C‑statistic·R² 등 원하는 성능 목표에 맞게 β 와 β₀ 를 튜닝한다. 이진, 연속, 생존 세 가지 결과 유형에 대해 각각 로지스틱 회귀, 선형 회귀, Cox 비례 위험 모델을 기본 모델로 제공한다. 세 가지 탐색 엔진은 (1) GP‑기반 적응형 엔진(gp), (2) 전통적인 이분법(bisection) 엔진, (3) GP와 이분법을 결합한 하이브리드 엔진(gp‑bs)이다. GP 엔진은 초기 파일럿 시뮬레이션으로 탐색 구간을 설정한 뒤, 획득함수를 통해 불확실성이 큰 샘플 사이즈 지점을 선택하고, κ 번 복제 시뮬레이션을 수행해 평균 또는 지정된 분위수의 성능을 추정한다. 이 과정을 예산 B 가 소진될 때까지 반복한다. 이분법 엔진은 성능이 목표를 초과하거나 미달하는 구간을 반으로 좁혀가며 탐색하고, 하이브리드 엔진은 초기에는 이분법으로 구간을 좁힌 뒤 GP를 적용한다. 시뮬레이션 연구는 두 가지 목표를 가지고 설계되었다. 첫 번째 목표는 세 엔진의 안정성 및 효율성을 비교하는 것이었다. 시나리오는 사건 발생률·검열률·예측 변수 차원·목표 성능·평가 기준·예산 규모 등을 다양하게 변형했으며, 각 시나리오를 100번 반복해 샘플 사이즈 추정의 변동성을 CV로 측정했다. 결과는 GP 엔진이 전반적으로 가장 낮은 CV를 보였으며, 특히 신호가 약하고 변수 수가 많은 고차원 상황에서 그 차이가 크게 나타났다. 두 번째 목표는 최적화된 GP 엔진을 기존 도구와 비교하는 것이었다. 평균 기준에서는 GP 엔진과 samplesizedev 가 목표 성능과의 편차를 ±1% 이내로 유지했지만, pmsampsize 는 고성능 상황에서 최대 ‑9.84% 까지 목표를 크게 벗어났다. 또한, GP 엔진은 B≈1000 예산 하에 평균 30% 이하의 계산 시간으로 수렴했으며, 비적응형 탐색은 동일 예산에서 2‑3배 이상의 시간이 필요했다. 결론적으로, pmsims의 GP‑기반 적응형 탐색 엔진은 샘플 사이즈 추정의 정확도와 계산 효율성을 동시에 개선한다. κ≥20 복제와 B≈1000 예산이 확보될 경우, 추가 시뮬레이션 없이도 안정적인 샘플 사이즈를 도출할 수 있다. 이는 복잡한 머신러닝 모델, 비표준 데이터 생성 메커니즘, 다양한 성능 목표(분별력·보정력·확률 보장) 등을 포함하는 실제 임상 연구에서 샘플 사이즈 계획을 보다 과학적이고 실용적으로 수행하도록 돕는다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기