동물실험 적정 규모와 증거 가치 균형: 적응형 설계와 실험단위 정보 지수
초록
본 논문은 동물실험에서 사용되는 실험단위(동물) 1마리당 제공되는 통계적 증거 가치를 정량화하는 “실험단위 정보 지수(EUII)”를 제안한다. EUII는 검정력, 제1종 오류, 표본 크기를 결합한 지표로, 고정 표본 설계와 조기 중단을 허용하는 적응형 설계 모두에 적용 가능하며, Bayesian 사후 오즈와도 일관된다. 그룹 순차 설계와 최근 제안된 “제한된 표본 증강” 절차에 대한 시뮬레이션을 통해 EUII가 높은 설계가 어떻게 동물 수를 절감할 수 있는지를 보여준다.
상세 분석
이 연구는 3R 원칙 중 “Reduce”를 통계학적으로 구현하고자, 기존의 검정력·제1종 오류·표본 크기라는 세 축을 하나의 지표로 통합한 실험단위 정보 지수(EUII)를 정의한다. 먼저 저자는 진단 검사의 민감도·특이도와 동일한 구조를 갖는 likelihood ratio(LR)를 통계 검정에 적용한다. 양의 LR(LR⁺)은 검정력/α, 음의 LR(LR⁻)은 (1‑검정력)/(1‑α) 로 정의되며, 이 두 값을 비율로 묶은 diagnostic odds ratio(DOR)는 DOR = (검정력·(1‑α))/((1‑검정력)·α) 로 표현된다. DOR는 “유의 결과가 나올 확률이 대립가설 하에서 얼마나 큰가”를 나타내는 frequentist 해석과, “유의·비유의 결과에 대한 사후 오즈 비율”이라는 Bayesian 해석을 동시에 제공한다는 점에서 핵심적이다.
EUII는 DOR을 표본 크기 n의 n제곱근으로 정규화한 EUII = DOR^{1/n} 로 정의된다. 이는 각 실험단위가 독립적으로 LR에 기여한다는 가정 하에, 한 단위가 평균적으로 제공하는 정보량을 기하 평균으로 측정한다는 의미다. EUII>1이면 추가되는 단위가 검정의 구별력을 향상시킨다. 저자는 z‑검정과 t‑검정을 통해 EUII가 효과크기 δ에 따라 exp(δ²/2) 로 수렴함을 보이며, 이는 효과크기만이 장기적으로 EUII를 결정한다는 중요한 통찰을 제공한다.
적응형 설계 확장에서는 조기 효능·무효성 중단으로 인해 유의와 비유의 경우 각각 다른 기대 표본 크기 E₁, E₀가 발생한다. 여기서 정의된 확장형 EUII = DOR^{(π₁/E₁ + π₀/E₀)} (π₁,π₀는 사전 확률) 은 각 경로에서 기대되는 단위당 정보를 가중 평균한다. 그룹 순차 설계에서는 전통적인 O’Brien‑Fleming, Pocock 경계와 비교해, 동일한 검정력·α를 유지하면서 EUII를 최대화하는 경계가 존재함을 시뮬레이션으로 확인한다. 특히 “제한된 표본 증강(constrained sample augmentation)” 절차는 사전 정의된 최대 표본 수를 초과하지 않으면서, 중간 분석에서 얻은 예측 검정력을 기반으로 추가 표본을 동적으로 할당한다. 이 방법은 EUII 측면에서 전통적인 그룹 순차 설계보다 우수했으며, 특히 무효성 중단이 빈번히 발생하는 작은 효과크기 상황에서 표본 절감 효과가 두드러졌다.
실제 데이터 적용에서는 2738개의 신경과학·대사 분야 동물실험을 재분석하였다. 시뮬레이션된 중간 분석 결과를 기반으로 그룹 순차 설계와 제한된 표본 증강을 적용했을 때, 평균적으로 15~22%의 동물 수가 절감될 수 있음을 보고한다. 이는 3R 원칙 실천에 직접적인 통계적 근거를 제공한다는 점에서 의의가 크다.
전반적으로 이 논문은 (1) DOR을 통한 검정의 증거 가치 정량화, (2) EUII라는 단위당 정보 지수 도입, (3) 적응형 설계에 EUII를 적용한 최적 설계 탐색, (4) 실제 동물실험 데이터에 대한 실증적 검증이라는 네 가지 주요 기여를 한다. 특히 EUII는 연구 설계 단계에서 “단위당 얼마만큼의 증거를 얻는가”를 직관적으로 보여주어, 연구자와 윤리 위원회가 표본 규모와 통계적 신뢰성 사이의 균형을 보다 투명하게 판단하도록 돕는다.
댓글 및 학술 토론
Loading comments...
의견 남기기