예산 제한 하 다중 출처 데이터 수집의 최소극대 위험 최적화
본 논문은 서로 다른 비용과 그룹 구성을 가진 여러 데이터 출처에서 예산 내에 표본을 수집할 때, 모집단 평균 및 그룹별 평균을 추정하기 위한 최적의 샘플링 계획과 추정기를 제시한다. 효과적 표본 크기 = 총 표본 수 ÷ (χ²‑발산 + 1) 이라는 지표를 최대화하는 전략이 최소극대 위험을 달성함을 증명한다.
저자: Michael O. Harding, Vikas Singh, Kirthevasan K
본 논문은 현대 통계·머신러닝 파이프라인에서 데이터 수집이 차지하는 중요성을 강조하면서, 특히 여러 이질적인 출처(source)에서 비용이 서로 다른 표본을 수집해야 하는 상황을 다룬다. 저자는 두 가지 주요 추정 목표, 즉 전체 모집단 평균(θ_PM)과 그룹별 조건부 평균(θ_GM)을 설정하고, 이를 위해 예산 B와 각 출처 m의 비용 c_m이 주어진 상황에서 최적의 샘플링 계획 n과 추정기 b를 설계한다.
**모델 설정**
- K개의 그룹(z∈
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기