부분순위표본의 정보량: PROS 설계의 우수성
부분순위표본(Partially Rank‑Ordered Set, PROS)은 전통적인 순위표본(RSS)의 확장으로, 각 집합을 완전히 순위 매기지 않아도 된다. 본 논문은 PROS 표본이 동일 크기의 단순무작위표본(SRS) 및 RSS 대비 더 큰 피셔 정보(Fisher Information)를 제공함을 수식적으로 증명하고, 셰넌·레니·KL 엔트로피 등 불확실성 측정에서도 우수함을 확인한다. 위치‑스케일 분포와 단순 회귀 모델을 예시로 제시하며, …
저자: Armin Hatefi, Mohammad Jafari Jozani
1. 서론
- 순위표본(RSS)은 측정 비용이 높은 변수에 대해 순위만 판단해 효율적인 추정을 가능하게 한다. 그러나 모든 표본에 대해 완전한 순위를 매겨야 하는 부담과 순위 오류 위험이 존재한다.
- 부분순위표본(PROS)은 이러한 제약을 완화하여, 각 집합을 사전에 정의된 크기의 부분집합으로 나누고, 각 부분집합 내에서만 순위 정보를 활용한다. 이는 판단자의 부담을 줄이고, 순위 오류를 감소시킨다.
2. PROS 설계와 데이터 구조
- 집합 크기 S, 부분집합 수 n(=S/m) 및 디자인 파라미터 D={d₁,…,d_n} 로 정의한다. 각 d_r 은 연속된 인덱스 집합이며, d₁의 원소는 d₂보다 작다는 부분순위 관계만 가정한다.
- 각 사이클에서 d₁에서 무작위로 하나를 선택·측정, 이어서 d₂,…,d_n 순으로 진행한다. N 사이클을 반복해 총 N·n 개의 관측값 X(d_r) 를 얻는다.
- 관측값과 함께 잠재 변수 Δ(d_r) 를 정의해, X(d_r) 가 실제로 d_r 내 어느 순위(u) 에서 선택되었는지를 표시한다.
3. 피셔 정보(FI) 분석
- 완전 PROS 데이터 Y_PROS = {(X(d_r),Δ(d_r)), r=1..n} 의 로그우도는 l_PROS(θ)=cst + l*_SRS(θ) + Γ_P(θ) 로 분해된다. 여기서 Γ_P(θ) 는 부분집합 순위 정보에 기인한다.
- 일반적인 정칙성 가정 하에 FI 행렬은 I_PROS(θ)=I_SRS(θ)+K(θ) 로 표현된다. K(θ)=n(S‑1)·E
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기