공통 평균 계산 방법의 새로운 접근과 비교
초록
본 논문은 여러 독립 측정값을 하나의 공통 평균으로 결합하는 전통적 가중 평균(WA)과 중앙값 방법을 다양한 변형과 함께 비교한다. 기존 WA 불확도 추정식(σ₁, σ₂, σ₃)의 한계를 지적하고, 데이터 산포와 보고된 불확도를 동시에 반영하는 새로운 결합 불확도 추정식 σ_c를 제안한다. 시뮬레이션 및 실제 측정 사례를 통해 σ_c가 일관된 경우와 불일치가 있는 경우 모두 더 현실적이고 안정적인 결과를 제공함을 보인다.
상세 분석
논문은 먼저 메타데이터가 부족한 실제 메트롤로지 상황을 전제로, 독립적인 측정값 x_i와 그에 대응하는 표준편차 s_i만을 이용해 공통 평균(공통 평균, CM)을 추정하는 문제를 정의한다. 전통적인 가중 평균(Weighted Average, WA)은 가중치 p_i = 1/s_i²를 사용해 (\bar{x}_w = \sum p_i x_i / \sum p_i) 로 계산되며, 두 가지 불확도 추정식이 존재한다. 첫 번째는 σ₁ = 1/√p 로, 보고된 s_i 값에 직접 의존한다. 두 번째는 σ₂ = σ₁·√(H/(n‑1)) 로, 여기서 H = Σ p_i (x_i‑(\bar{x}_w))²는 χ² 통계량이며 데이터 산포를 반영한다. σ₁은 s_i가 실제 분산보다 크게 과대평가될 때 과소평가되는 경향이 있고, σ₂는 s_i가 실제보다 작을 때 과소평가될 위험이 있다. 기존 문헌은 χ² 임계값(Q) 기반으로 H가 임계값 이하이면 σ₁, 초과하면 σ₂를 선택하는 σ₃ 방식을 제안했지만, Q 선택에 따라 결과가 급격히 변하고 주관성이 개입한다는 단점을 지적한다.
이에 저자는 σ₁과 σ₂를 단순히 제곱합한 뒤 제곱근을 취하는 새로운 결합 불확도 σ_c = √(σ₁² + σ₂²) 를 제안한다. 이 식은 σ₁이 보고된 불확도를, σ₂가 실제 측정값의 산포를 각각 반영하므로 두 요인을 동시에 고려한다. 수식 (10)에서 σ_c = s₁·√(1 + H/(n‑1)) 로 재표현될 수 있어, 별도의 σ₁·σ₂ 계산 없이도 동일한 결과를 얻는다.
시뮬레이션에서는 두 측정값 조합부터 23가지 다양한 상황을 설정해 σ₁, σ₂, σ₃, σ_c를 비교하였다. 결과는 σ_c가 대부분의 경우 과소·과대 추정 사이의 중간값을 제공하며, 특히 s_i가 크게 변하거나 데이터 산포가 큰 경우에도 안정적인 추정치를 보여준다. 실제 사례로는 러시아 세베레오 레이더 관측소의 지오데틱 마크 간 거리 측정과, 다섯 개의 측정값을 가진 실험 데이터를 분석하였다. 첫 번째 사례에서는 σ₁이 산포에 비해 크게 과소평가되고, σ₂와 σ_c가 비슷한 수준이었으며, 중앙값 기반 불확도 σ_m도 σ₂와 근접했다. 두 번째 사례에서는 σ_c가 σ₁과 σ₂ 사이에서 자동으로 가중을 조정해, 작은 s_i에서는 산포 중심의 σ₂에, 큰 s_i에서는 보고된 불확도 중심의 σ₁에 가까워졌다.
결론적으로, 저자는 σ_c가 기존 방법들의 장점을 취합하면서도 Q와 같은 임계값 선택에 의존하지 않는 보다 객관적인 불확도 추정법이라고 주장한다. 이는 특히 표본 크기가 작고, 보고된 불확도가 신뢰할 수 없으며, 측정값 간 일관성이 불분명한 메트롤로지 상황에서 유용하다.
댓글 및 학술 토론
Loading comments...
의견 남기기