결합 분산 공식으로 보는 분산 경계의 새로운 증명

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 두 표본을 결합한 전체 표본의 분산을 계산하는 기본 식(1.1)을 이용해, Samuelson 부등식, Nagy 부등식, Mallows‑Richter 확장 등 여러 고전적인 분산 경계들을 간결하고 직관적인 방식으로 재증명한다. 또한 이 식을 활용해 기존 결과들의 정밀한 개선형을 제시한다.

상세 분석

논문은 먼저 두 독립 표본 X와 Y(각각 크기 n₁, n₂) 의 평균과 분산을 이용해 전체 표본의 분산 S²_{n₁+n₂} 를
S²_{n₁+n₂}= \frac{n₁}{n₁+n₂}S²_{n₁}+ \frac{n₂}{n₁+n₂}S²_{n₂}+ \frac{n₁n₂}{(n₁+n₂)^{2}}( \bar X- \bar Y)^{2}
이라는 형태(식 1.1)로 전개한다. 이 식은 가중 평균의 분산 분해 공식과 동일하지만, “두 표본 사이의 평균 차이” 항이 명시적으로 나타나므로 하한을 얻기에 매우 유용하다.

첫 번째 적용에서는 n₁=1, n₂=n-1 로 두고, 하나의 관측값 x_j 와 나머지 n-1개의 표본 평균을 X, Y 로 잡는다. 이때 S²₁=0 이므로 (1.2) 가
S²_n = \frac{n-1}{n}S²_{n-1}+ \frac{1}{n-1}(x_j- \bar x)^{2}
이 된다. 두 항이 모두 비음이므로 S²_n ≥ \frac{1}{n-1}(x_j- \bar x)^{2} 가 도출되며, 이는 Samuelson(1968)의 부등식이다. 또한 같은 식에서 S²_n ≥ \frac{n-1}{n}S²_{n-1} 를 얻어 표본 크기가 늘어날수록 분산이 감소하지 않음을 보여준다.

두 번째 적용에서는 n₁=2, n₂=n-2 로 두 개의 관측값 x_j, x_k 를 선택한다. 식 (1.4) 로부터
S²_n ≥ \frac{1}{2n}(x_j- x_k)^{2}
가 얻어지며, 여기서 x_j와 x_k 를 각각 전체 최소값 m, 최대값 M 으로 잡으면
S²_n ≥ \frac{(M-m)^{2}}{2n}
이라는 Nagy(1918) 부등식이 도출된다. 저자는 추가적으로 (1.7) 형태의 정밀한 하한을 제시해, 평균과 극값 사이의 거리까지 포함한다.

다음으로는 임의의 r(1≤r≤n-1) 개 표본의 평균 γ_r 를 고려한다. (1.9) 를 이용하면
S²_n ≥ \frac{r(n-r)}{n^{2}}(γ_r- \bar x)^{2}
가 되며, 이를 정리하면 Mallows‑Richter(1969) 가 제시한 Samuelson 부등식의 일반화인 (1.8) 을 얻는다.

마지막으로 (1.9) 로부터 Boyd‑Hawkins(1971) 의 순서통계량 경계식도 쉽게 유도된다. 전체적으로 저자는 결합 분산 공식 하나만으로 다양한 고전 부등식들을 통일된 틀 안에서 재구성하고, 일부는 기존보다 더 강력한 형태로 개선함으로써 이 공식의 활용 가능성을 크게 확장한다.

결합 분산 공식으로 보는 분산 경계의 새로운 증명

초록

상세 분석

댓글 및 학술 토론

의견 남기기