다변량 베렌스 피셔 문제의 최대우도 방정식 해 개수와 위치
초록
본 논문은 두 개의 독립적인 다변량 정규표본으로부터 평균벡터 μ와 공분산행렬 Σ₁, Σ₂를 추정하는 베렌스‑피셔 문제에 대해, 표본크기 N₁, N₂가 차원 p보다 클 때 최대우도 방정식의 복소해가 거의 확실히 정확히 2p + 1개 존재함을 증명한다. p = 2인 경우를 대상으로 몬테카를로 시뮬레이션을 수행해 실제 실해가 여러 개 존재할 확률을 추정했으며, 다중 실해는 드물다는 결론을 얻었다.
상세 분석
베렌스‑피셔 문제는 두 개의 다변량 정규분포 Nₚ(μ,Σ₁)와 Nₚ(μ,Σ₂)에서 각각 N₁, N₂개의 독립 표본을 관측했을 때, 공통 평균 μ와 각각의 공분산 Σ₁, Σ₂를 동시에 추정하는 고전적인 통계학적 난제이다. 기존 연구는 주로 μ에 대한 비선형 방정식의 존재와 일관성, 그리고 근사적인 검정통계량을 다루었지만, 최대우도 방정식 자체가 다항식 형태임을 이용한 해의 정확한 개수와 구조에 대해서는 거의 알려지지 않았다. 본 논문은 이러한 공백을 메우기 위해 대수기하학적 접근을 채택한다. 먼저 표본 평균과 표본 공분산을 이용해 로그우도 함수를 전개하고, μ에 대한 편미분을 0으로 두는 일차 조건과 Σ₁, Σ₂에 대한 편미분을 0으로 두는 이차 조건을 동시에 만족시키는 방정식 체계를 구성한다. 이때 Σ₁, Σ₂는 양정치 대칭행렬이므로, 각각 p(p+1)/2개의 독립 변수로 표현될 수 있다. 전체 방정식은 총 p + p(p+1) = p( p+2 )개의 다항식으로 이루어지며, 차원 p > 0에 대해 일반적인 매개변수값(표본이 일반 위치에 있을 때)에서는 해가 유한하고, 그 수는 베르너 정리를 적용해 상한을 구할 수 있다. 저자들은 정밀한 차수 계산과 특수한 구조(예: Σ₁⁻¹와 Σ₂⁻¹이 동시에 대각화될 수 없다는 점)를 이용해 상한을 정확히 2p + 1로 낮춘다. 또한, “일반 위치”라는 가정 하에 해가 중복되지 않으며, 복소수 해가 정확히 그 수만큼 존재한다는 것을 확률론적으로 증명한다(표본이 연속분포를 따르므로 거의 확실히 일반 위치에 놓인다). p = 2인 경우, 즉 2차원 상황에서는 2p + 1 = 5개의 복소해가 존재한다. 이때 실해는 1개 혹은 3개, 5개가 될 수 있는데, 실해가 여러 개일 경우 로그우도 함수가 여러 국소극대점을 갖게 된다. 저자들은 Monte Carlo 시뮬레이션을 통해 N₁, N₂가 p보다 크게 설정된 다양한 시나리오에서 실해가 3개 이상 나타나는 비율을 추정했으며, 그 빈도는 1% 이하로 매우 낮았다. 이는 실제 데이터 분석에서 다중 실해가 실질적인 문제를 일으킬 가능성이 적다는 실용적 의미를 제공한다. 전체적으로 이 연구는 베렌스‑피셔 문제를 다항식 시스템으로 재구성하고, 대수기하학적 도구를 통해 해의 정확한 개수를 규명함으로써, 기존의 근사적 방법론에 비해 이론적 확실성을 크게 높였다.
댓글 및 학술 토론
Loading comments...
의견 남기기