다중 행렬 합성의 표본 공분산 LSD 분석
초록
본 논문은 서로 다른 K개의 가법적 분리공분산 구조를 가진 행렬들의 합으로 구성된 데이터 행렬 X에 대해, 고차원 극한(p,n→∞, p/n→c)에서 표본 공분산 Sₙ=⅟nXX*의 고유값 분포가 수렴함을 보이고, 그 극한 분포(LSD)를 스틸리젯 변환을 이용한 연립 방정식 형태로 명시한다. A₁,…,A_K와 B₁,…,B_K가 각각 동시에 대각화 가능하고, 그 고유값들의 결합 경험분포가 K차원 확률분포로 수렴한다는 가정 하에 결과가 성립한다.
상세 분석
논문은 먼저 표본 공분산 행렬 Sₙ=⅟nXX를 정의하고, 여기서 X=∑_{r=1}^K X_r, X_r=A_r^{1/2}Z_rB_r^{1/2} 형태의 가법적 구조를 갖는다고 가정한다. 각 Z_r은 독립적인 표준화 혁신 행렬이며, A_r∈ℂ^{p×p}, B_r∈ℂ^{n×n}은 양의 반정치 행렬이다. 핵심 가정은 같은 종류의 A_r들 사이와 B_r들 사이가 서로 교환 가능(commute)하여 동시에 대각화 가능하다는 점이다. 이를 통해 A_r=PD_rP , B_r=QD_rQ* 로 표현하고, 각 행렬의 고유값을 λ^{(r)}i, θ^{(r)}j 라고 두면, 전체 공분산 구조의 크로네커 곱 형태인 Var(vec(X))=∑{r=1}^K B_r⊗A_r 의 고유값은 {∏{r=1}^K λ^{(r)}_i θ^{(r)}_j} 로 나타난다.
고차원 극한에서는 p/n→c∈(0,∞) 로 두고, A_r와 B_r의 결합 경험분포(JESD) H_n, G_n이 각각 H, G 라는 비무작위 확률분포로 거의 확실히 수렴한다고 가정한다. 또한 각 행렬의 트레이스가 유한한 상수 C₀ 이하로 제한되고, 혁신 행렬의 2+η₀ 차 순간이 유계라는 기술적 조건(T1–T5)을 부과한다.
이러한 전제 하에 저자는 스틸리젯 변환 s_F(z)=∫{ℝ+^K} (λ^T p) /
댓글 및 학술 토론
Loading comments...
의견 남기기