특이 행렬에 대한 Sherman Morrison Woodbury 확장과 중심화 응용
본 논문은 랭크가 낮은 교란 행렬을 더한 특이(비가역) 행렬에 대한 Moore‑Penrose 일반화 역행렬을 명시적으로 구하는 식을 제시한다. 행렬 A의 열공간에 속하는 부분 V와, A에 직교하는 부분 W 로 분해한 뒤, 작은 차원 k (k≤ℓ) 의 교란 G 를 삽입하면 Ω = A+(V+W)G(V+W)ᵗ 형태가 된다. 저자는 WᵗW 가 비특이(k 차원)일 때 Ω⁺ 를 A⁺ 와 V, W, G 로 구성된 식 (2) 로 표현한다. 대칭 경우와 랭크‑…
저자: Kurt S. Riedel
본 논문은 “Sherman‑Morrison‑Woodbury Identity for Rank Augmenting Matrices with Application to Centering”이라는 제목으로, 특이(비가역) 행렬에 작은 차원의 교란을 추가했을 때 그 역행렬을 효율적으로 구하는 새로운 정체식을 제시한다. 전통적인 Sherman‑Morrison‑Woodbury 식은 A가 가역일 때만 적용 가능하다는 제한이 있었으며, 특히 통계학에서 공분산 행렬이 특이한 경우(예: 일부 변수에 변동이 없을 때)에는 역행렬을 직접 구할 수 없어 문제가 발생한다. 저자는 이러한 상황을 해결하기 위해 A의 열공간과 직교보완을 이용해 교란 행렬을 두 부분으로 분해한다.
먼저, ℓ×ℓ 특이 행렬 A와 k×k 비특이 행렬 G (k≤ℓ)를 정의하고, 교란 행렬 X₁G X₂ᵗ 를 (V₁+W₁)G(V₂+W₂)ᵗ 로 표현한다. 여기서 V₁, V₂는 각각 A와 A*의 열공간에 속하고, W₁, W₂는 각각 A와 A*의 직교보완에 속한다. 이러한 분해는 A와 Wᵢ 사이에 AWᵢ=0, Wᵢ* A⁺=0, Vᵢ* Wᵢ=0 등의 직교성을 보장한다.
다음으로, Wᵢ*Wᵢ 를 Bᵢ라 두고 Bᵢ가 가역(k 차원)임을 가정한다. 이때 Cᵢ = Wᵢ Bᵢ⁻¹ 로 정의하면 Wᵢ Cᵢ* = I_k 가 되며, Cᵢ는 Wᵢ의 의사역 역할을 한다. 이러한 정의를 이용해 Ω = A + (V₁+W₁)G(V₂+W₂)ᵗ 의 Moore‑Penrose 역 Ω⁺ 를 다음과 같이 전개한다.
Ω⁺ = A⁺ – C₂ V₂* A⁺ – A⁺ V₁ C₁* + C₂ ( G⁺ + V₂* A⁺ V₁ ) C₁* .
이 식은 A⁺와 교란 부분 V, W, G 사이의 상호작용을 정확히 포착한다. 증명 과정에서는 A와 Wᵢ의 직교성으로 인해 많은 항이 소멸하고, 최종적으로 Moore‑Penrose 역의 네 가지 정의 조건을 만족함을 직접 확인한다. 특히, ΩΩ⁺ = A A⁺ + W₁ C₁* 와 같은 형태가 나오며, 이는 Ω⁺ 가 실제 역행렬이 아니라 일반화 역행렬임을 보여준다.
대칭 행렬 A에 대해서는 A와 A*의 열공간이 동일하므로 V₁=V₂, W₁=W₂ 로 두어 정리 2를 얻는다. 이 경우 식이 더욱 간단해져 C = W (WᵗW)⁻¹ 로 정의하고, Ω⁺ = A⁺ – C Vᵗ A⁺ – A⁺ V Cᵗ + C ( G⁺ + Vᵗ A⁺ V ) Cᵗ 로 쓸 수 있다.
특히 랭크‑1 교란(k=1) 상황을 상세히 다루며, Vᵢ와 Wᵢ 를 각각 ℓ 차원의 벡터 vᵢ, wᵢ 로 축소한다. G=1 로 두고, w₂ 가 w₁ 와 평행하다는 추가 가정 하에 정리 3을 도출한다. 이때 Ω⁺ 은
Ω⁺ = A⁺ – w₂ v₂* A⁺ /‖w₂‖² – A⁺ v₁ w₁* /‖w₁‖² + (1 + v₂* A⁺ v₁) w₂ w₁* / (‖w₁‖²‖w₂‖²)
와 같은 형태가 된다. 여기서 wᵢ → 0 일 때 Ω⁺ 은 무한대로 발산함을 확인할 수 있다. 이는 교란이 사라지면 기존 Sherman‑Morrison 식으로 바로 복귀하지 않으며, 특이 A에 대한 역행렬이 교란 없이는 정의되지 않음을 의미한다.
논문의 마지막 부분에서는 이 이론을 통계적 데이터 중심화 문제에 적용한다. 회귀 분석에서 사용되는 SSP(합계제곱곱) 행렬 XᵗX 를 중심화된 공분산 행렬 ˜Xᵗ˜X 와 평균 벡터의 외적 n \bar{x}\bar{x}ᵗ 로 분해한다. 평균 벡터를 v+w 로 다시 분해해 v∈M(˜Xᵗ˜X), w⊥M(˜Xᵗ˜X) 로 두면, XᵗX 은 정리 3의 형태와 일치한다. 따라서 Ω⁺ 식을 이용해 XᵗX⁺ 를 ˜Xᵗ˜X⁺ 와 w 로 표현할 수 있다. 이는 일부 독립 변수의 변동이 없어서 공분산 행렬이 특이해지는 상황에서도, 평균 벡터의 직교 성분을 이용해 안정적인 역행렬을 얻을 수 있음을 보여준다.
결론적으로, 이 논문은 특이 행렬에 대한 교란 역행렬 공식화를 제공함으로써 기존 Sherman‑Morrison‑Woodbury 정체식을 일반화하고, 특히 통계·계산 분야에서 특이성 문제를 다루는 실용적인 도구를 제시한다. 저자는 이 방법이 데이터 중심화, 회귀 분석, 그리고 대규모 선형 시스템의 업데이트 등에 널리 활용될 수 있음을 강조한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기