양측 랜덤 투영을 이용한 초고속 저랭크 근사

본 논문은 고밀도 행렬 X에 대해 저랭크 근사를 빠르게 수행하는 새로운 프레임워크인 양측 랜덤 투영(Bilateral Random Projections, 이하 BRR)을 제안한다. 기존 연구는 주로 열 공간만을 랜덤하게 샘플링해 SVD를 근사하는 방법(예: randomized SVD)이나 열 선택 기반 방법에 초점을 맞추었다. 반면, 저자는 X의 좌·우 양쪽에서 독립적인 랜덤 매트릭스 A₁∈ℝⁿˣʳ, A₂∈ℝᵐˣʳ 를 이용해 Y₁ = X A₁, Y₂ = Xᵀ A₂ 라는 두 개의 투영을 만든다. 이때 r은 목표 저랭크이며, 일반적으로 r+p (p≥2) 열을 사용해 오버샘플링한다. 핵심 근사식은 L = Y₁ ( A₂ᵀ Y₁ )⁻¹ Y₂ᵀ (1) 이다. 여기서 (·)⁻¹는 r×r 행렬의 역이며, 연산 흐름은 다음과 같다. ① X와 A₁을 곱해 Y₁을 얻고, ② Y₁과 A₂ᵀ를 곱해 r×r 행렬 M = A₂ᵀ Y₁을 만든다, ③ M⁻¹를 구한 뒤 Y₂ᵀ와 곱해 최종 L을 산출한다. 전체 FLOP 수는 BRR 자체에 2 m n r, 그리고 (1) 단계에 r²(2n+r) 정도로, 밀집 행렬에 대해 SVD(≈2 m n min(m,n))보다 현저히 적다. 또한, A₁과 A₂를 단순 가우시안 행렬이 아니라 Y₂와 Y₁에서 직접 업데이트하는 “상호 업데이트” 전략을 제안한다. 구체적으로, 초기 A₁을 가우시안으로 잡고 Y₁을 만든 뒤 A₂←Y₁, 다시 Y₂←Xᵀ A₂, A₁←Y₂, 마지막으로 Y₁←X A₁을 재계산한다. 이 과정을 한 번 수행하면 Y₁, Y₂가 서로의 정보를 반영해 (1)의 근사 정확도가 크게 향상된다. 추가 연산량은 O(mnr) 정도이며, 전체 복잡도에 큰 영향을 주지 않는다. 특이값이 완만히 감소하는 경우, 기본 BRR은 정확도가 떨어질 수 있다. 이를 보완하기 위해 파워 스킴(power scheme)을 도입한다. q≥0인 정수에 대해 ˜X = (X Xᵀ)^{q} X = U Λ^{2q+1} Vᵀ (2) 를 정의하고, ˜X에 동일한 BRR 과정을 적용한다. 파워 스킴은 특이값을 λ_i^{2q+1} 로 강화해 스펙트럴 갭을 확대하고, 오류 상한을 (2q+1) 제곱근에 비례해 감소시킨다. 최종 근사는 L = Q₁

양측 랜덤 투영을 이용한 초고속 저랭크 근사

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기