양측 랜덤 투영을 이용한 초고속 저랭크 근사

본 논문은 행렬 X의 좌·우 랜덤 투영 Y₁ = X A₁, Y₂ = Xᵀ A₂ 를 이용해 저랭크 근사 L을 빠르게 구성하는 방법을 제안한다. 표준 가우시안 또는 SRFT 행렬을 사용한 BRP는 O(mnr) 연산으로 L을 얻으며, 전통적인 SVD 대비 크게 비용이 절감된다. 또한, 특이값이 완만히 감소할 경우를 위해 파워 스킴을 도입해 정확도를 향상시킨다. 논문은 결정적, 평균, 편차 3가지 오류 경계식을 이론적으로 증명하고, 인공·실제 데이터 …

저자: Tianyi Zhou, Dacheng Tao

양측 랜덤 투영을 이용한 초고속 저랭크 근사
본 논문은 고밀도 행렬 X에 대해 저랭크 근사를 빠르게 수행하는 새로운 프레임워크인 양측 랜덤 투영(Bilateral Random Projections, 이하 BRR)을 제안한다. 기존 연구는 주로 열 공간만을 랜덤하게 샘플링해 SVD를 근사하는 방법(예: randomized SVD)이나 열 선택 기반 방법에 초점을 맞추었다. 반면, 저자는 X의 좌·우 양쪽에서 독립적인 랜덤 매트릭스 A₁∈ℝⁿˣʳ, A₂∈ℝᵐˣʳ 를 이용해 Y₁ = X A₁, Y₂ = Xᵀ A₂ 라는 두 개의 투영을 만든다. 이때 r은 목표 저랭크이며, 일반적으로 r+p (p≥2) 열을 사용해 오버샘플링한다. 핵심 근사식은  L = Y₁ ( A₂ᵀ Y₁ )⁻¹ Y₂ᵀ  (1) 이다. 여기서 (·)⁻¹는 r×r 행렬의 역이며, 연산 흐름은 다음과 같다. ① X와 A₁을 곱해 Y₁을 얻고, ② Y₁과 A₂ᵀ를 곱해 r×r 행렬 M = A₂ᵀ Y₁을 만든다, ③ M⁻¹를 구한 뒤 Y₂ᵀ와 곱해 최종 L을 산출한다. 전체 FLOP 수는 BRR 자체에 2 m n r, 그리고 (1) 단계에 r²(2n+r) 정도로, 밀집 행렬에 대해 SVD(≈2 m n min(m,n))보다 현저히 적다. 또한, A₁과 A₂를 단순 가우시안 행렬이 아니라 Y₂와 Y₁에서 직접 업데이트하는 “상호 업데이트” 전략을 제안한다. 구체적으로, 초기 A₁을 가우시안으로 잡고 Y₁을 만든 뒤 A₂←Y₁, 다시 Y₂←Xᵀ A₂, A₁←Y₂, 마지막으로 Y₁←X A₁을 재계산한다. 이 과정을 한 번 수행하면 Y₁, Y₂가 서로의 정보를 반영해 (1)의 근사 정확도가 크게 향상된다. 추가 연산량은 O(mnr) 정도이며, 전체 복잡도에 큰 영향을 주지 않는다. 특이값이 완만히 감소하는 경우, 기본 BRR은 정확도가 떨어질 수 있다. 이를 보완하기 위해 파워 스킴(power scheme)을 도입한다. q≥0인 정수에 대해  ˜X = (X Xᵀ)^{q} X = U Λ^{2q+1} Vᵀ  (2) 를 정의하고, ˜X에 동일한 BRR 과정을 적용한다. 파워 스킴은 특이값을 λ_i^{2q+1} 로 강화해 스펙트럴 갭을 확대하고, 오류 상한을 (2q+1) 제곱근에 비례해 감소시킨다. 최종 근사는  L = Q₁

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기