투사 단계 없는 볼록 최적화와 희소 저랭크 근사

본 논문은 컴팩트한 볼록 집합 위에서 투사 없이 진행되는 프랭크‑울프(FW) 기반 1차 최적화 알고리즘을 제안한다. 선형화된 서브문제를 풀어 방향을 얻으며, ε 정확도에 O(1/ε) 반복으로 이중갭을 ε 이하로 만든다. l₁ 정규화, 단순체, 트레이스 제한 SDP, 대각 우위 행렬, 핵노름·맥스노름 등 다양한 분야에 적용해 희소성·저랭크 해의 최적 차원을 Θ(1/ε)로 보장한다. 실험에서는 넷플릭스 데이터셋을 이용한 대규모 행렬 완성 문제에서 …

저자: Martin Jaggi

본 논문은 “투사 단계 없는 볼록 최적화”라는 주제로, 컴팩트하고 볼록한 도메인 D ⊂ ℝⁿ 위에서 볼록 함수 f를 최소화하는 일반적인 문제를 다룬다. 전통적인 1차 방법은 매 반복마다 투사 연산을 수행해 현재 점을 D 안으로 되돌려야 하지만, 이는 특히 반정밀도 행렬(예: PSD 행렬)에서 고비용이다. 저자는 프랭크‑울프(FW) 알고리즘을 기반으로, 현재 점 xₜ에서 서브그라디언트 dₓₜ ∈ ∂f(xₜ)를 구하고, 이를 이용해 선형화된 서브문제 min_{y∈D} ⟨y, dₓₜ⟩ 를 푼다. 이 서브문제의 최적 해 sₜ는 D 안에 있으므로, 새로운 점은 xₜ₊₁ = (1−γₜ) xₜ + γₜ sₜ 와 같이 정의한다. 여기서 γₜ는 고정 스텝 사이즈 혹은 라인 서치를 통해 선택한다. 이 과정은 투사 없이도 항상 D 안에 머무른다. 논문은 먼저 서브그라디언트와 약한 이중성(ω(x)=min_{y∈D} f(x)+⟨y−x,dₓ⟩)을 정의하고, ω(x) ≤ f(y) ∀y∈D 를 증명한다. 이를 바탕으로 현재 이중갭 gₜ = f(xₜ)−ω(xₜ) 를 계산하고, gₜ가 ε 이하가 될 때까지 반복한다. 수렴 분석에서는 함수의 곡률 상수 C_f를 도입한다. C_f는 C_f = sup_{x,s∈D,γ∈

투사 단계 없는 볼록 최적화와 희소 저랭크 근사

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기