SUN DSBO 비볼록 분산 확률 이중 최적화를 위한 구조화 통합 프레임워크
초록
본 논문은 상위·하위 목표 모두 비볼록일 수 있는 분산 확률 이중 최적화(DSBO) 문제를 다룬다. 제안된 SUN‑DSBO 프레임워크는 기존의 강한 볼록성 가정 없이도 선형 속도 향상을 보장하며, 특히 그래디언트 트래킹(GT) 기법을 적용한 SUN‑DSBO‑GT는 에이전트 수에 비례한 속도 향상을 입증한다. 이론적 수렴 분석과 실험을 통해 제안 방법의 효율성을 확인한다.
상세 분석
SUN‑DSBO는 비볼록 하위 레벨 목표를 포함하는 DSBO 문제를 Moreau envelope 기반 페널티 형태로 변형한 뒤, 이를 최소‑최대 형태(5)로 재구성한다. 이 변형은 (i) L2‑smoothness 가정 하에 하위 목표의 최적조건 ∇y G(x,y)=0와 동치가 되며, (ii) 상위·하위 목표가 선형으로 결합된 비볼록‑강볼록(min‑max) 구조를 제공한다. 이러한 구조는 각 에이전트가 로컬 샘플을 이용해 ˆDkθ,i, ˆDkx,i, ˆDky,i와 같은 스토캐스틱 추정치를 계산하고, GT, EXTRA, Exact‑Diffusion 등 다양한 분산 합의 메커니즘으로 추정치를 교정(Dk)할 수 있게 한다. SUN‑DSBO‑SE는 단순한 적응‑후‑결합(ATC) 형태의 분산 SGD를 적용해 통신 비용을 최소화하고, SUN‑DSBO‑GT는 GT 업데이트 Dk = W · (Dk‑1 + ˆDk − ˆDk‑1) 로 데이터 이질성을 효과적으로 완화한다. 이론적 분석에서는 (1) F가 하한을 갖는다는 가정, (2) 각 f_i, g_i가 L1, L2‑smooth이며 stochastic oracle가 편향이 없고 유한 분산을 가진다는 가정, (3) W가 대칭·이중확률 행렬이며 스펙트럼 갭 1‑ρ>0을 만족한다는 네트워크 가정을 사용한다. 이러한 가정 하에, μ_k를 점진적으로 감소시키며 μ_k→0인 경우, SUN‑DSBO‑GT는 에이전트 수 n에 대해 O(1/√(nK)) 형태의 수렴 속도를 달성하고, 이는 기존 강볼록 가정 기반 DSBO 방법보다 일반적인 비볼록 설정에서도 선형 스피드업(linear speedup)을 보장한다. 특히, 기존 방법이 요구하던 gradient boundedness나 gradient heterogeneity에 대한 별도 제한을 없애고, 복합적인 비볼록‑비강볼록 문제에서도 안정적인 수렴을 증명한다. 실험에서는 패션MNIST 데이터 클리닝 태스크에 두 개의 MLP 레이어를 사용해 α∈
댓글 및 학술 토론
Loading comments...
의견 남기기