ROSS 샤플리 값을 이용한 강인한 분산 스토캐스틱 학습
초록
본 논문은 중앙 서버 없이 에이전트들이 협업하는 분산 학습 환경에서 데이터 이질성·노이즈·중독 공격 등에 강인한 알고리즘인 ROSS를 제안한다. 각 라운드마다 에이전트는 자신의 로컬 그래디언트와 이웃의 교차‑그래디언트를 수집하고, 이를 샤플리 값으로 가중하여 모멘텀 방식으로 모델을 업데이트한다. 이론적으로 선형 수렴 속도와 속도 향상을 증명했으며, 다양한 공개 데이터셋 실험을 통해 기존 방법 대비 수렴 속도와 예측 정확도에서 우수함을 확인하였다.
상세 분석
ROSS 알고리즘의 핵심은 “교차‑그래디언트”와 “샤플리 값 기반 가중치”라는 두 축을 결합한 점에 있다. 교차‑그래디언트는 이웃 에이전트가 보유한 데이터에 대해 현재 로컬 모델을 평가한 미분값으로, 기존의 단순 평균이나 모멘텀 방식이 놓치는 데이터 간 상호보완성을 포착한다. 그러나 모든 이웃의 교차‑그래디언트를 동일하게 취합하면, 비IID 혹은 악의적인 데이터가 포함된 경우 전체 업데이트가 편향될 위험이 있다. 여기서 샤플리 값이 도입된다. 샤플리 값은 협동 게임 이론에서 각 플레이어(에이전트)의 평균 한계 기여도를 계산하는 방법으로, 모든 가능한 부분집합(코알리션)에서의 기여도를 평균함으로써 공정성을 보장한다. ROSS는 각 라운드마다 로컬 검증 데이터셋 Q를 이용해 이웃들의 교차‑그래디언트가 전체 손실 감소에 얼마나 기여했는지를 평가하고, 그 결과를 샤플리 값 φᵢⱼ 로 변환한다. 이 φᵢⱼ 은 가중치로 사용되어, 기여도가 높은 이웃의 그래디언트는 크게 반영되고, 기여도가 낮거나 악의적인 이웃은 자동으로 억제된다.
수학적으로는 전체 목표 함수 F(x)=1/N∑ᵢ fᵢ(x) 를 최소화하는 문제를, 각 에이전트 i가 다음과 같이 업데이트한다:
xᵢ^{t}=∑{j∈Nᵢ} ω{ij}·xⱼ^{t-1} - η·
댓글 및 학술 토론
Loading comments...
의견 남기기