분산 쌍별 함수 최적화를 위한 가십 듀얼 어버리징

본 논문은 센서·IoT 등 분산 네트워크에서 데이터가 노드에 분산된 상태로 정의되는 쌍별 손실 함수를 효율적으로 최소화하기 위해, 동기식·비동기식 두 환경 모두에 적용 가능한 가십 기반 듀얼 어버리징 알고리즘을 제안한다. 제안 방법은 기존 중앙집중형 듀얼 어버리징의 수렴 속도를 유지하면서, 데이터 전파에 의해 발생하는 편향(bias) 항을 제어한다. AUC 최대화와 거리 메트릭 학습 실험을 통해 실용성을 입증한다.

저자: Igor Colin, Aurelien Bellet, Joseph Salmon

**1. 서론** 최근 사물인터넷·센서 네트워크와 같은 완전 분산 환경이 확대되면서, 중앙 서버 없이 각 노드가 자체 데이터를 보유한 채 전역 모델을 학습하는 문제의 중요성이 대두되고 있다. 기존의 분산 최적화 기법은 주로 개별 데이터에 대한 손실 \(f(\theta;x_i)\) 의 평균을 최소화하는 형태에 초점을 맞추었으며, 이를 위해 각 노드가 자신의 그라디언트를 계산하고 이웃과 교환한다. 그러나 **쌍별 함수** \(f(\theta;x_i,x_j)\) 는 두 데이터 포인트 사이의 관계를 모델링하므로, 각 항이 두 노드에 동시에 의존한다. 이로 인해 기존 알고리즘을 그대로 적용하면 데이터 교환량이 급증하거나, 무편향 그라디언트 추정이 불가능해지는 문제가 발생한다. **2. 문제 정의 및 사전 지식** 논문은 무방향 연결 그래프 \(G=(V,E)\) 위에 \(n\) 개의 노드가 존재한다고 가정한다. 각 노드 \(i\) 는 하나의 데이터 포인트 \(x_i\) 를 보유한다. 목표는 \

분산 쌍별 함수 최적화를 위한 가십 듀얼 어버리징

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기