동적 후회와 전환 비용의 관계: 온라인 알고리즘 vs 온라인 볼록 최적화

본 논문은 전환 비용을 포함한 동적 후회 지표를 새롭게 정의하고, 이를 온라인 알고리즘(OA)과 온라인 볼록 최적화(OCO) 두 분야에 적용한다. 분석 결과, 전환 비용은 OA의 동적 후회에 큰 영향을 미치지만 OCO에서는 영향을 주지 않으며, OCO의 경우 전환 비용이 있든 없든 동일한 하한(Ω(√T D+√T))을 가진다.

저자: Yawei Zhao, Qian Zhao, Xingxing Zhang

본 논문은 온라인 의사결정 문제에서 “동적 후회(dynamic regret)”와 “전환 비용(switching cost)”을 동시에 고려하는 새로운 이론적 프레임워크를 제시한다. 연구 동기는 기존 연구가 동적 환경에서의 후회는 다루었지만, 전환 비용이 포함된 경우 두 주요 온라인 설정—Online Algorithms (OA)와 Online Convex Optimization (OCO)—에 미치는 영향을 체계적으로 분석하지 못했다는 점에 있다. **1. 배경 및 문제 정의** OA와 OCO는 각각 손실 함수를 사전에 알 수 있는 경우와 알 수 없는 경우로 구분된다. OA는 경쟁 비율(competitive ratio)로 성능을 평가하고, OCO는 정적 혹은 동적 후회(regret)로 평가한다. 동적 후회는 최적(offline) 전략이 시간에 따라 변할 수 있는 제약 D(동적 예산)를 허용한다. 전환 비용은 연속적인 결정 사이의 거리 ‖x_{t+1}−x_t‖^σ 로 모델링되며, σ∈

동적 후회와 전환 비용의 관계: 온라인 알고리즘 vs 온라인 볼록 최적화

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기