온라인 반무한 선형계획 효율 알고리즘 함수 근사 활용
본 논문은 제한된 차원의 의사결정 변수와 무한히 많은 제약을 동시에 다루는 온라인 반무한 선형계획(OSILP) 문제를 제시하고, 제약을 고정된 차원 q 개의 비음수 기저 함수로 근사함으로써 제약 수에 독립적인 regret O(q√T)와 O((q+q log T)√T)를 달성하는 새로운 듀얼 기반 알고리즘을 개발한다. 또한 GPG 가정 하에 두 단계 알고리즘을 제안해 O(q log T+q/ε) regret을 얻는다. 실험을 통해 제약 수가 많을 때…
저자: Yiming Zong, Jiashuo Jiang
본 논문은 제한된 차원의 의사결정 변수 x∈ℝ^T 와 무한히 많은 제약을 동시에 만족시켜야 하는 온라인 반무한 선형계획(OSILP) 문제를 공식화한다. 시간 t 마다 스토캐스틱 입력 (r_t, a_t) 가 i.i.d. 혹은 랜덤 퍼뮤테이션 방식으로 주어지고, 의사결정자는 즉시 x_t∈
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기