마르팅게일과 다중무장 밴딧을 위한 PAC 베이즈 분석

본 논문은 종속적인 확률 변수열, 특히 마르팅게일과 제한된 피드백 상황에서의 다중무장 밴딧 문제에 PAC‑베이즈 프레임워크를 적용하는 두 가지 새로운 방법을 제시한다. 첫 번째는 의존 변수의 볼록 함수 기대값을 독립 베르누이 변수의 기대값으로 상한하는 새로운 보조정리를 이용한 것이고, 두 번째는 전통적인 Hoeffding‑Azuma 부등식과 PAC‑베이즈 분석을 결합한 접근법이다. 이를 통해 일반화 경계와 기대 레그레트 상한을 도출했으며, 비록…

저자: Yevgeny Seldin, Franc{c}ois Laviolette, John Shawe-Taylor

본 논문은 PAC‑베이즈 이론을 종속적인 확률 변수열, 특히 마르팅게일과 제한된 피드백을 갖는 다중무장 밴딧 문제에 적용하는 두 가지 새로운 방법을 제시한다. 첫 번째 방법은 Lemma 1이라는 새로운 보조정리를 도입한다. 이 정리는

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기