cs.GT 2008-07-01 2

새로운 NormalHedge 알고리즘과 잠재 변수 추정에의 적용

본 논문은 지수 가중치를 사용하지 않고, 마스터 알고리즘과 각 전문가 간의 후회(regret)를 기반으로 가중치를 부여하는 NormalHedge라는 온라인 학습 알고리즘을 제안한다. 할인된 누적 이득을 기준으로 후회가 양수인 전문가에게만 비례 가중치를 주며, 모든 전문가에 대해 후회가 일정 상수 이하로 유지됨을 증명한다. 또한 이 알고리즘을 베이즈 평균 대신에 사용해 잠재 확률 변수 추정, 특히 HMM 학습에 적용하는 아이디어를 제시한다.

저자: Yoav Freund, Daniel Hsu

본 논문은 온라인 학습에서 흔히 사용되는 지수 가중치(Hedge) 방식과는 다른 새로운 알고리즘, NormalHedge를 제안한다. 문제 설정은 N개의 전문가(또는 전략)와 자연(Nature) 사이의 반복 게임으로, 각 라운드 j에서 헤더는 확률 분포 p_{j,i}를 선택하고, 자연은 각 전문가 i에 대해 이득 g_{j,i}∈

새로운 NormalHedge 알고리즘과 잠재 변수 추정에의 적용

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기