에지와 함께하는 밴딧

이 논문은 그래프 구조 위에서 노드 간 차이값만 관측 가능한 밴딧 문제를 제안하고, PAC 설정에서 근사 최적 노드를 찾기 위한 샘플 복잡도를 그래프의 지름과 구조에 따라 분석한다. 선형, 트리, 일반 그래프에 대해 알고리즘을 제시하고, 낮은 직경을 가진 그래프가 샘플 효율이 크게 향상됨을 보인다.

저자: Dotan Di Castro, Claudio Gentile, Shie Mannor

에지와 함께하는 밴딧
본 논문은 그래프 위에서 노드 간 차이값만 관측 가능한 새로운 밴딧 문제를 정의하고, PAC(Probably Approximately Correct) 설정에서 근사 최적 노드를 찾기 위한 샘플 복잡도를 그래프 구조에 따라 체계적으로 분석한다. 1. **문제 정의 및 모델** - 무방향 연결 그래프 G=(V,E) 가 주어지고, 각 노드 i∈V 에는 숨겨진 보상 r_i 가 존재한다. - 직접 보상을 관측할 수 없으며, 인접 노드 i와 j 사이의 에지를 샘플링하면 차이값 r_j−r_i 에 대한 확률적 신호 E_{ij} 를 얻는다. 신호는 평균이 정확히 차이값이며, 값은

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기