저비용 학습을 위한 능동형 데이터 구매 메커니즘
본 논문은 전략적 에이전트가 보유한 데이터를 예산 B 하에 온라인으로 구매하면서, 비용과 데이터가 임의로 상관될 수 있는 상황에서도 무후회(no‑regret) 학습 알고리즘을 활용해 위험을 O(1/√B) 수준으로 제한하는 메커니즘을 설계한다. 핵심 아이디어는 기존 무후회 알고리즘을 가격 제시(posted‑price)와 데이터 구매 메커니즘으로 변환하고, 중요도 가중치와 online‑to‑batch 변환을 이용해 학습 위험을 보장하는 것이다. 또…
저자: Jacob Abernethy, Yiling Chen, Chien-Ju Ho
본 논문은 전략적 에이전트가 보유한 데이터를 예산 B 하에 온라인으로 구매하면서, 비용과 데이터가 임의로 상관될 수 있는 상황에서도 무후회(no‑regret) 학습 알고리즘을 활용해 위험을 O(1/√B) 수준으로 제한하는 메커니즘을 설계한다. 연구 동기는 데이터가 금전적 가치를 가지고 거래되는 현실에서, 기존의 샘플 복잡도 이론이 데이터 양을 자원으로만 고려한다는 점을 넘어, 금전적 예산을 직접적인 제약으로 삼고 싶다는 요구에서 출발한다.
**문제 설정**
시간 t=1,…,T 에 걸쳐 에이전트 t 가 (c_t, z_t) 쌍을 가져온다. 여기서 z_t ∈ Z 는 학습에 사용될 데이터 포인트, c_t ∈
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기