적대적 다중무장 밴딧에서 프라이버시 달성
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.
초록
본 논문은 적대적 다중무장 밴딧 문제에 대해 ε‑차등프라이버시를 보장하면서 기존 최선의 O(T2⁄3/ε) 수준의 레지트를 O(√T·log T/ε) 로 개선한다. 핵심은 EXP3에 라플라스 잡음을 결합한 DP‑EXP3‑Lap 알고리즘이며, EXP3 자체가 내재하는 지수 메커니즘을 활용해 프라이버시 손실을 √log T 수준으로 낮추고, 미니배치 방식의 EXP3τ를 통해 적응형 적대자에 대해서도 O(T2⁄3) 레지트를 달성한다. 실험을 통해 이론적 경계가 실제에서도 유효함을 확인한다.
상세 분석
논문은 먼저 적대적 밴딧 설정에서 차등프라이버시를 달성하기 위한 두 가지 접근법을 제시한다. 첫 번째는 임의의 밴딧 알고리즘 Λ에 라플라스 잡음을 추가하는 DP‑Λ‑Lap 프레임워크이다. 여기서는 각 라운드에서 관측된 보상 g_{I_t,t}에 스케일 1/ε의 라플라스 노이즈 N_{I_t,t}를 더하고, 잡음이 일정 구간
댓글 및 학술 토론
Loading comments...
의견 남기기