확률적 일반화 동적 게임의 결합 확률 제약에 대한 볼록 근사와 샘플링 기반 알고리즘

확률적 일반화 동적 게임의 결합 확률 제약에 대한 볼록 근사와 샘플링 기반 알고리즘
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 불확실성이 존재하고 결합 확률 제약이 포함된 확률적 일반화 동적 게임을 다룬다. 확률 제약을 기대값 제약으로 볼록하게 하향 근사하고, 이 근사 게임의 변분형 균형이 원래 게임의 ε‑SGNE임을 증명한다. 또한 분포 정보를 필요로 하지 않는 시간 가변 스텝 사이즈 샘플링 기반 반분산 알고리즘을 제안하여, 의사그라디언트의 단조성 가정 하에 거의 확실히 수렴함을 보인다.

상세 분석

이 연구는 동적 시스템에 대한 다중 에이전트 상호작용을 확률적 일반화 게임(framework of stochastic generalized dynamic games, SGDG) 형태로 모델링한다. 각 에이전트는 선형 시불변이 아닌 시간 가변 시스템에 대한 제어 입력을 선택하고, 시스템 상태는 외생 잡음 wₜ에 의해 영향을 받는다. 중요한 점은 잡음의 분포가 완전히 알려져 있지 않으며, 대신 ‘측정값 집중(concentration of measure, CoM)’ 특성을 만족한다는 가정이다. CoM은 고차원 확률 공간에서 Lipschitz 연속 함수가 평균값(또는 중앙값)에서 크게 벗어날 확률이 급격히 감소한다는 통계적 성질을 의미한다. 이를 이용해 원래의 확률 제약 P{ξ̄ⱼ(s,u,w)≤0}≥1−γⱼ 를 기대값 제약 E


댓글 및 학술 토론

Loading comments...

의견 남기기