연속 시공간 다중에이전트 시스템의 확률 최적 제어

연속 시공간 다중에이전트 시스템의 확률 최적 제어
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

연속적인 비선형 동역학과 가우시안 잡음이 존재하는 다중 에이전트 시스템에서, 각 에이전트가 독립적으로 목표를 배분받아 비용을 최소화하도록 하는 최적 제어법을 제시한다. 최적 제어는 개별 에이전트‑목표 쌍에 대한 최적 제어를 가중합한 형태이며, 이는 그래프 모델 추론 문제와 동등함을 보인다. 계산 복잡도는 그래프의 트리폭에 지수적으로 의존하지만, 실제 시뮬레이션에서 42개 에이전트까지 효율적으로 적용 가능함을 확인하였다.

상세 분석

본 논문은 Kappen(2005)이 제시한 연속 시공간 확률 최적 제어 이론을 다중 에이전트 시스템에 확장한다. 각 에이전트 i는 비선형 동역학 (\dot{x}_i = f_i(x_i)+u_i + \xi_i) (여기서 (\xi_i)는 가우시안 백색 잡음) 를 따르며, 제어 입력 (u_i)는 비용 함수 (J = \int_0^T


댓글 및 학술 토론

Loading comments...

의견 남기기