정보이론적 제한합리성의 적대적 해석
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.
초록
본 논문은 정보이론적 자유에너지 최적화가 실제로는 에이전트와 가상의 적대자 사이의 제로섬 게임과 동등함을 보인다. 레전드르‑펜첼 변환을 이용해 KL‑다이버전스 정규화 항을 적대적 비용 함수로 재표현하고, 최적 적은 에이전트를 모든 행동에 대해 무차별하게 만들도록 비용을 배분한다. 이 과정에서 얻어지는 확률적 정책은 Nash 균형의 한 형태이며, 자유에너지 최적화가 게임이론과 깊이 연결됨을 증명한다.
상세 분석
논문은 먼저 전통적인 기대효용 이론과 정보이론적 제한합리성(IT bounded rationality)의 차이를 명확히 구분한다. 기대효용은 정책에 대한 선형 목표함수이며, 최적 정책은 항상 결정론적(디터미니스틱) 형태를 취한다. 반면 자유에너지(F) = E
댓글 및 학술 토론
Loading comments...
의견 남기기