정보 이론 기반 제한 합리성

본 논문은 제한된 계산·시간·정보 자원을 고려한 의사결정 모델을 정보 이론적 자유 에너지 함수로 정형화한다. 단일 단계와 순차적 의사결정 모두에 적용 가능한 프레임워크를 제시하고, 기존 기대효용·미니맥스·익스펙트맥스 등 전통적 규칙을 특수 경우로 포함한다. 또한 역전파 샘플링과 같은 정확한 몬테카를로 플래너를 통해 전면 탐색 없이 최적에 근접하는 해를 얻을 수 있음을 보인다.

저자: Pedro A. Ortega, Daniel A. Braun, Justin Dyer

논문은 먼저 제한 합리성의 필요성을 경제학·인공지능·강화학습·신경과학 분야에서 제시한다. 전통적인 주관적 기대효용(SEU) 이론은 무한한 계산 능력을 전제로 하지만, 실제 에이전트는 정책 공간이 방대하거나 환경이 불완전하게 관측될 때 전면 탐색이 불가능하다. 이러한 문제를 해결하기 위해 저자들은 “정보‑이론적 제한”이라는 새로운 관점을 도입한다. 2장에서는 SEU와 변분 원리를 복습하고, 두 플레이어 게임을 통해 ‘확실성 등가물(certainty‑equivalent)’ 개념을 소개한다. 이어서 정보 제한을 메타‑추론, 중단된 사고, 효용‑정보 가중치라는 세 가지 핵심 개념으로 정형화한다. 여기서 핵심은 정책 선택에 대한 사전 P 와 실제 선택 분포 Q  사이의 KL 발산을 비용 항으로 포함시키는 것이다. 3장에서는 자유 에너지(F) = E_Q

정보 이론 기반 제한 합리성

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기