다른 사람의 예측을 예측하고 조작하기 연속시간 LQG 게임 정확한 균형 해법
본 논문은 행동이 상대방의 신호를 재구성하는 연속시간 선형‑이차(LQG) 게임에서, 무한 단계의 신념 계층을 원시 충격을 추정함으로써 결정론적 임펄스‑응답 맵으로 수축시키고, 고정점 방정식으로 정확한 나시 균형을 도출한다. 정보 쐐기 V_it 를 도입해 상대방 사후확률을 이동시키는 한계 가치를 가격화하고, 정보 공유의 복지 효과가 상태 추정 개선보다 신념 조작 제거에 크게 기인함을 보인다. 또한 비효율적 플레이어에게 정보를 집중하는 것이 효율적…
저자: Sam Babichenko
본 논문은 행동이 상대방의 관측 신호를 직접 재구성하는 상황에서, 각 에이전트가 최적 반응을 결정하기 위해 무한히 깊은 신념‑신념(“신념에 대한 신념”) 계층을 필요로 하는 문제를 다룬다. 기존 연구는 이 계층을 차원 축소하거나 대규모 인구 한계에 의존해 근사했지만, 저자는 원시 충격 W₀(기본 상태 변동), W₁, W₂(각 플레이어의 관측 잡음) 자체를 추정 대상으로 삼아, 모든 고차 기대값을 결정론적 임펄스‑응답 맵에 투영한다. 이 과정에서 “노이즈‑상태”(noise‑state) cW_i t(u)=E
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기