에이전트 상호작용을 집합 교집합으로 보는 정보이론적 접근

본 논문은 “에이전트-상호작용을 문자열 집합의 교집합으로 모델링한다”는 기본 아이디어에서 출발한다. 1장 서론에서는 고전 정보 이론과 알고리즘 정보 이론(AIT)의 차이를 설명하고, Kolmogorov 복잡도 C(x) 와 보편 사전 m(x) 를 소개한다. 이어서 Hutter의 보편 인공지능(UAI)과 AIXI 모델을 언급하며, 현재까지 AIT가 인공지능 이론에 어떻게 적용되었는지를 정리한다. 2장에서는 에이전트를 길이 n 의 이진 문자열 집합 A, B 로 정의하고, 교집합 A∩B 를 가능한 상호작용 집합으로 설정한다. 비협조적 게임(예: 가위바위보, 체스)과 사이버네틱 에이전트 모델을 각각 집합 표현으로 변환한다. 비협조적 게임에서는 각 플레이어의 전략 집합을 정의하고, 교집합이 단일 문자열이면 결정론적 게임, 다중 문자열이면 불확실성을 나타낸다. 체스 예시에서는 Anatoly와 Boris 의 전략 함수를 각각 f_A, f_B 로 두고, 가능한 게임 시퀀스를 A, B 로 열거한다. 2.2절에서는 사이버네틱 에이전트 모델을 재구성한다. 에이전트 p 는 정책 함수 p: X*→Y* 로 정의되고, 환경 µ 는 확률 분포로 모델링된다. 시간 horizon m 과 난이도 임계값 τ 를 고정하여, 에이전트의 행동 히스토리를 A_p^m = { yx_{1:m} : y_{1:m}=p(x_{

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기