보편 인공지능의 기대 효용 수렴성 문제
이 논문은 모든 계산 가능한 환경을 가정한 보편 인공지능 모델에서, 효용 함수가 상한이 없을 경우 어떤 정책을 선택하더라도 기대 효용이 정의되지 않거나 무한히 발산한다는 정리를 제시한다. 핵심 가정은 환경에 대한 사전 확률이 모든 계산 가능한 함수에 양의 질량을 부여하고, 효용 함수가 인식 시퀀스에 대해 계산 가능하게 하한·상한을 근사할 수 있다는 것이다.
저자: Peter de Blanc
이 논문은 보편 인공지능(Universal AI) 프레임워크에서 기대 효용의 수렴성을 분석한다. 에이전트와 환경은 이산 시간 단계에서 상호작용하며, 행동 집합 Y와 관찰 집합 X는 자연수의 부분집합으로 정의된다. 환경은 함수 Q: Y* → X 로 모델링되고, 에이전트 정책 p는 과거 행동·관찰 문자열을 입력으로 다음 행동을 결정한다. 기대 효용은 조건부 기대값 E
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기