지능적 에스컬레이션과 상대성 원리
초록
본 논문은 무한 순차 게임인 0‑1 게임을 통해 에스컬레이션 현상이 지능적인 행동으로 설명될 수 있음을 보인다. 알고리즘적 사고와 반성적 사고를 구분하고, 내부와 외부 시점에 따라 합리성 판단이 달라지는 ‘상대성 원리’를 제안한다.
상세 분석
논문은 먼저 전통적인 게임 이론에서 “에스컬레이션”이 비합리적이라고 여겨지는 배경을 설명한다. 기존 연구는 유한 게임에 대한 역방향 귀납법(backward induction)을 적용해 최적 전략을 도출하고, 무한 게임에서는 이를 단순히 “잘라서” 유한화한 뒤 결과를 외삽한다는 오류를 지적한다. 저자는 이러한 접근이 연속성 가정에 위배된다고 비판하며, 무한 구조에 대한 올바른 논리적 도구로서 공동귀납(coinduction) 을 제시한다.
0‑1 게임은 두 명의 플레이어 A와 B가 각각 ‘아래(d)’와 ‘오른쪽(r)’ 두 선택을 반복하는 무한 트리 구조로 정의된다. 게임은 다음과 같은 동형식으로 표현된다:
Game ≃ ℝ^P + P × Game × Game
여기서 P={A,B}이며, 각 노드는 현재 플레이어와 두 서브게임을 가리킨다. 전략 프로파일은 선택 라벨을 각 노드에 붙인 형태이며, 동일한 동형식 StratProf ≃ ℝ^P + P × Choice × StratProf × StratProf 로 정의된다.
공동귀납을 이용해 무한 전략 프로파일이 존재함을 보이고, 특히 “계속(continue)” 선택을 무한히 반복하는 전략이 합리적인 서브게임 완전 균형(Subgame Perfect Equilibrium, SPE) 중 하나임을 증명한다. 이는 전통적인 “합리적 에이전트는 에스컬레이션을 피한다”는 명제와 정면으로 충돌한다.
저자는 합리성을 두 단계로 구분한다. **알고리즘적 사고(algorithmic mind)**는 즉각적인 최적 선택을 계산하는 과정으로, 0‑1 게임에서는 ‘계속’ 선택을 반복하는 것이 이 단계에 해당한다. **반성적 사고(reflective mind)**는 자신의 선택을 메타 수준에서 검토하고, 장기적인 결과를 평가하는 과정이다. 에스컬레이션 상황에서는 내부 에이전트가 알고리즘적 사고만을 사용해 ‘계속’ 전략을 정당화하지만, 외부 관찰자는 반성적 관점에서 이를 비합리적으로 판단한다.
이러한 시점 차이를 “상대성 원리”라 명명한다. 즉, 내부(에이전트)와 외부(관찰자)의 관점에 따라 합리성 판단이 달라진다는 주장이다. 이는 컴퓨터 과학에서 분산 시스템의 내부/외부 시점 차이와 유사하게, 게임 이론에서도 동일한 논리적 구조가 적용될 수 있음을 시사한다.
마지막으로, 논문은 경제학에서 버블과 변동성(burst) 현상이 무한 시간 척도에서 발생한다는 실증적 증거와 연결한다. 기존 경제 모델이 전제하는 연속성 가정이 깨지는 경우, 공동귀납적 접근이 보다 현실적인 예측을 가능하게 한다는 점을 강조한다. 전체적으로 논문은 무한 게임 분석에 공동귀납을 도입함으로써, 에스컬레이션을 지능적·합리적 행동으로 재해석하고, 관점에 따른 합리성의 상대성을 체계화한다.
댓글 및 학술 토론
Loading comments...
의견 남기기