감옥 딜레마 최저 유인 수준의 비평범한 결과
초록
본 논문은 감옥 딜레마에서 가장 낮은 유인값 T = 1이 단순히 무시해도 되는 경우가 아니라, 플레이어가 다중 상호작용을 할 때는 복잡한 동역학을 보인다는 점을 입증한다. 다윈 진화 전략(DES)과 파블로프 진화 전략(PES)을 적용해 시뮬레이션한 결과, DES에서는 협력, 혼돈, 결함 세 가지 상전이가 나타나고, PES에서는 협력과 준규칙적( quasi‑regular) 두 가지 상전이가 관찰된다.
상세 분석
이 연구는 전통적으로 “T = 1은 협력자와 배신자가 구분되지 않아 게임이 의미 없게 된다”는 가정을 재검토한다. 저자들은 각 에이전트가 네트워크 상에서 다수의 이웃과 동시에 게임을 수행하도록 모델을 확장했으며, 이때 발생하는 집합적 상호작용이 개별 2인 게임과는 전혀 다른 거시적 거동을 만든다는 점을 강조한다. 두 가지 진화 규칙을 도입했는데, 첫 번째인 다윈 진화 전략(Darwinian Evolutionary Strategy, DES)은 각 에이전트가 인접한 이웃 중 가장 높은 적합도를 가진 전략을 복제하는 방식이다. 두 번째인 파블로프 진화 전략(Pavlovian Evolutionary Strategy, PES)은 ‘승리‑유지, 패배‑전환’ 원칙에 따라 자신의 직전 라운드 결과에 따라 전략을 바꾸는 규칙이다.
시뮬레이션은 주로 정규 격자와 무작위 그래프 두 종류의 네트워크에서 수행되었으며, 초기 조건으로는 무작위로 할당된 협력자와 배신자 비율을 사용했다. DES 하에서는 T = 1임에도 불구하고, 인구 전체가 협력으로 수렴하는 ‘협력 단계’, 협력자와 배신자가 복잡하게 뒤섞여 시간에 따라 변동하는 ‘혼돈 단계’, 그리고 대부분이 배신자로 고착되는 ‘결함 단계’가 각각 파라미터(특히 초기 협력 비율)와 네트워크 연결도에 따라 나타났다. 특히, 혼돈 단계에서는 국소적인 협력 클러스터가 지속적으로 생성·소멸하면서 전체 시스템의 평균 협력도는 일정한 평균값을 유지하지만 변동성이 크게 나타났다.
PES에서는 DES와 달리 ‘준규칙적 단계’가 새롭게 등장한다. 이 단계는 시스템이 완전한 협력이나 완전한 결함으로 수렴하지 않고, 일정한 주기 혹은 확률적 패턴을 보이며 협력과 배신이 교대로 나타나는 현상이다. 이는 파블로프 규칙이 개인의 직전 결과에 민감하게 반응함으로써, 작은 국소 변동이 전체 네트워크에 파동처럼 전파되어 지속적인 동적 균형을 만든다. 또한, PES 하에서는 협력 단계가 DES보다 넓은 파라미터 영역에서 유지되는데, 이는 파블로프 규칙이 ‘승리‑유지’ 메커니즘을 통해 협력 클러스터를 보다 강하게 보호하기 때문이다.
결과적으로, T = 1이라는 최저 유인값이 단순히 “게임이 무의미하다”는 결론을 내릴 수 없으며, 상호작용 구조와 진화 규칙에 따라 매우 풍부한 동역학을 보여준다. 이는 기존의 2인 게임 분석이 다중 상호작용 네트워크에서의 진화적 결과를 과소평가했을 가능성을 시사한다. 또한, DES와 PES가 각각 다른 상전이와 안정성을 제공한다는 점은 실제 사회·생물학적 시스템에서 전략 선택 메커니즘이 어떻게 다양하게 작용할 수 있는지를 이해하는 데 중요한 통찰을 제공한다.
댓글 및 학술 토론
Loading comments...
의견 남기기