전쟁 카드게임의 유한성 증명
초록
본 논문은 전통적인 ‘전쟁’ 카드게임에서 승리한 카드의 반환 순서를 가끔씩 바꾸는 규칙을 도입했을 때, 게임이 무한히 지속될 가능성이 없으며 평균 게임 길이가 유한함을 수학적으로 증명한다. 이를 위해 모든 가능한 상태 전이 그래프를 구성하고, 각 초기 구성에서 종료 상태(한 플레이어가 카드가 없는 상황)로 가는 경로가 존재함을 보인다.
상세 분석
전쟁 게임은 52장의 카드(또는 일반적인 n장의 카드)를 두 플레이어에게 무작위로 나눠 주고, 매 라운드마다 각자 최상위 카드를 공개한다. 높은 카드를 낸 플레이어가 두 장을 차례대로 자신의 손바닥 아래에 넣는다. 기존 규칙에서는 반환 순서가 고정되어 있어 “내 카드 → 상대 카드” 혹은 “상대 카드 → 내 카드” 중 하나를 선택한다. 이 고정 순서 하에서는 특정 초기 배치가 무한 순환(cycle)을 형성해 게임이 영원히 종료되지 않을 수 있다는 것이 알려져 있다.
논문은 이러한 고정 순서의 한계를 극복하기 위해 “가끔씩” 반환 순서를 바꾸는 확률적 규칙을 도입한다. 구체적으로, 각 라운드마다 플레이어 A와 B가 각각 사전에 정해진 작은 확률 p_A, p_B(0<p≤1)로 순서를 교환할 수 있다. 이때 전체 시스템은 유한한 상태공간 S를 갖는 마코프 체인으로 모델링된다. 상태는 각 플레이어가 보유한 카드 순서의 전체 배열이며, 가능한 상태 수는 (2n)!/(n!·n!) 정도로 유한하다.
핵심 증명은 두 단계로 이루어진다. 첫째, 그래프 G=(S,E)에서 모든 상태 s∈S에 대해 종료 상태 t(한 플레이어가 카드가 없는 상태)로 가는 유향 경로가 존재함을 보인다. 이를 위해 “카드 수가 많은 플레이어가 승리할 때마다 그 플레이어의 카드 수가 최소 1씩 증가한다”는 단조성(monotonicity) 성질을 이용한다. 반환 순서를 적절히 선택하면, 현재 가장 많은 카드를 가진 플레이어가 상대보다 한 장 더 많이 확보하도록 강제할 수 있다. 반복 적용하면 결국 한 플레이어가 전체 카드를 독점하게 되고, 이는 즉시 종료 상태와 연결된다.
둘째, 마코프 체인의 흡수성(absorbing)과 유한 기대 흡수 시간(finite expected absorption time)을 보인다. 각 전이(edge)는 일정 확률 ≥p_min>0 로 선택될 수 있으므로, 임의의 경로가 길이 L인 경우 그 경로가 실제로 따라질 확률은 최소 p_min^L이다. 모든 상태에서 종료 상태까지의 최단 경로 길이를 d_max라 하면, 기대 흡수 시간은 O(d_max / p_min) 로 유계임을 얻는다. d_max는 상태공간의 크기에 비례하므로, 전체 기대 게임 길이는 유한하고, 실제로도 실험적으로 수천 라운드 이내에 종료되는 경향을 보인다.
결과적으로, 반환 순서를 가끔씩 바꾸는 작은 확률적 자유도만으로도 전쟁 게임의 무한 순환을 완전히 차단하고, 평균 게임 길이가 유한함을 엄밀히 증명한다. 이는 전통적인 결정론적 규칙이 갖는 비결정성 문제를 확률적 규칙을 통해 해결한 첫 사례라 할 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기