정규 무한 게임에서의 선행 정도

정규 무한 게임에서의 선행 정도

초록

이 논문은 두 플레이어가 번갈아 가며 움직이는 정규 무한 게임에서, 두 번째 플레이어가 상대의 움직임을 일정 단계 앞서 볼 수 있는 ‘선행(lookahead)’을 허용한 변형을 연구한다. 선행을 무한히 큰 유한 크기로 허용하는 연속 전략과, 사전에 정해진 상한을 가진 제한된 선행 전략을 구분하고, 정규 게임에서는 연속 전략이 언제든지 제한된 선행 전략으로 변환될 수 있음을 보인다. 변환에 필요한 최대 선행 크기는 입력으로 주어진 파리티 자동화기의 크기에 대해 이중 지수적이며, 이러한 결정 가능성은 컨텍스트 자유 ω-언어로 정의된 비정규 게임에서는 성립하지 않음을 보여준다.

상세 분석

정규 무한 게임은 보통 두 플레이어가 무한히 교대로 움직이며, 승패는 무한 문자열이 특정 ω-정규 언어에 속하는지 여부로 결정된다. 기존 연구에서는 각 턴마다 즉시 반응하는 전략을 전제로 했지만, 실제 분산 시스템에서는 통신 지연이나 버퍼링으로 인해 상대의 선택을 일정 시간 앞서 관찰할 수 있다. 논문은 이러한 현실을 모델링하기 위해 ‘선행’이라는 개념을 도입한다. 선행은 두 번째 플레이어가 상대의 현재 및 과거 움직임을 보고, 일정 수의 미래 입력을 미리 알고 결정할 수 있는 능력이다.

선행을 두 가지 수준으로 구분한다. 첫 번째는 ‘연속 전략(continuous strategy)’으로, 선행의 크기가 유한하지만 사전에 고정되지 않은 경우이다. 즉, 플레이어는 언제든지 필요한 만큼의 입력을 미리 볼 수 있지만, 그 크기가 무한히 커질 가능성은 배제한다. 두 번째는 ‘제한된 선행(bounded lookahead)’ 전략으로, 선행의 최대 길이가 사전에 정해진 상수 k 로 제한된다. 이때 k 가 충분히 크면 연속 전략과 동등한 표현력을 갖는다.

핵심 기술은 두 전략 사이의 등가성을 증명하는 것이다. 저자들은 파리티 자동화기로 표현된 정규 승리 조건을 입력으로 받아, 연속 전략이 존재하면 반드시 어떤 유한 상수 k 가 존재해 제한된 선행 전략으로 변환할 수 있음을 보인다. 변환 과정은 자동화기의 상태 공간을 확장해 ‘예측 상태(predictive state)’를 만들고, 각 예측 상태에서 가능한 입력 블록을 미리 시뮬레이션한다. 이때 필요한 최대 선행 길이는 자동화기의 상태 수 n 에 대해 2^{2^{O(n)}} 로, 이중 지수적 상한을 갖는다.

또한, 결정 가능성 결과를 얻기 위해 ‘연속 전략 존재 여부’를 자동화론적 방법으로 검사한다. 구체적으로, 원래 게임을 ‘지연 게임(delayed game)’으로 변환하고, 이 변환된 게임의 승리 조건을 다시 파리티 자동화기로 표현한다. 그런 다음 기존의 파리티 게임 해결 알고리즘을 적용해 연속 전략의 존재를 2EXPTIME 시간 안에 판정한다.

반면, 승리 조건이 컨텍스트 자유 ω-언어인 경우에는 동일한 결과가 성립하지 않는다. 저자들은 CFL 기반 ω-언어에 대해 연속 전략은 존재하지만 제한된 선행 전략은 존재하지 않을 수 있음을 구체적인 반례를 통해 제시한다. 이는 선행의 제한이 정규성에 크게 의존한다는 점을 강조한다.

이 논문의 의의는 두 가지이다. 첫째, 분산 시스템에서 흔히 발생하는 지연·버퍼링 현상을 형식적으로 모델링하고, 그에 대한 전략적 대응 가능성을 정량화했다는 점이다. 둘째, 정규 무한 게임의 경우 연속 전략이 항상 제한된 선행 전략으로 대체 가능하다는 강력한 구조적 결과를 제공함으로써, 알고리즘 설계 시 복잡한 비정형 선행을 고려할 필요가 없음을 증명했다.