Characterizing Positionality in Games of Infinite Duration over Infinite Graphs

📝 Abstract
We study turn-based quantitative games of infinite duration opposing two antagonistic players and played over graphs. This model is widely accepted as providing the adequate framework for formalizing the synthesis question for reactive systems. This important application motivates the question of strategy complexity: which valuations (or payoff functions) admit optimal positional strategies (without memory)? Valuations for which both players have optimal positional strategies have been characterized by Gimbert and Zielonka for finite graphs and by Colcombet and Niwiński for infinite graphs. However, for reactive synthesis, existence of optimal positional strategies for the opponent (which models an antagonistic environment) is irrelevant. Despite this fact, not much is known about valuations for which the protagonist admits optimal positional strategies, regardless of the opponent. In this work, we characterize valuations which admit such strategies over infinite game graphs. Our characterization uses the vocabulary of universal graphs, which has also proved useful in understanding recent breakthrough results regarding the complexity of parity games. More precisely, we show that a valuation admitting universal graphs which are monotone and well-ordered is positional over all game graphs, and – more surprisingly – that the converse is also true for valuations admitting neutral colors. We prove the applicability and elegance of the framework by unifying a number of known positionality results, proving new ones, and establishing closure under lexicographical products. Finally, we discuss a class of prefix-independent positional objectives which is closed under countable unions.
💡 Analysis
We study turn-based quantitative games of infinite duration opposing two antagonistic players and played over graphs. This model is widely accepted as providing the adequate framework for formalizing the synthesis question for reactive systems. This important application motivates the question of strategy complexity: which valuations (or payoff functions) admit optimal positional strategies (without memory)? Valuations for which both players have optimal positional strategies have been characterized by Gimbert and Zielonka for finite graphs and by Colcombet and Niwiński for infinite graphs. However, for reactive synthesis, existence of optimal positional strategies for the opponent (which models an antagonistic environment) is irrelevant. Despite this fact, not much is known about valuations for which the protagonist admits optimal positional strategies, regardless of the opponent. In this work, we characterize valuations which admit such strategies over infinite game graphs. Our characterization uses the vocabulary of universal graphs, which has also proved useful in understanding recent breakthrough results regarding the complexity of parity games. More precisely, we show that a valuation admitting universal graphs which are monotone and well-ordered is positional over all game graphs, and – more surprisingly – that the converse is also true for valuations admitting neutral colors. We prove the applicability and elegance of the framework by unifying a number of known positionality results, proving new ones, and establishing closure under lexicographical products. Finally, we discuss a class of prefix-independent positional objectives which is closed under countable unions.
📄 Content
우리는 무한히 지속되는 턴 기반 정량적 게임(turn‑based quantitative games)을 연구한다. 이러한 게임은 두 명의 적대적인 플레이어(antagonistic players)가 그래프(graph) 위에서 번갈아 가며 움직이며 서로 대립하는 구조를 가지고 있다. 이 모델은 반응형 시스템(reactive systems)의 합성(synthesis) 문제를 형식화(formalize)하기 위한 적절한 프레임워크(framework)로 널리 받아들여지고 있으며, 실제로 많은 연구와 응용 분야에서 표준적인 기반으로 활용되고 있다.
이와 같은 중요한 응용 배경은 자연스럽게 **전략 복잡도(strategy complexity)**에 관한 근본적인 질문을 제기한다. 구체적으로는 “어떤 가치 함수(valuation) 혹은 보상 함수(payoff function)가 최적의 위치 전략(optimal positional strategy), 즉 메모리를 전혀 사용하지 않는 메모리‑프리(memory‑free) 전략을 허용하는가?”라는 문제이다. 위치 전략은 현재 게임 상태만을 보고 행동을 결정하므로 구현이 간단하고 효율적이며, 따라서 합성 과정에서 매우 바람직한 특성으로 간주된다.
두 플레이어 모두가 최적의 위치 전략을 동시에 가질 수 있는 가치 함수에 대해서는 이미 상당한 연구 결과가 존재한다. 유한 그래프(finite graphs) 환경에서는 Gimbert와 Zielonka가, 무한 그래프(infinite graphs) 환경에서는 Colcombet와 Niwiński가 각각 **특성화(characterization)**를 제공하였다. 이들은 각각의 경우에 대해 “어떤 가치 함수가 양쪽 플레이어 모두에게 위치 전략을 보장하는가?”를 정확히 규정함으로써 이론적 기반을 마련했다.
그러나 반응형 합성의 실제 목적을 생각해 보면, 여기서 중요한 것은 상대방(opponent), 즉 적대적인 환경을 모델링하는 플레이어가 최적의 위치 전략을 가질 수 있는가 여부는 크게 중요하지 않다. 합성 과정에서는 시스템(주인공, protagonist)이 어떠한 적대적 환경에도 견디면서도 최적의 행동을 선택할 수 있기를 원하기 때문이다. 따라서 “상대방의 전략에 관계없이 주인공만이 최적의 위치 전략을 가질 수 있는 가치 함수는 무엇인가?”라는 질문은 아직 충분히 탐구되지 않은 영역으로 남아 있다.
본 연구에서는 이러한 주인공‑중심(protagonist‑centric) 관점에서, 무한 게임 그래프(infinite game graphs) 전반에 걸쳐 주인공이 최적의 위치 전략을 가질 수 있도록 허용하는 가치 함수를 **특성화(characterize)**한다. 우리의 특성화는 최근 패리티 게임(parity games)의 복잡도와 관련된 획기적인 결과들을 이해하는 데에도 크게 기여한 **보편 그래프(universal graph)**라는 개념의 어휘(vocabulary)를 활용한다. 보편 그래프는 특정한 순서 구조와 전이 관계를 일반화하여 다양한 게임 모델을 하나의 통합된 틀 안에서 다룰 수 있게 해 주는 강력한 도구이다.
보다 구체적으로 말하면, 보편 그래프가 단조(monotone)하고 전순서(well‑ordered)인 경우 해당 가치 함수는 모든 가능한 게임 그래프(유한이든 무한이든)에서 위치 전략을 보장한다는 것을 증명한다. 여기서 “단조”란 그래프의 색상(color) 혹은 가중치(weight) 관계가 전이 과정에서 감소하거나 증가하는 방향으로 일관되게 유지된다는 의미이며, “전순서”는 그 관계가 어떠한 무한 감소 연쇄도 존재하지 않는, 즉 최소 원소가 항상 존재하는 순서를 가진다는 뜻이다. 이러한 두 조건이 동시에 만족될 때, 주인공은 메모리 없이 현재 상태만을 보고 최적의 선택을 할 수 있다.
더욱 놀라운 점은 **중립 색상(neutral colors)**을 허용하는 가치 함수에 대해서는 위의 두 조건이 **필요충분조건(necessary and sufficient condition)**임을 보였다는 것이다. 즉, 가치 함수가 중립 색상을 포함하고 있다면, 그 함수가 위치 전략을 허용하기 위해서는 반드시 단조성과 전순서성을 만족하는 보편 그래프가 존재해야 하며, 반대로 이러한 보편 그래프가 존재한다면 반드시 위치 전략이 가능하다는 것이 성립한다. 이는 기존에 알려진 결과들을 일반화함과 동시에, 중립 색상이라는 새로운 차원을 도입함으로써 전략 가능성에 대한 이해를 한층 깊게 만든다.
우리의 프레임워크가 실제로 얼마나 적용 가능하고 우아한(elegant)지를 보여주기 위해, 우리는 이미 알려진 여러 위치성(positionality) 결과들을 하나의 통일된 이론적 구조 안에 통합하였다. 예를 들어, 기존에 개별적으로 증명된 특정 패리티 게임이나 평균 비용 게임(average‑cost games) 등에 대한 위치 전략 존재성 결과들을 보편 그래프의 단조·전순서 특성에 귀속시켜 재해석하였다. 또한, 이 프레임워크를 이용해 새로운 위치 전략 존재성 결과들을 증명했으며, 특히 **사전 순 곱(lexicographical product)**에 대한 닫힘성(closedness)을 확립함으로써 복합적인 목표 함수(composite objective functions)에도 자연스럽게 적용될 수 있음을 확인하였다. 사전 순 곱은 두 개 이상의 가치 함수를 순서대로 결합하여 새로운 복합 가치 함수를 만드는 연산으로, 이 연산에 대해 닫혀 있다는 것은 복합 목표를 가진 게임에서도 여전히 메모리‑프리 전략이 가능함을 의미한다.
마지막으로, 우리는 **전제(prefix‑independent) 위치 목표(prefix‑independent positional objectives)**라는 특수한 목표 클래스에 대해서도 논의한다. 전제 목표는 게임 진행 중에 발생하는 무한 경로의 **접두사(prefix)**가 어떠하든 최종 승패가 변하지 않는 특성을 갖는다. 이러한 전제 목표들의 집합이 **가산 합집합(countable unions)**에 대해 닫혀 있다는 사실을 증명함으로써, 무한히 많은 전제 목표를 동시에 고려하는 복합 시스템에서도 위치 전략을 유지할 수 있음을 보여준다. 이는 특히 시스템 설계자가 여러 안전(safety)·활성(liveness) 요구사항을 동시에 만족시켜야 하는 경우에 실용적인 의미를 가진다.
요약하면, 본 연구는 무한 게임 그래프 상에서 주인공이 최적의 위치 전략을 가질 수 있는 가치 함수들을 보편 그래프의 단조·전순서성이라는 명확한 구조적 조건으로 규정하고, 중립 색상을 포함하는 경우에는 그 조건이 필요충분함을 입증하였다. 또한, 이 이론적 틀을 통해 기존 결과들을 통합하고 새로운 결과들을 도출했으며, 사전 순 곱에 대한 닫힘성 및 전제 목표의 가산 합집합에 대한 닫힘성 등 여러 부수적인 성질도 함께 확보하였다. 이러한 성과들은 반응형 시스템 합성 분야에서 메모리‑프리 전략의 설계와 검증을 보다 체계적이고 확장 가능하게 만드는 데 기여할 것으로 기대된다.