최대·최소 게임 e‑Valuate: 표현식 최적화와 그래프·타일 변형

초록

e‑Valuate는 변수에 값을 제시하고 교체하는 두 플레이어가 주어진 산술식의 값을 최대·최소화하는 게임이다. 논문은 게임 트리를 이용한 최소극대값 계산을 역방향 귀납법과 알파‑베타 가지치기로 효율화하고, 노드 순서와 전이표 활용을 통한 추가 최적화를 제안한다. 또한 그래프 색칠·플레인 영역 공유, 8×8 체스보드 도미노 타일링 등 도메인 특화 변형을 소개하고, 최대 타일링 크기의 하한·상한을 증명한다.

상세 분석

e‑Valuate는 산술 표현식 E 에 등장하는 변수 v₁,…,vₙ 을 두 플레이어가 번갈아 선택·대입함으로써 최종값을 결정하는 두 사람 제로섬 게임이다. 한쪽은 식의 값을 최대화(maximizer)하려 하고, 다른 쪽은 최소화(minimizer)하려 한다. 게임 진행은 “값 제시 → 변수 선택 → 대입”이라는 2단계 루프를 n 번 반복해 식이 완전히 구체화될 때까지 진행된다. 최종값이 이론적 최소극대값 V* 보다 크면 maximizer가 승리하고, 작으면 minimizer가 승리한다.

논문은 이 게임을 완전 탐색 트리로 모델링한다. 트리의 깊이는 2n (값 제시와 변수 선택이 각각 한 레벨씩)이며, 리프 노드에는 완전 대입된 식의 정수값이 저장된다. 최소극대값 V* 는 전통적인 미니맥스 알고리즘으로 역방향 귀납법을 적용해 루트에서 계산할 수 있다. 하지만 전체 트리의 크기는 (2n)! 에 가까워 실용적이지 않다. 따라서 알파‑베타 가지치기를 도입해 불필요한 서브트리 탐색을 차단한다. 핵심은 현재까지 발견된 알파(최소화 플레이어가 보장할 수 있는 최소값)와 베타(최대화 플레이어가 보장할 수 있는 최대값) 경계값을 이용해, 알파 ≥ 베타가 되는 노드에서 즉시 탐색을 중단하는 것이다.

알파‑베타 효율은 노드 탐색 순서에 크게 의존한다는 점을 논문은 강조한다. 최적 순서는 먼저 최선의 선택을 탐색해 알파·베타 경계를 빠르게 수축시키는 것이지만, 사전에 이를 알기 어렵다. 저자는 “값 제시 단계에서는 현재까지 가장 큰/작은 값이 기대되는 후보를 먼저, 변수 선택 단계에서는 남은 변수 중 식에 가장 큰 영향력을 미치는 변수를 우선”이라는 휴리스틱을 제안한다. 이 휴리스틱은 변수의 계수 절댓값이나, 대입 후 식값의 변동 범위를 추정해 정렬한다. 실험 결과, 이 순서화는 평균적으로 30 % 이상의 추가 가지치기를 달성한다.

전이표(transposition table)도 중요한 최적화 도구다. 서로 다른 경로를 통해 동일한 변수-값 조합에 도달하면 동일한 서브트리가 재탐색된다. 해시 기반 전이표에 현재 상태(대입된 변수 집합과 제시된 값 목록)를 저장하고, 이미 평가된 경우 저장된 미니맥스 값을 재사용함으로써 중복 계산을 방지한다. 메모리 사용량과 충돌 관리 전략을 상세히 논의하며, LRU 교체 정책이 실험에서 가장 효율적이었다는 결론을 제시한다.

도메인 특화 변형으로는 그래프 이론적 해석이 있다. 그래프 G 의 정점·간선·면(플레인 그래프) 중 하나를 공유 자원으로 두고, 두 플레이어가 색을 번갈아 칠해 자신이 차지한 요소의 가중합(예: 면적, 가중치)을 최대화한다. 이 경우 식 E 는 각 요소의 소유 상태를 0/1 변수로 표현하고, 색칠 순서는 변수 선택에 해당한다. 특히 플레인 그래프에서 면적을 목표로 할 때, 색칠된 면적의 합이 최소극대값을 초과하면 해당 플레이어가 승리한다. 이는 기존 e‑Valuate의 산술식 구조를 그래프 색칠 문제에 자연스럽게 매핑한 사례다.

또 다른 변형은 8 × 8 체스보드에 도미노를 교대로 놓아 최대 부분 타일링을 만드는 게임이다. 여기서 변수는 아직 배치되지 않은 셀 쌍이며, 값 제시는 “도미노를 놓을 수 있는지 여부”를 나타낸다. 논문은 모든 최대 부분 타일링이 최소 22개의 도미노를 포함하고, 최대로는 32개의 도미노까지 가능함을 증명한다. 하한 증명은 보드의 흑·백 패턴을 이용해 남은 빈칸이 홀수 개가 되지 않도록 하는 논리적 귀류법이며, 상한은 각 행·열에 놓일 수 있는 도미노 수의 제한을 통해 얻는다.

전체적으로 이 연구는 전통적인 미니맥스와 알파‑베타 기법을 게임 이론적 모델에 적용하고, 휴리스틱 순서화와 전이표를 결합해 실질적인 성능 향상을 입증한다. 또한 e‑Valuate를 다양한 수학·컴퓨터 과학 분야에 확장함으로써, 게임 기반 최적화와 공유 자원 분배 문제에 새로운 접근법을 제공한다.