모터 자동 게임 디자인을 위한 메커니즘 진화
📝 원문 정보
- Title: Mortar: Evolving Mechanics for Automatic Game Design
- ArXiv ID: 2601.00105
- 발행일: 2025-12-31
- 저자: Muhammad U. Nasir, Yuchen Li, Steven James, Julian Togelius
📝 초록 (Abstract)
본 논문에서는 게임 메커니즘을 자동으로 진화시켜 게임을 설계하는 시스템인 MORTAR를 제안한다. MORTAR는 품질‑다양성(QD) 알고리즘과 대형 언어 모델(LLM)을 결합해 다양한 메커니즘을 탐색하고, 진화된 메커니즘과 아카이브에 저장된 기존 메커니즘을 조합해 완전한 게임을 합성한다. 합성된 게임은 트리 탐색을 통해 구성되며, 최종 평가는 강한 플레이어가 약한 플레이어를 일관적으로 앞서는 ‘스킬 기반 순서’를 유지하는 정도를 측정한다. 메커니즘은 해당 게임에서 스킬 기반 순서 점수에 기여한 정도로 평가한다. 실험 결과 MORTAR가 다양하고 플레이 가능한 게임을 생성하며, 메커니즘이 스킬 기반 순서 점수에 유의미하게 기여함을 확인하였다. 각 구성 요소의 역할을 검증하기 위한 소거 실험과 인간 피드백을 통한 사용자 연구도 수행하였다.💡 논문 핵심 해설 (Deep Analysis)

평가 메트릭은 ‘스킬 기반 순서 유지’라는 독창적인 기준이다. 이는 게임이 플레이어의 실력 차이를 반영해 승패를 결정하도록 설계되었는지를 수치화한다. 구체적으로, 여러 수준의 AI 에이전트를 사전 정의된 순서대로 게임에 투입하고, 각 에이전트가 얻는 승률을 비교해 순서 일관성을 점수화한다. 메커니즘의 기여도는 해당 메커니즘이 포함된 게임들의 순서 점수 평균과, 메커니즘이 제외된 경우의 점수 차이로 산출한다. 이 방식은 메커니즘 자체가 게임 밸런스와 전략적 깊이에 미치는 영향을 정량적으로 파악할 수 있게 한다.
실험 결과는 두 가지 차원에서 의미 있다. 첫째, MORTAR가 생성한 게임은 시각적·규칙적 다양성을 보이며, 플레이 테스트에서 인간 참가자들이 ‘재미있다’ 혹은 ‘도전적이다’는 긍정적 평가를 내렸다. 둘째, 메커니즘 기여도 분석에서 일부 진화된 메커니즘은 기존 아카이브 메커니즘보다 스킬 기반 순서 점수를 현저히 향상시켰으며, 이는 자동 설계가 실제로 게임 디자인 품질을 개선할 수 있음을 시사한다.
소거 실험에서는 (1) LLM 없이 순수 QD 탐색, (2) QD 없이 LLM만 사용, (3) 트리 탐색 없이 무작위 조합 등 다양한 변형을 테스트했다. 결과적으로 모든 구성 요소가 상호 보완적으로 작용함을 확인했으며, 특히 LLM이 제공하는 풍부한 규칙 후보와 QD가 제공하는 선택적 압축이 결합될 때 가장 높은 다양성과 품질을 달성했다.
한계점으로는 (가) LLM이 생성하는 규칙의 논리적 일관성을 완전히 보장할 수 없으며, (나) 스킬 기반 순서 점수가 모든 장르에 적용 가능한 보편적 지표는 아니라는 점을 들 수 있다. 또한 현재는 제한된 수의 AI 에이전트와 간단한 시뮬레이션 환경에 의존하고 있어, 복잡한 멀티플레이어나 실시간 전략 게임에 대한 확장성은 추가 연구가 필요하다.
향후 연구 방향은 (1) 메커니즘 진화 과정에 인간 디자이너의 피드백을 순환적으로 반영하는 하이브리드 인터페이스, (2) 다양한 장르와 플레이어 행동 모델을 포괄하는 다중 목표 최적화, (3) LLM‑기반 규칙 생성 단계에서 형식 검증 및 자동 정형화를 위한 도메인‑특화 언어(DSL) 개발 등이다. 이러한 확장은 MORTAR를 보다 실용적인 게임 디자인 툴킷으로 전환시키고, 자동 설계가 창의적 게임 개발 파이프라인에 자연스럽게 융합될 수 있는 기반을 제공할 것이다.
📄 논문 본문 발췌 (Translation)
📸 추가 이미지 갤러리