실시간 휴리스틱 탐색을 위한 사례 기반 서브골링: 비디오 게임 경로 찾기의 혁신

초록

본 논문은 실시간 휴리스틱 탐색(RTHS)에서 학습에 따른 품질 저하 문제를 해결하기 위해, 오프라인에 여러 문제를 풀어 얻은 경로를 서브골로 압축하고 사례 데이터베이스에 저장하는 새로운 알고리즘을 제안한다. 새로운 방법은 기존 D‑LRTA*가 요구하던 복잡하고 메모리 집약적인 사전 계산을 대폭 간소화하며, 동일한 실험 환경에서 8배 향상된 솔루션 품질, 57배 적은 메모리 사용, 14% 감소된 사전 계산 시간을 달성한다.

상세 분석

실시간 휴리스틱 탐색(RTHS)은 매 행동마다 제한된 플래닝 양만 허용함으로써 문제 규모와 무관하게 일정한 반응 시간을 보장한다. 이러한 특성은 사용자 입력에 즉각적으로 반응해야 하는 비디오 게임 AI에 매력적이지만, 전통적인 RTHS 알고리즘(LRTA*, RTA*)은 학습 단계에서 방문한 상태에 대한 비용을 업데이트하면서 종종 동일한 지역을 반복 방문하게 된다. 이 현상은 경로 품질을 크게 저하시키고, 에이전트가 비합리적으로 보이게 만든다.

D‑LRTA*는 이러한 문제를 서브골(goal) 자동 선택을 통해 완화하려 했으며, 사전 계산 단계에서 전체 맵에 대한 서브골 트리를 구축한다. 그러나 이 과정은 복잡한 그래프 탐색과 대규모 메모리 할당을 필요로 하여 실제 게임 엔진에 적용하기 어려운 장애물을 만든다.

본 논문이 제안하는 사례 기반 서브골링(case‑based subgoaling)은 근본적인 접근 방식을 바꾼다. 먼저, 오프라인에서 무작위로 선택된 시작‑목표 쌍에 대해 최적 혹은 준최적 경로를 구한다. 얻어진 경로는 연속적인 직선 구간이나 “핵심” 노드들로 압축되어 서브골 시퀀스로 변환된다. 이 서브골 시퀀스와 해당 시작‑목표 쌍은 해시 기반 인덱스로 관리되는 사례 데이터베이스에 저장된다.

온라인 단계에서는 새로운 시작‑목표가 주어지면, 현재 상황과 가장 유사한 사례를 빠르게 검색한다. 유사도는 시작·목표 좌표의 유클리드 거리와 맵 구조적 특징(예: 장애물 밀도) 등을 결합한 스코어로 평가한다. 선택된 사례의 서브골 시퀀스는 그대로 사용되거나, 필요에 따라 현재 맵 상황에 맞게 미세 조정된다. 에이전트는 각 서브골을 향해 LRTA*와 동일한 제한된 플래닝을 수행하면서 이동하고, 서브골 도달 시 다음 서브골로 전환한다.

이 설계는 두 가지 주요 장점을 제공한다. 첫째, 서브골이 실제 경로의 핵심 구간만을 포함하므로 메모리 요구량이 크게 감소한다. 둘째, 사전 계산 단계에서 복잡한 전역 서브골 트리를 구축할 필요가 없으며, 단순히 여러 사례를 저장하고 인덱싱하는 작업만으로 충분하다. 실험 결과는 네 개의 대형 게임 맵(수십만 노드)에서 기존 D‑LRTA* 대비 8배 향상된 경로 비용(길이·시간)과 57배 적은 메모리 사용량을 보여준다. 또한, 사전 계산 시간도 14% 감소하여 실제 게임 개발 파이프라인에 쉽게 통합될 수 있음을 입증한다.

하지만 몇 가지 한계도 존재한다. 사례 데이터베이스의 품질은 오프라인에 선택된 시작‑목표 쌍의 다양성에 크게 의존한다. 특정 지역이나 복잡한 지형이 충분히 샘플링되지 않으면 유사 사례를 찾지 못해 성능이 저하될 수 있다. 또한, 서브골 간의 연결이 항상 최적이 아니므로, 극히 복잡한 동적 환경에서는 추가적인 현장 학습이 필요할 가능성이 있다. 향후 연구에서는 사례 생성 전략을 자동화하고, 동적 장애물에 대한 실시간 서브골 재조정 메커니즘을 도입함으로써 이러한 약점을 보완하고자 한다.