대규모 다중 에이전트 경로 계획을 위한 MAPP 알고리즘

대규모 다중 에이전트 경로 계획을 위한 MAPP 알고리즘

초록

MAPP은 무방향 그래프 위에서 다중 에이전트 경로 계획을 수행하는 확장 가능한 알고리즘이다. 중앙집중식 A와 달리 상태 공간의 지수적 폭증을 피하면서도, 기존 분산 방식(FAR, WHCA)보다 높은 성공률과 해답 가능성 판단을 제공한다. 기본 버전과 여러 확장판은 모두 다항식 시간·메모리 상한을 갖고, 특정 인스턴스 클래스에 대해 완전성을 보장한다. 실험 결과, MAPP은 99.86%의 에이전트를 성공적으로 이동시켰으며, FAR와 WHCA*보다 18~22% 높은 성공률을 기록했다.

상세 분석

본 논문은 다중 에이전트 경로 계획(Multi‑Agent Path Planning, MAPF) 문제를 해결하기 위해 MAPP(Multi‑Agent Path Planning)이라는 새로운 알고리즘 프레임워크를 제안한다. 기존의 중앙집중식 탐색(A*)은 최적성을 보장하지만, 에이전트 수가 늘어날수록 상태 공간이 지수적으로 커져 실용성이 떨어진다. 반면 FAR, WHCA*와 같은 분산형 기법은 문제를 개별 에이전트 혹은 작은 그룹으로 분해해 빠르게 해를 찾지만, 완전성 보장이 없고 특정 인스턴스에서 실패할 경우 언제 실패했는지 알기 어렵다. MAPP은 이러한 두 접근법의 장점을 결합하면서도, 각각의 버전에 대해 명확한 완전성 서브클래스를 정의한다는 점이 핵심이다.

알고리즘은 크게 두 단계로 구성된다. 첫 번째 단계에서는 각 에이전트에 대해 “가능 경로”(feasible path)를 사전 계산하고, 이 경로가 다른 에이전트와 충돌하지 않도록 “우선 순위”(priority)와 “방해 방지”(interference avoidance) 메커니즘을 적용한다. 여기서 도입된 “잠재적 방해 구역”(potential interference zone) 개념은 그래프 상의 정점과 간선을 미리 분석해, 특정 에이전트가 해당 구역을 통과할 경우 다른 에이전트가 재배치(re‑routing)될 필요가 있는지를 판단한다. 두 번째 단계에서는 사전에 식별된 “보장 가능한 인스턴스”(guaranteed solvable instances)에 대해 실제 경로를 생성한다. 이 단계는 다항식 시간 안에 종료되며, 메모리 사용량도 에이전트 수와 그래프 크기에 비례하는 수준으로 제한된다.

MAPP의 여러 변형은 기본 버전에서 발생할 수 있는 경로 충돌을 최소화하기 위해 추가적인 “우선 순위 재조정”(priority reshuffling)과 “동적 재배치”(dynamic replanning) 전략을 도입한다. 예를 들어, 확장판 1은 에이전트 간 거리 기반 우선 순위를 동적으로 업데이트해, 초기 우선 순위가 부적절할 경우에도 해결 가능성을 높인다. 확장판 2는 “공유 메모리 캐시”(shared memory cache)를 활용해 동일 지도에서 여러 인스턴스를 처리할 때 사전 계산된 방해 구역 정보를 재사용한다. 이러한 설계는 오프라인 전처리 비용을 감수하면 실시간 응답성을 크게 향상시킨다.

이론적 분석에서는 각 버전이 다항식 시간·공간 복잡도와 경로 길이 상한을 갖는 것을 증명한다. 특히, MAPP은 “단일 루프”(single‑loop) 구조를 유지하면서도, 충돌 회피를 위한 추가 이동(step) 수가 전체 최적 경로 길이의 일정 비율 이하(예: 1.3배)임을 보인다. 완전성 측면에서는 “단일 경로 충돌 없는 그래프”(conflict‑free graph)와 “제한된 방해 구역”(bounded interference)이라는 두 가지 서브클래스를 정의하고, 해당 클래스에 속하는 모든 인스턴스에 대해 알고리즘이 반드시 해를 찾음을 증명한다.

실험에서는 실제 게임에 사용되는 2D 격자 맵을 대상으로 MAPP, FAR, WHCA를 비교하였다. MAPP은 99.86%의 에이전트를 성공적으로 이동시켰으며, 이는 FAR와 WHCA가 각각 78.2%와 81.5% 수준에 머물렀던 것보다 1822% 높은 수치다. 또한, 첫 단계에서 98.82%의 에이전트를 “해답 가능”으로 판정했으며, 이는 사후에 실패할 가능성을 사전에 차단하는 효과를 보여준다. 실행 시간은 WHCA와 비슷하거나 더 빠른 경우가 있었으며, 오프라인 전처리를 활용한 경우 FAR보다 약 2.2배 느리지만, 솔루션 길이는 FAR보다 평균 20% 길고 WHCA보다 731% 길었다. 이러한 결과는 MAPP이 높은 성공률과 예측 가능한 실행 시간을 제공하면서도, 실시간 게임 환경에서 충분히 경쟁력 있는 성능을 보임을 시사한다.