다중 로봇 경로 찾기(MAPF) 핵심 정리
초록
본 논문은 물류 창고 로봇에 적용되는 다중 에이전트 경로 찾기(MAPF) 문제를 소개하고, 문제 정의, 최적성 복잡도, 주요 알고리즘 군, 그리고 실제 로봇 시스템에의 적용 사례를 정리한다. 목표는 makespan 최소화이며, 충돌 회피와 다양한 최적·근사 해법을 비교한다.
상세 분석
MAPF는 그래프 상에서 n개의 로봇이 각각 시작 셀과 목표 셀을 가지고, 시간 이산 단계마다 한 번에 한 칸씩 이동하거나 대기하면서 충돌 없이 목표에 도달하도록 하는 최적화 문제이다. 충돌은 두 로봇이 같은 셀로 동시에 이동하거나 서로의 현재 셀을 교환할 때 발생한다. 논문은 makespan(전체 로봇이 목표에 도달하는 데 걸리는 시간) 최소화를 기본 목표로 삼으며, sum‑of‑cost(각 로봇의 도착 시간 합)와 같은 대안 목표도 언급한다.
복잡도 측면에서 MAPF는 일반 그래프에서 최적 makespan을 구하는 것이 NP‑hard임을 강조한다(Yu & LaValle, 2013c). 반면, 목표 셀을 사전 지정하지 않고 로봇 수와 동일한 개수의 자유 셀을 목표로 할당하는 변형은 흐름 기반 알고리즘으로 다항 시간에 해결 가능하다. 이는 네트워크 플로우 모델을 이용해 각 로봇을 흐름 단위로 해석하고, 용량 제한을 통해 충돌을 방지하는 방식이다.
알고리즘적 접근은 크게 두 축으로 나뉜다. 첫 번째는 충돌 기반 검색(conflict‑based search, CBS) 계열로, 개별 로봇의 최단 경로를 먼저 구한 뒤 충돌이 발생하면 충돌을 해결하기 위한 제약을 추가하고 재탐색한다. CBS는 충돌을 트리 형태로 관리해 부분 문제를 재사용함으로써 최적해에 근접하지만, 로봇 수가 급증하면 제약 트리의 폭이 커져 실시간 적용이 어려워진다. 두 번째는 서브디멘셔널 확장(Subdimensional Expansion, SDE) 계열로, 충돌이 발생한 소규모 로봇 그룹만을 별도로 고차원 공간(각 로봇 위치를 차원으로 하는 합성 그래프)에서 계획한다. 그룹이 커질수록 차원 폭발 문제가 발생하지만, 실제 창고와 같이 통로가 제한된 환경에서는 충돌 그룹이 비교적 작아 효율적인 해결이 가능하다.
또한, 논문은 SAT, ILP, ASP와 같은 전통적인 최적화 프레임워크로 MAPF를 변환하는 연구들을 소개한다. SAT 기반 방법은 충돌 제약을 부울식으로 인코딩해 최신 SAT 솔버의 고성능을 활용한다. ILP는 흐름 변수와 충돌 방지 제약을 선형식으로 모델링해 최적해를 보장하지만, 변수 수가 로봇·시간 규모에 따라 급증한다. ASP는 선언적 논리 프로그램으로 문제를 기술해 탐색 과정을 자동화한다.
실제 로봇 시스템에 적용할 때는 kinematic constraints(가속·감속, 회전 제한)와 센서 불확실성을 고려해야 한다. 논문은 이러한 제약을 경로 계획 단계에 통합하는 방법을 제시하고, 시뮬레이션 및 실제 Amazon Robotics 창고에서 100여 대 로봇을 대상으로 실험한 결과, 최적·근사 알고리즘이 makespan을 10~30% 정도 개선했으나, 실시간 요구사항(수십 밀리초 이하)에는 아직 한계가 있음을 보고한다.
마지막으로, MAPF 연구 커뮤니티의 최근 동향으로 AAAI 2012, IJCAI 2016 워크숍을 언급하고, 향후 연구 과제로는 (1) 동적 주문 흐름에 대한 온라인 MAPF, (2) 로봇 간 협업을 위한 payload 교환 및 재배치, (3) 대규모 실시간 시스템을 위한 하이브리드 알고리즘 설계 등을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기