클러터 환경에서 다중 로봇을 위한 비동기 MCTS 기반 최소 메이크스팬 객체 재배치

클러터 환경에서 다중 로봇을 위한 비동기 MCTS 기반 최소 메이크스팬 객체 재배치
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 복잡하고 혼잡한 작업 공간에서 여러 로봇이 객체를 재배치할 때 전체 수행 시간을 최소화하는 새로운 계획 프레임워크인 CAM‑MCTS를 제안한다. 중앙집중식 과제 할당과 비동기 실행을 결합해, 로봇이 다른 로봇이 작업을 마칠 때까지 기다릴 필요 없이 가능한 빨리 새로운 과제를 받아 수행하도록 설계하였다. 실험 결과, 단일 로봇 혹은 동기식 다중 로봇 기법에 비해 메이크스팬을 크게 단축시켰으며, 실제 로봇 실험에서도 안정적인 성능을 확인하였다.

상세 분석

CAM‑MCTS는 전통적인 MCTS 구조를 다중 로봇 협업 문제에 맞게 재구성한 점이 가장 큰 특징이다. 먼저, 각 트리 노드는 현재 객체 배치(a_t), 목표 배치(a_g), 로봇들의 위치와 보유 객체 정보를 모두 포함한다. 선택 단계에서는 Upper Confidence Bound (UCB) 식을 변형해, 전체 이동 거리 Σ|v_qk|와 현재까지 관측된 최대 메이크스팬 max|v_qk|를 가중합(α)한 비용을 최소화하도록 설계하였다. 이는 탐색이 “짧은 이동 거리 + 짧은 메이크스팬”을 동시에 고려하게 하여, 비단 최단 경로가 아니라 전체 시스템 효율성을 목표로 한다는 점에서 기존 MCTS와 차별화된다.

확장 단계에서는 두 가지 핵심 모듈이 동작한다. ① 중앙집중식 과제 할당은 활성 로봇(이미 객체를 잡고 이동 중인 로봇)과 대기 로봇을 구분하고, 활성 로봇에게는 목표 위치가 점유돼 있으면 목표 근처에 정규분포를 이용해 버퍼 위치를 샘플링한다. 버퍼 위치는 목표와 가까워야 최종 이동을 최소화할 수 있다는 “낙관적 진행” 가정을 반영한다. 대기 로봇에 대해서는 남은 객체와 로봇 수의 모든 조합을 생성하고, 각 조합마다 가장 가까운 객체를 선택하는 휴리스틱(유클리드 거리)으로 과제를 할당한다. 이렇게 하면 탐색 공간이 크게 축소되면서도 충분히 다양한 할당 후보를 검토할 수 있다.

② 비동기 실행 모듈은 기존의 동기식 MAPD와 달리, 각 로봇이 작업을 마친 시점을 실시간으로 감지하고, 그 시점에서 현재 트리 확장을 종료한다. 이를 위해 ICBS(Conflict‑Based Search)로 얻은 동기식 경로를 기반으로 각 로봇의 종료 시간을 t_i를 추출하고, “tolerance horizon”이라는 허용 범위 내에서 가장 이른 종료 시점을 t′로 선택한다. 또한, 대기 로봇이 새로운 과제를 받을 때까지의 예상 이동 비용(C2G)을 고려해 허용 범위를 동적으로 조정한다. 이 과정은 로봇 간 불필요한 대기 시간을 최소화하고, 메이크스팬을 실질적으로 감소시킨다.

시뮬레이션에서는 단조(monotone)와 비단조(non‑monotone) 작업을 모두 테스트했으며, 특히 비단조 상황에서 버퍼 위치 선택과 비동기 실행이 메이크스팬 감소에 크게 기여했다. 실제 로봇 실험에서도 동일한 알고리즘을 적용했을 때, 로봇 간 충돌 회피와 경로 재계산이 원활히 이루어져, 실시간 적용 가능성을 입증하였다. 전체적으로 CAM‑MCTS는 (1) 중앙집중식 과제 할당으로 탐색 공간을 효율적으로 축소, (2) 비동기 실행으로 로봇 활용률을 극대화, (3) MCTS의 탐색-확장-시뮬레이션-역전파 사이클을 다중 로봇 협업에 맞게 최적화한다는 세 가지 기술적 기여를 제공한다.


댓글 및 학술 토론

Loading comments...

의견 남기기