분산형 MPPI 기반 다중 팔 모션 플래닝
초록
본 논문은 GPU 기반 샘플링 MPC 알고리즘 STORM을 다중 로봇 환경에 적용하기 위해 확장하였다. 각 팔이 자체적으로 MPPI 샘플링을 수행하고, 예측된 단기 궤적을 서로 공유함으로써 동적 장애물로 취급한다. 또한 거리 기반 동적 우선순위 메커니즘을 도입해 충돌 회피와 목표 도달 사이의 교착 상태를 방지한다. 실험 결과 MR‑STORM이 기존 중앙집중식 및 분산식 최첨단 플래너보다 높은 성공률과 낮은 지연을 보임을 확인하였다.
상세 분석
본 연구는 고자유도(DoF) 로봇 팔의 실시간 모션 플래닝에서 발생하는 차원 저주와 중앙집중식 연산의 병목 현상을 해결하고자 한다. 기존 STORM은 GPU를 활용한 대규모 샘플링 MPPI 방식으로 단일 로봇에 대해 높은 주기와 정확성을 제공하지만, 다중 로봇을 공동으로 최적화하면 상태 공간이 급격히 확장되어 실시간성을 상실한다. 이를 극복하기 위해 저자들은 세 가지 핵심 설계를 제안한다. 첫째, STORM의 비용 함수에 동적 장애물 항을 추가한다. 각 팔은 자신의 현재 제어 분포 평균을 이용해 미래 H 단계의 구(스피어) 집합을 생성하고, 이를 다른 팔에게 전송한다. 수신 측은 이 구 집합을 동적 장애물로 간주해 signed‑distance 기반 페널티를 부과한다. 이 과정은 기존 정적 장애물 비용과 동일한 형태이므로 GPU 병렬화 효율을 유지한다. 둘째, 동적 장애물 비용만으로는 충돌 회피와 목표 도달 사이에 교착 현상이 발생할 수 있기에, 거리 기반 동적 우선순위 스키마를 도입한다. 충돌 위험이 높은 상황에서 우선순위가 낮은 팔은 비용 가중치를 일시적으로 상승시켜 회피 행동을 강화하고, 우선순위가 높은 팔은 목표 비용을 유지한다. 이렇게 하면 동일 작업 영역을 공유하는 팔들 사이에 자연스러운 양보가 이루어져 진동이나 교착을 최소화한다. 셋째, 알고리즘 전체를 “분산형”으로 설계해 각 팔이 독립적인 STORM 인스턴스를 실행하도록 함으로써 중앙 서버의 연산 부하를 제거한다. 통신량은 각 팔이 전송하는 구 집합(시간 단계당 몇 개의 구)만으로 제한되며, 이는 실시간 제어 주기(예: 20 ms) 내에 충분히 처리 가능하다. 실험에서는 Isaac‑Sim 환경에서 120개의 시나리오(정적/동적 장애물, 다양한 목표 배치)를 구성하고, MR‑STORM을 기존 중앙집중식 MPC, CBS‑MP, ORCA 등과 비교하였다. 성공률, 평균 충돌 횟수, 경로 길이, 그리고 제어 주기 대비 연산 시간 측면에서 MR‑STORM이 일관되게 우수함을 보였다. 특히 동적 장애물에 대한 반응 속도가 빠르고, 우선순위 스키마 덕분에 복잡한 협동 작업(예: 두 팔이 동일한 작업 공간을 교차하는 경우)에서도 안정적인 궤적을 생성한다. 한계점으로는 동적 장애물의 예측 정확도가 낮을 경우 비용 함수가 과도하게 보수적으로 동작할 수 있으며, 현재 구현은 구 기반 근사에 의존하므로 매우 복잡한 형상의 로봇에 대해서는 추가적인 충돌 검사 최적화가 필요하다. 전반적으로 본 논문은 고차원 다중 로봇 시스템에서 GPU 기반 샘플링 MPC를 실시간으로 적용할 수 있는 실용적인 프레임워크를 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기