협업 온라인 학습 기반 분산 강인 로봇 군집 충돌 회피 제어
초록
본 논문은 다중 로봇 시스템이 가시성 제한과 부분 관측된 장애물 움직임을 고려해, 디리클레 과정 혼합 모델(DPMM)로 협업 온라인 학습을 수행하고, 로컬 모멘트 기반 모호성 집합을 구성한다. 이를 예측 구간 전체에 전파하고, 거리 기반 압축으로 복잡성을 조절한 뒤, 반분리 초평면을 SDP로 계산해 분산 강인 최적화 문제를 해결함으로써 확률적 충돌 회피와 장기 추적 성능을 보장한다.
상세 분석
본 연구는 다중 로봇 시스템이 동적이고 불확실한 환경에서 안전하게 움직이기 위해 세 가지 핵심 기술을 통합한다. 첫째, 장애물의 움직임 분포를 직접 측정하기 어려운 상황을 고려해, 각 로봇이 부분적으로 수집한 데이터 스트림을 기반으로 디리클레 과정 혼합 모델(DPMM)을 이용한 협업 온라인 학습(COOL) 메커니즘을 설계하였다. DPMM은 비모수적 베이지안 방법으로, 사전 정의된 클러스터 수 없이도 데이터의 잠재 구조를 자동으로 추출한다. 로봇들은 선택된 학습 구조(예: 클러스터 중심 및 공분산)를 교환함으로써, 관측된 로컬 모멘트(1차·2차 통계)를 공유하고, 이를 통해 장애물 움직임에 대한 고해상도 확률 정보를 효율적으로 재구성한다.
둘째, 이렇게 얻어진 로컬 모멘트를 활용해 ‘모호성 집합(ambiguity set)’을 정의한다. 기존 연구가 주로 Wasserstein 거리 기반의 구형 모호성 집합을 사용해 중심 분포를 경험적 분포에 고정하는 반면, 본 논문은 순간적인 모멘트 정보를 이용해 다변량 구형이 아닌, 보다 일반적인 형태의 집합을 구성한다. 특히, 현재 위치와 모호성 집합을 이용해 미래 위치에 대한 모호성 집합을 전파하는 ‘모호성 집합 전파(Propagation)’ 방법을 제시한다. 이 전파는 장애물 움직임이 i.i.d.이며 선형 변환을 따를 때, 현재 모호성 집합을 선형 연산과 Minkowski 합을 통해 예측 구간 전체에 확장함을 수학적으로 증명한다.
셋째, 전파된 모호성 집합은 차원과 복잡도가 급격히 증가할 수 있기 때문에, ‘압축 스킴(compression scheme)’을 도입한다. 이는 측정 공간에서 서로 가까운 기본 모호성 집합을 하나의 집합으로 병합하는 방식으로, 병합 기준을 거리 함수와 허용 오차 ε로 정의한다. 압축 과정은 확률적 안전성을 보장하도록 설계돼, 압축 전후의 집합이 원래 집합을 포함함을 보장한다(즉, 보수적 상한 유지). 압축 정도는 실시간 계산 제한에 따라 조정 가능해, 제어 성능과 계산 부하 사이의 트레이드오프를 유연하게 관리한다.
제어 단계에서는 압축된 모호성 집합을 이용해 분산 강인 최적화(DRO) 문제를 구성한다. 충돌 회피 제약은 “모든 가능한 장애물 분포에 대해 충돌 확률이 허용 수준 이하”라는 형태이며, 이는 반분리 초평면(separating hyperplane)으로 변환된다. 초평면은 반분리 조건을 만족하는 최소 비용의 선형 함수이며, 이를 반정규화된 반분리 초평면을 찾는 반정합 프로그램(SDP) 형태로 풀어 계산 효율성을 크게 향상시킨다. 또한, 로봇 간 상호 충돌 방지를 위해 동일한 초평면 기반의 공간 할당 프로토콜을 제시한다.
이론적 분석에서는 (i) 모호성 집합 전파가 예측 구간 전체에 대한 정확한 상한을 제공함을, (ii) 압축 스킴이 안전성을 손상시키지 않으며, (iii) SDP 기반 초평면이 원래 비선형 확률 제약을 등가적인 선형 제약으로 변환함을 증명한다. 마지막으로, 전체 프레임워크가 확률적 충돌 회피 보장과 장기 추적 성능 보장을 동시에 만족한다는 정리와 증명을 제시한다.
시뮬레이션 결과는 제안 방법이 기존의 확률적 제약 기반 MPC, 기존 DRO-MPC, 그리고 최신 분산 학습 기반 방법에 비해 (1) 충돌 회피 성공률이 1015% 향상, (2) 평균 제어 비용이 812% 감소, (3) 실시간 실행 시간(10 ms 이하)에서 안정적인 성능을 유지함을 보여준다. 특히, 장애물 가시성이 급격히 감소하는 상황에서도 협업 학습을 통한 모호성 집합 업데이트가 빠르게 이루어져, 안전성을 크게 희생하지 않고도 높은 제어 효율을 달성한다.
요약하면, 본 논문은 (1) 비모수적 협업 온라인 학습, (2) 모멘트 기반 모호성 집합 전파 및 압축, (3) SDP 기반 반분리 초평면을 결합한 분산 강인 제어 프레임워크를 제시함으로써, 다중 로봇 시스템이 부분 관측, 가시성 차단, 그리고 불확실한 동적 장애물 환경에서도 실시간으로 안전하고 효율적인 궤적을 생성할 수 있음을 입증한다.
댓글 및 학술 토론
Loading comments...
의견 남기기