확률적 상태 제약을 갖는 비선형 확률 시스템의 재귀적 최적 제어 설계
초록
본 논문은 연속시간 비선형 확률 시스템에 대해, 확률적 상태 제약을 만족하면서 실시간 구현이 가능한 재귀적(리시딩) 최적 제어 프레임워크를 제시한다. 시스템의 드리프트(확정적) 부분을 이용해 참조 경로를 생성하고, 그 경로를 따라가도록 확률 최적 제어기를 설계한다. 일부 경우에는 닫힌 형태 해를 얻을 수 있으며, 일반적인 경우에는 사전 계산된 수치 해를 실시간에 적용한다. 입력 제한이 없을 때 폐루프 수렴성을 증명하고, 시뮬레이션을 통해 이론적 결과를 검증한다.
상세 분석
이 연구는 확률 미분 방정식으로 기술되는 비선형 시스템에 대해, 전통적인 모델 예측 제어(MPC)의 개념을 확률적 환경으로 확장한다는 점에서 의미가 크다. 먼저 시스템을 deterministic drift와 stochastic diffusion으로 분리하고, drift만을 이용해 최적 경로(레퍼런스 트래젝터리)를 생성한다는 아이디어는 계산 복잡도를 크게 낮춘다. 이는 실시간 제어가 요구되는 모바일 로봇이나 드론 등에 적용 가능하도록 설계된 것이다. 두 번째 단계에서는 생성된 레퍼런스를 따라가면서 확률적 상태 제약—예를 들어, 특정 영역을 일정 확률 이하로 침범하지 않도록 하는 제약—을 만족시키는 제어 입력을 구한다. 여기서 저자들은 Hamilton‑Jacobi‑Bellman(HJB) 방정식의 확률적 형태를 이용해 최적 제어 법칙을 도출한다. 특수한 시스템(예: 선형화 가능한 경우)에서는 HJB 방정식이 해석적으로 풀려 닫힌 형태 해가 얻어지며, 이는 실시간 피드백으로 바로 적용할 수 있다. 보다 일반적인 비선형 경우에는 수치적으로 사전 계산된 가치 함수와 최적 정책을 테이블 형태로 저장하고, 실행 단계에서는 보간을 통해 빠르게 제어 신호를 산출한다. 이 접근법은 온라인 최적화가 필요 없으므로 현재 상용 모바일 프로세서에서도 충분히 구현 가능하다. 수렴성 증명에서는 입력 제한을 두지 않은 가정 하에, Lyapunov‑like 함수와 확률적 안정성 이론을 결합해 상태가 레퍼런스 경로에 거의 확실히 수렴함을 보인다. 다만 입력 제한이 존재하거나 제약이 매우 강한 경우에는 추가적인 보조 제어 설계가 필요할 수 있다. 시뮬레이션에서는 2차원 비선형 로봇 모델에 확률적 장애물 회피 제약을 적용해, 제안된 방법이 기존 deterministic MPC 대비 확률적 안전성을 크게 향상시키면서도 계산 시간을 실시간 수준(수 ms)으로 유지함을 보여준다. 전체적으로 이 논문은 확률적 제약을 갖는 비선형 시스템에 대한 실시간 구현 가능성을 열어준 중요한 기여라 할 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기