실시간 확률 최적 제어를 이용한 다중 쿼드로터 시스템
** 본 논문은 중앙집중식 고수준 플래너와 저수준 PID 컨트롤러를 결합한 계층적 구조를 통해, 경로 적분(PI) 기반 확률 최적 제어를 실시간으로 다중 쿼드로터에 적용한다. 샘플링 기반 추론으로 최적 속도 시퀀스를 생성하고, 이를 저수준 비행 제어기에 전달해 실외 환경에서 3대의 실제 드론을 성공적으로 운용한다. **
저자: Vicenc{c} Gomez, Sep Thijssen, Andrew Symington
**
본 논문은 다중 쿼드로터 시스템을 위한 실시간 확률 최적 제어 방법을 제안한다. 저자들은 두 단계로 구성된 계층적 제어 구조를 설계했으며, 고수준 플래너는 경로 적분(Path‑Integral, PI) 제어 이론에 기반해 최적 속도 시퀀스를 계산하고, 저수준 컨트롤러는 플랫폼‑특화 PID 속도‑높이 제어기를 통해 이 목표 속도를 실제 비행 제어 시스템에 전달한다.
**이론적 배경**
SOC(확률 최적 제어)는 일반적으로 HJB 방정식의 비선형성을 해결하기 어려워 실용화에 제약이 있다. 그러나 제어 비용 행렬 R과 잡음 공분산 Σᵤ 사이에 Σᵤ = λ R⁻¹ 라는 관계를 가정하면, HJB 방정식이 선형화되어 Feynman‑Kac 공식에 의해 최적 제어가 경로 적분 형태로 표현된다. 이때 최적 제어는 “샘플링된 경로들의 가중 평균”이며, 샘플링 효율을 높이기 위해 중요도 샘플링을 적용한다.
**알고리즘**
Algorithm 1은 고수준 PI 컨트롤러의 흐름을 상세히 제시한다. 현재 상태 x₀와 목표 시간 구간 H, 샘플 수 N, 시간 간격 Δt, 비용 함수 rₜ(·), 잡음 공분산 Σᵤ, 그리고 현재 제어 시퀀스 uₜ:Δt:t+H 를 입력으로 받아, 다음 과정을 수행한다.
1. N개의 경로 τₖ를 식 (5) 기반의 선형 이중 적분기 모델에 따라 시뮬레이션한다.
2. 각 경로에 대해 비용 Sₖ를 식 (2) 로 계산한다.
3. 비용에 기반한 가중치 wₖ = exp(−Sₖ/λ) 로 정규화한다.
4. 각 시간 단계 s에 대해 u*ₛ = uₛ + (1/Δt) Σₖ wₖ (ξ_{s+Δt}ᵏ − ξ_sᵏ) 를 구한다.
5. 현재 속도 vₜ에 u*ₜ를 적분해 다음 목표 속도 v_{t+Δt} = vₜ + u*ₜ Δt 를 얻고, 이를 저수준 컨트롤러에 전달한다.
**시스템 모델링**
고수준 플래너는 각 드론을 2‑D 점 질량(double integrator) 모델로 단순화한다. 상태 xᵢ =
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기