실시간 확률 최적 제어를 이용한 다중 쿼드로터 시스템

** 본 논문은 다중 쿼드로터 시스템을 위한 실시간 확률 최적 제어 방법을 제안한다. 저자들은 두 단계로 구성된 계층적 제어 구조를 설계했으며, 고수준 플래너는 경로 적분(Path‑Integral, PI) 제어 이론에 기반해 최적 속도 시퀀스를 계산하고, 저수준 컨트롤러는 플랫폼‑특화 PID 속도‑높이 제어기를 통해 이 목표 속도를 실제 비행 제어 시스템에 전달한다. **이론적 배경** SOC(확률 최적 제어)는 일반적으로 HJB 방정식의 비선형성을 해결하기 어려워 실용화에 제약이 있다. 그러나 제어 비용 행렬 R과 잡음 공분산 Σᵤ 사이에 Σᵤ = λ R⁻¹ 라는 관계를 가정하면, HJB 방정식이 선형화되어 Feynman‑Kac 공식에 의해 최적 제어가 경로 적분 형태로 표현된다. 이때 최적 제어는 “샘플링된 경로들의 가중 평균”이며, 샘플링 효율을 높이기 위해 중요도 샘플링을 적용한다. **알고리즘** Algorithm 1은 고수준 PI 컨트롤러의 흐름을 상세히 제시한다. 현재 상태 x₀와 목표 시간 구간 H, 샘플 수 N, 시간 간격 Δt, 비용 함수 rₜ(·), 잡음 공분산 Σᵤ, 그리고 현재 제어 시퀀스 uₜ:Δt:t+H 를 입력으로 받아, 다음 과정을 수행한다. 1. N개의 경로 τₖ를 식 (5) 기반의 선형 이중 적분기 모델에 따라 시뮬레이션한다. 2. 각 경로에 대해 비용 Sₖ를 식 (2) 로 계산한다. 3. 비용에 기반한 가중치 wₖ = exp(−Sₖ/λ) 로 정규화한다. 4. 각 시간 단계 s에 대해 u*ₛ = uₛ + (1/Δt) Σₖ wₖ (ξ_{s+Δt}ᵏ − ξ_sᵏ) 를 구한다. 5. 현재 속도 vₜ에 u*ₜ를 적분해 다음 목표 속도 v_{t+Δt} = vₜ + u*ₜ Δt 를 얻고, 이를 저수준 컨트롤러에 전달한다. **시스템 모델링** 고수준 플래너는 각 드론을 2‑D 점 질량(double integrator) 모델로 단순화한다. 상태 xᵢ =

실시간 확률 최적 제어를 이용한 다중 쿼드로터 시스템

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기