연속 피드백 최적 제어를 위한 제2변분 기반 제어 구속 해법

본 논문은 제어 변수가 폐구간에 제한되는 최적 제어 문제를 해결하기 위해, 라그랑지안의 2차 전개를 이용한 연속적인 제2변분 알고리즘을 제시한다. 전·후방 적분 단계에서 연속적인 ODE 해를 보간 저장함으로써 시간 메쉬를 자동으로 조정하고, 선형 제어 업데이트를 통해 피드백 형태의 최적 제어법을 도출한다. 특히 bang‑bang 구조를 갖는 문제에 대해 스위칭 시점을 자동으로 탐지할 수 있음을 실험으로 입증한다.

저자: Joris T. Olympio

연속 피드백 최적 제어를 위한 제2변분 기반 제어 구속 해법
본 연구는 제어 변수가 폐구간에 제한되는 최적 제어 문제를 해결하기 위한 새로운 연속 제2변분 알고리즘을 제안한다. 먼저 문제 설정을 명확히 정의한다. 상태 방정식은 \(\dot x = f(x,u,p;t)\) 로 주어지고, 초기 조건 \(\phi(x(t_0),x_0,p_0)=0\) 과 최종 제약 \(\psi(x(t_f),p_f)=0\) 가 존재한다. 제어 구속은 박스 형태 \(u_l \le u \le u_u\) 로 가정한다. 목적함수는 메이어 형태 \(J(x(t_f),p_f)\) 로 주어지며, 최소화 대상이다. 알고리즘의 핵심은 라그랑지안을 \(\mathcal L\) 로 정의하고, 이를 명목 궤적 \((\bar x,\bar u,\bar p)\) 주변에서 2차 전개한다. 전개 결과는 제어 업데이트 식 \(\delta u = \alpha + \beta\,\delta x + \gamma\,\delta p + \omega\,\delta\nu\) 로 정리된다. 여기서 \(\alpha = -H_{uu}^{-1}H_u\), \(\beta = -H_{uu}^{-1}(H_{xu}+R^T f_u)\) 등은 모두 해밀토니안 \(H\) 와 비용함수의 2차 미분에 의해 계산된다. 후방 단계에서는 비용함수와 제약조건에 대한 민감도 행렬 \(R, K, Q, T, V, W\) 를 Riccati‑형 미분방정식으로 적분한다. 구체적으로는 \

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기