비선형 MPC를 위한 범용 레퍼런스 터미널 설계 프레임워크

본 논문은 지역적 증분 안정성을 만족하는 비선형 시스템에 대해, 레퍼런스 궤적에 독립적인 파라미터화된 터미널 비용과 터미널 집합을 오프라인으로 설계하는 방법을 제시한다. 이를 통해 온라인 계산 복잡도는 그대로 유지하면서도, 도달 가능한 일반 레퍼런스 궤적에 대해 안정적인 추적 MPC를 구현할 수 있다. 또한, 설계된 터미널 비용을 이용해 도달 불가능한 레퍼런스나 온라인 변동 조건에서도 견고하게 동작하는 MPC 스키마를 구성한다. 논문은 LMI …

저자: Johannes K"ohler, Matthias A. M"uller, Frank Allg"ower

비선형 MPC를 위한 범용 레퍼런스 터미널 설계 프레임워크
본 논문은 비선형 모델 예측 제어(MPC)에서 레퍼런스 궤적을 추적하기 위한 터미널 성분(터미널 비용·터미널 집합)의 설계 문제를 해결하는 새로운 프레임워크를 제시한다. 기존 연구들은 주로 선형 시스템이나 정해진 정점(setpoint)에 한정된 터미널 설계 방법을 제안했으며, 동적인 레퍼런스나 비선형 시스템에 적용하기 위해서는 매번 오프라인 재계산이 필요하거나, 터미널 비용이 비연속·비미분 가능해 수치적 어려움을 겪었다. 이러한 한계를 극복하고자 저자들은 **레퍼런스 제네릭(reference generic)**이라는 개념을 도입한다. 이는 레퍼런스 궤적에 독립적인 파라미터화된 터미널 비용과 터미널 집합을 미리 계산해 두고, 온라인에서는 레퍼런스 값만을 매개변수로 조회하여 사용한다는 의미이다. 논문은 먼저 비선형 시스템 x(t+1)=f(x(t),u(t)) 에 대해, **지역적 증분 안정성(local incremental stabilizability)**을 가정한다. 이는 시스템이 두 개의 궤적 사이의 오차를 선형화된 동역학으로 근사할 수 있으며, 적절한 피드백 K_f(r)와 양정 행렬 P_f(r)를 통해 오차가 지수적으로 감소한다는 특성을 의미한다. **오프라인 설계 절차**는 다음과 같다. 1. 레퍼런스 공간 Z_r (제약 내부)에서 가능한 모든 작동점 r에 대해 Jacobian A(r)=∂f/∂x|_r, B(r)=∂f/∂u|_r 를 계산한다. 2. 매 작동점에 대해 피드백 K_f(r)와 비용 행렬 P_f(r) 를 연속적으로 매핑하도록 설계한다. 이를 위해 Lemma 1에서 제시된 LMI(10)을 만족하도록 K_f(r), P_f(r) 를 구한다. LMI는 (A+B K)ᵀP(r+)(A+B K) ≤ P(r) – (Q+KᵀRK) – εI 형태이며, ε>0와 충분히 작은 α를 선택하면 Assumption 2의 감소 조건(4a)과 제약 조건(4b)를 보장한다. 3. 위 LMI를 다중 샘플링 포인트(또는 폴리토프 꼭짓점)에서 풀어, K_f와 P_f를 다항식 혹은 선형 보간식으로 파라미터화한다. 이렇게 하면 레퍼런스 r이 연속적으로 변해도 실시간으로 K_f(r), P_f(r) 를 조회할 수 있다. 4. 터미널 집합 X_f(r)= {x | ‖x–x_r‖²_{P_f(r)} ≤ α } 를 정의하고, α는 LMI 해석 과정에서 보장되는 충분히 작은 값으로 설정한다. **온라인 MPC**는 기존의 표준 MPC 최적화 문제(5a–5e)에 위에서 정의한 파라미터화된 터미널 비용 V_f(x,r)=‖x–x_r‖²_{P_f(r)}와 터미널 제약 X_f(r) 를 그대로 삽입한다. 예측 호라이즌 N은 짧게 유지할 수 있으며, 최적화 변수는 상태·입력 시퀀스뿐이다. 최적화 결과로 얻은 첫 번째 입력 u*(0|t)를 시스템에 적용하고, 다음 스텝에서는 새로운 레퍼런스 r(t+1)와 상태 x(t+1)으로 다시 최적화를 수행한다. Theorem 1에 의해, Assumption 1·2와 초기 가용성만 만족하면 **재귀적 가용성**과 **지수적 안정성**이 보장된다. 논문은 또한 다음과 같은 확장을 제공한다. - **견고 추적**(Appendix B): 외란·모델 불확실성을 고려한 튼튼한 MPC 설계 방법을 제시한다. - **연속시간 시스템**(Appendix C): 동일한 설계 원리를 연속시간 비선형 시스템에 적용하기 위해 미분 방정식 형태로 변형한다. - **출력 기반 스테이지 비용**(Appendix D): 상태가 직접 측정되지 않을 경우, 출력 y=h(x,u) 기반의 비용 ‖h(x,u)–h(x_r,u_r)‖²_{S(r)} 를 사용하도록 확장한다. **실험**에서는 자동차 회피 기동 시나리오를 사용해 세 가지 제어 전략을 비교한다. (i) 터미널 등식 제약만을 사용한 기존 MPC, (ii) 터미널 제약 없이 긴 호라이즌을 사용한 MPC, (iii) 제안된 파라미터화 터미널 비용·집합을 적용한 짧은 호라이즌 MPC. 결과는 (iii) 방식이 추적 오차와 제약 위반률 모두에서 현저히 우수함을 보여준다. 또한, 도달 불가능한 레퍼런스에 대해서는 인공 레퍼런스를 생성하고 동일한 터미널 비용을 재활용함으로써 안정적인 동작을 유지한다는 점을 시연한다. 결론적으로, 이 논문은 **증분 안정성**이라는 현대 제어 이론을 활용해 비선형 시스템에 대한 **레퍼런스 독립적인 터미널 설계**를 가능하게 하였으며, 온라인 계산 부담을 최소화하면서도 다양한 운영 조건(동적 레퍼런스, 도달 불가능 레퍼런스, 외란)에서 안정적인 MPC 구현을 지원한다. 이는 비선형 MPC의 실용화를 위한 중요한 진전으로 평가될 수 있다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기