제약선형시스템의 강인 온라인 최적제어와 레퍼런스 거버너 통합 설계
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.
초록
본 논문은 시간에 따라 변하고 사전에 알 수 없는 비용함수와 외란을 동시에 고려하면서, 상태·입력 제약을 만족하는 선형 시불변 시스템의 강인 제어 방법을 제안한다. 온라인 경사 하강법(OGD) 기반의 최적 레퍼런스를 생성하고, 레퍼런스 거버너와 제약 강화 기법을 결합해 재귀적 실현 가능성과 강인 제약 만족을 보장한다. 또한 동적 레짐(regret)을 비용변동과 외란 크기에 비례하도록 제한함을 증명한다.
상세 분석
이 연구는 온라인 컨벡스 최적화(OCO)와 레퍼런스 거버너(RG)의 장점을 융합한 새로운 제어 프레임워크를 제시한다. 시스템 모델은 외란 wₜ가 추가된 선형 시불변 형태 xₜ₊₁ = A xₜ + B uₜ + B_w wₜ 로 가정하고, 상태·입력 제약을 출력 yₜ = C₀ xₜ + D uₜ + D_w wₜ ∈ 𝒴 로 정의한다. 안정화 피드백 K를 미리 설계해 폐루프 행렬 A_K = A + B K 를 Schur 안정하게 만든 뒤, 가상 레퍼런스 vₜ를 도입해 uₜ = vₜ + K xₜ 로 제어한다. 이때 vₜ는 OCO 알고리즘이 생성한 후보 레퍼런스 rₜ를 기반으로 RG가 조정한다.
핵심 아이디어는 두 단계로 나뉜다. 첫째, 온라인 경사 하강법(OGD)을 사용해 시간‑변화 비용 Lₜ(v, x)의 정적 부분 Lₛₜ(v) = Lₜ(v + K S_K v, S_K v)의 최소점 ηₜ를 추정한다. 여기서 S_K = (I - A_K)⁻¹ B 는 가상 레퍼런스와 시스템 정상 상태 사이의 매핑이다. OGD는 rₜ₊₁ = Π_{𝒮_v}
댓글 및 학술 토론
Loading comments...
의견 남기기