고정시간 선형 이차 공분산 조정 힐버트 슈미트 종단 비용
초록
본 논문은 연속시간 선형 시스템에서 고정된 시간 구간 내에 상태 공분산을 원하는 목표 공분산으로 이동시키는 LQ 최적제어 문제를 다룬다. 종단 비용을 힐버트‑슈미트(프루베니우스) 노름의 제곱으로 정의하고, 최적조건을 두 점 경계값 문제 형태의 행렬 미분방정식으로 유도한다. 이후 해를 구하기 위해 선형분수변환(LFT)과 해밀토니안 행렬의 상태전이 행렬을 이용한 재귀 알고리즘을 설계하고, 수렴성을 증명한다. 두 개의 수치 예시(2차 및 6차 시스템)로 방법의 실효성을 확인한다.
상세 분석
논문은 먼저 연속시간 선형 시스템 dxₜ = Aₜxₜdt + Bₜuₜdt + Bₜdwₜ에 대해 초기 공분산 Σ₀와 목표 공분산 Σ_d가 주어졌을 때, 제어 입력 uₜ = Kₜxₜ 형태의 선형 피드백을 설계한다. 목적함수는 ∫₀¹(E‖uₜ‖² + xₜᵀQₜxₜ)dt와 함께, 최종 공분산 Σ₁과 Σ_d 사이의 힐버트‑슈미트 거리 ½‖Σ₁−Σ_d‖_F²를 추가한다. Pontryagin 최소원리를 적용하면, 공분산 Σₜ와 비용ate Pₜ가 만족하는 연계된 행렬 ODE (6a)-(6b)와 경계조건 Σ₀, P₁ = Σ₁−Σ_d가 도출된다. 이 시스템은 전방 라플라스 방정식과 후방 리카티 방정식이 결합된 형태로, 직접 수치해석이 어려운 점이 있다. 이를 해결하기 위해 변수 변환 Hₜ = Σₜ⁻¹ − Pₜ를 도입하고, 두 리카티 방정식(15a)-(15b)을 각각 뒤로·앞으로 적분한다. 해밀토니안 행렬 Mₜ와 그 상태전이 행렬 Φ(s,t)의 블록을 이용하면, P₁→P₀와 H₀→H₁ 변환을 선형분수변환(LFT) 형태(21),(22)로 명시할 수 있다. LFT는 전단사이며 대칭성을 보존한다는 정리(1)를 증명한다. 이후 H₁과 P₁ 사이의 경계조건(15d)를 만족하도록 H₁ = (P₁+Σ_d)⁻¹ − P₁을 정의하고, 이를 이용해 P₁을 고정점 문제로 전환한다. 제안된 재귀 알고리즘은 초기 추정 P₁⁽⁰⁾을 설정하고, LFT와 해석적 알지브라적 리카티 해를 차례로 적용해 새로운 P₁을 생성한다. 정리(4)는 이 비선형 매핑이 수축성을 가지며, 유일한 고정점에 수렴함을 보인다. 수치 실험에서는 2차 이중 적분기와 6차 근접 궤도 결합 문제에 대해 알고리즘을 적용, 목표 공분산에 근접하면서 제어 비용도 최소화되는 결과를 보여준다. 전체적으로, 힐버트‑슈미트 종단 비용을 이용한 연속시간 공분산 조정 문제에 대해 이론적 최적조건을 명확히 하고, 실용적인 수치 해법을 제공한다.
댓글 및 학술 토론
Loading comments...
의견 남기기