프리뷰 제어의 H∞와 레그렛 최적화: 무한 미리보기로 비인과성 성능 달성
초록
본 논문은 이산시간 선형 시스템에 대해 p단계 외란 프리뷰 정보를 이용한 H∞ 제어와 레그렛 최적 제어를 연구한다. 프리뷰 길이 p가 증가함에 따라 H∞ 성능과 레그렛이 각각 비인과성(전지식) 최적 제어와 수렴함을 증명하고, 수치 예제로 이를 확인한다.
상세 분석
논문은 먼저 외란 프리뷰(p‑step preview)를 포함하도록 시스템 상태를 확장하는 전통적인 H∞ 합성 방법을 재정리한다. 확장된 상태 ˆxₚ(t)는 현재 상태와 앞으로 p‑step까지의 외란 샘플을 포함하며, 이를 통해 표준 전정보 H∞ 설계 절차를 그대로 적용할 수 있다. Theorem 2는 확장된 시스템에 대한 DARE(이산형 리카티 방정식)와 LMI 조건을 제시하고, γ‑suboptimal 프리뷰 컨트롤러가 존재하기 위한 필요충분조건을 명시한다. 여기서 γ는 폐루프 ℓ₂ 이득의 상한이며, γ가 작을수록 성능이 우수함을 의미한다.
다음으로 논문은 비인과성 최적 컨트롤러 K_nc를 정의한다. K_nc는 현재와 미래 모든 외란 정보를 이용해 비용 J(K,d)를 최소화한다. Theorem 1은 DARE의 안정해 X와 피드백 이득 Kₓ, K_v, K_d를 통해 K_nc의 상태공간 표현을 제공한다. 이 비인과성 컨트롤러는 모든 인과적(시간에 의존하는) 컨트롤러보다 비용이 작거나 같다.
핵심 기여는 두 가지 수렴 결과이다. 첫 번째는 H∞ 프리뷰 컨트롤러의 폐루프 성능 γ_{∞,p}가 p→∞일 때 비인과성 H∞ 한계 γ_nc에 수렴한다는 정리(정리 4)이다. 증명은 Lemma 1을 이용해 H₂ 프리뷰 컨트롤러 K_{2,p}의 비용이 모든 결정론적 외란 d에 대해 J(K_{2,p},d)→J(K_nc,d)임을 보이고, 이를 통해 H∞ 최적 컨트롤러가 더 작은 γ를 달성함을 보인다. 두 번째는 레그렛 관점이다. Definition 1에 따라 γ‑regret은 인과적 컨트롤러와 비인과성 기준 사이의 비용 차이를 ‖d‖₂²로 정규화한 값이다. Theorem 5는 γ_{R,p}→0 (p→∞)임을 증명한다. 즉, 충분히 긴 프리뷰를 제공하면 레그렛이 사라져 인과적 컨트롤러가 비인과성 기준과 동일한 성능을 달성한다.
수치 예제에서는 2차 시스템을 대상으로 p를 0부터 증가시켜 γ_{∞,p}와 γ_{R,p}를 계산한다. 결과는 γ_{∞,p}가 단조 증가하면서 γ_nc에 근접하고, γ_{R,p}는 급격히 감소해 0에 수렴함을 보여준다. 이는 이론적 수렴 결과가 실제 시스템에서도 실현 가능함을 확인시킨다.
이 논문은 프리뷰 정보를 활용한 고전적인 H∞ 설계와 최신 레그렛 최적화 이론을 통합함으로써, 프리뷰 길이가 충분히 클 경우 인과적 제어기가 비인과성 최적 성능을 달성할 수 있음을 엄밀히 증명한다. 또한, 프리뷰 제어가 LTI 구조를 유지하므로 구현이 비교적 간단하고, 시간-가변 최적화 기반 레그렛 제어와 달리 이론적 분석이 용이하다는 실용적 장점을 강조한다.
댓글 및 학술 토론
Loading comments...
의견 남기기