온라인 학습 기반 감독 스위칭 제어

본 논문은 부분 관측 가능한 선형 시스템에서 여러 후보 컨트롤러 중 최적의 컨트롤러를 빠르게 찾기 위해 다중 팔 밴딧 기법을 적용한 비대칭적 비정상 분석 프레임워크를 제시한다. 제안 알고리즘은 시스템 관측성을 이용해 초기 상태를 복원하고, 불안정 컨트롤러를 탐지하면서도 제한된 샘플 복잡도로 \(O(N\log N)\) 단계 내에 최적 컨트롤러를 식별한다. 또한 외란에 대한 유한 \(L_2\) 이득 보장을 제공한다.

저자: Haoyuan Sun, Ali Jadbabaie

본 논문은 부분 관측 가능한 선형 동역학 시스템에 대해 다수의 후보 컨트롤러 중 최적의 컨트롤러를 빠르고 안전하게 식별하는 새로운 감독 스위칭 프레임워크를 제안한다. 전통적인 추정 기반 감독 제어는 시스템이 안정적일 때만 asymptotic 안정성을 보장하고, 실제 적용 시 필요한 유한 시간 성능 한계를 제공하지 못한다. 반면, 최신 비정상적 시스템 식별 기법은 안정성 가정을 전제로 하여, 불안정 컨트롤러를 시험할 수 없는 한계가 있다. 이러한 격차를 메우기 위해 저자들은 다중 팔 밴딧(MAB) 알고리즘을 제어 문제에 직접 적용하고, 시스템 관측성을 활용해 초기 상태를 복원함으로써 불안정 컨트롤러를 탐지하고, 동시에 시스템 식별 정확도를 확보한다. 문제 설정은 다음과 같다. \(N\)개의 후보 모델 \(\{(C_i,A_i,B_i)\}_{i=1}^N\)과 각각에 대응하는 선형 컨트롤러가 주어지고, 실제 시스템 파라미터 \((C_\star,A_\star,B_\star)\)는 이 컬렉션 중 하나이다. 각 모델‑컨트롤러 쌍 \((i,j)\)에 대해 닫힌 루프 시스템 \(M

온라인 학습 기반 감독 스위칭 제어

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기