가우시안 프로세스 회귀를 이용한 능동 학습 기반 이중 제어
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.
초록
본 논문은 관측 비용이 높거나 시스템이 급변하는 상황에서 제한된 데이터만을 이용해 비선형 이산시간 시스템을 식별하고 제어하기 위한 프레임워크를 제시한다. 정보 이론의 엔트로피를 정보 획득량으로 정량화하고, 이를 학습 데이터로 활용하는 가우시안 프로세스(GP) 회귀를 결합해 제어 입력을 선택한다. 식별과 제어 목표를 동시에 최적화하는 다목적 메타‑최적화 문제로 정의하고, 로지스틱 맵 혼돈 제어와 카트‑인버티드 펜듈럼 위치 제어 두 사례를 통해 성능을 검증한다.
상세 분석
이 논문은 전통적인 이중 제어(dual control) 개념을 베이지안 학습 관점에서 재구성한다. 핵심 아이디어는 ‘관측 → GP 업데이트 → 제어 입력 최적화’의 순환 과정을 통해 제한된 데이터에서 최대 정보를 추출하고, 동시에 제어 성능을 향상시키는 것이다.
- 가우시안 프로세스 회귀: 비선형 시스템의 상태‑전이 함수를 비모수적 방식으로 모델링한다. 평균 함수는 0으로 가정하고, 공분산(커널) 함수는 일반적인 RBF 커널을 사용한다. 관측 노이즈는 가우시안으로 가정해 공분산 행렬에 대각선 항으로 추가한다. 이렇게 하면 새로운 데이터 포인트가 추가될 때마다 사후 평균과 분산을 폐쇄 형태로 계산할 수 있다.
- 정보량 정량화: 각 후보 제어 입력에 대해 얻을 수 있는 정보량을 엔트로피 감소량으로 정의한다. 다변량 가우시안의 엔트로피는 공분산 행렬식의 로그에 비례하므로, 후보 입력 𝑥̂에 대한 정보량 I(𝑥̂) = ∫
댓글 및 학술 토론
Loading comments...
의견 남기기