제어를 위한 방향성 시계열 회귀
초록
본 논문은 확실성 등가 모델 예측 제어(MPC)에서 사용할 시계열 모델 파라미터를 추정하기 위한 새로운 방법인 ‘방향성 시계열 회귀’를 제안한다. 기존의 최소제곱 회귀와 경험적 최적화의 장점을 결합하여, 시뮬레이션 기반의 역진자 균형 문제에서 제어 성능을 크게 향상시켰음을 보인다.
상세 분석
논문은 먼저 확실성 등가 MPC가 미래의 외란을 예측하기 위해 시계열 모델을 필요로 한다는 점을 강조한다. 전통적으로는 최소제곱(LS) 회귀를 이용해 모델 파라미터를 추정하지만, LS는 예측 오차를 최소화하는 데는 효율적이지만 실제 제어 목적(예: 비용 최소화)과는 직접적인 연관성이 부족하다. 반면 경험적 최적화(Empirical Optimization, EO)는 시뮬레이션을 통해 제어 비용을 직접 최소화하도록 파라미터를 조정하지만, 샘플 수가 제한될 경우 과적합 위험이 크고 계산 비용이 많이 든다.
‘방향성 시계열 회귀(Directed Time Series Regression, DTR)’는 이 두 접근법을 통합한다. 구체적으로, LS로 얻은 초기 파라미터를 출발점으로 삼고, EO에서 얻은 그라디언트 정보를 이용해 파라미터를 방향성 있게 업데이트한다. 이때 업데이트 방향은 제어 비용에 대한 민감도(gradient)를 기반으로 하며, 학습률은 검증 데이터셋을 통해 자동 조정된다. 결과적으로 DTR은 LS의 안정성과 EO의 목적 지향성을 동시에 확보한다.
실험에서는 잘 알려진 역진자(inverted pendulum) 균형 문제를 확률적 버전으로 변형하여 사용한다. 시스템은 연속 시간 선형화 모델에 외란이 가해지는 형태이며, MPC는 10단계 예측 호라이즌을 갖는다. 비교 대상은 순수 LS, 순수 EO, 그리고 DTR이다. 성능 평가는 평균 제어 비용, 상태 오차, 그리고 제어 입력의 변동성을 포함한다. 결과는 DTR이 LS보다 평균 비용을 약 15 % 감소시키고, EO 대비 과적합 현상이 현저히 적으며, 계산 시간도 EO의 40 % 수준으로 효율적임을 보여준다.
또한 저자는 DTR이 모델 구조가 잘못 지정된 경우에도 일정 수준의 견고성을 유지한다는 점을 강조한다. 이는 파라미터 업데이트가 비용 민감도에 기반하므로, 모델 오류가 직접적으로 비용에 큰 영향을 미치지 않을 경우 자동으로 보정 효과가 발생하기 때문이다. 마지막으로, DTR은 다른 제어 프레임워크(예: 강화학습 기반 정책)와도 쉽게 결합될 수 있는 모듈식 구조를 가지고 있음을 언급한다.
댓글 및 학술 토론
Loading comments...
의견 남기기