비용 효율적인 가상 센서를 활용한 비선형 모델 예측 제어 구현
초록
본 논문은 고가 센서를 일시적으로 이용해 가상 센서를 학습하고, 이를 통해 비선형 모델 예측 제어(NMPC)를 구현하는 Predictive Virtual Sensor Identification(PVSID) 프레임워크를 제안한다. 2자유도 직접 구동 로봇 팔을 실험 플랫폼으로 사용해, 모션 캡처로 얻은 팁 위치 데이터를 가상 센서로 대체하고, IMU만을 이용한 NMPC가 동일한 궤적 추적 성능을 달성함을 입증한다.
상세 분석
PVSID는 두 가지 관측 변수 y와 w 를 명확히 구분한다. y는 실시간 운영 중에도 측정 가능한 저비용 센서(관절 각도, IMU 등)이며, w는 제어 목표와 직접 연관된 고가 센서(예: 모션 캡처)로서 모델링 단계에서만 확보한다. 논문은 이 구분을 기반으로 “다단계 예측 모델”을 동시에 학습한다는 점에서 기존의 단일 단계 상태‑공간 식별과 차별화된다.
수학적으로는 이산시간 비선형 시스템 x_{t+1}=f(x_t,u_t) 에 대해 y_t=h_y(x_t), w_t=h_w(x_t) 를 정의하고, 과거 입력‑출력 시퀀스 u_p, y_p 을 이용해 상태 추정기 E_φ (φ는 NN 파라미터)로 내부 상태 \hat{x}_t 을 생성한다. 이후 미래 입력 u_f 와 결합해 출력 예측기 P_θ (θ는 NN 파라미터)로 w_f (미래 w 시퀀스)를 직접 예측한다. 핵심은 재귀적 계산이 아닌 “한 번의 포워드 패스”로 전체 예측 호라이즌을 출력한다는 점이다. 이는 Jacobian 계산을 자동 미분으로 효율적으로 수행하게 하여 NMPC의 실시간 요구사항을 충족한다.
손실 함수는 시간 가중치 γ∈(0,1] 을 도입해 근시일 예측 오차에 더 큰 비중을 둔다. ∑{t=1}^T ∑{k=1}^{h_f} γ^{k-1}‖w_{t,k} - P_θ(E_φ(u_p^t,y_p^t),u_f^t)_k‖² 이라는 형태는, NMPC가 실제로 활용할 h_f 스텝 내의 정확도가 가장 중요함을 반영한다. 이 설계는 데이터 효율성을 높이고, 복잡한 비선형 동역학을 학습하기 위한 대규모 데이터 요구를 완화한다.
이론적 보장은 두 가지 가정에 기반한다. 첫째, 시스템이 h_p‑관측 가능하고 h_f‑관측 가능하다는 uniform k‑observability 가정; 둘째, 상태 차원 \hat{n}_x ≥ n_x 이라는 충분한 차원 가정이다. 이러한 전제 하에 Theorem 1은 상태 추정기와 출력 예측기가 존재함을, Theorem 2는 “완전 학습(perfect training)” 조건에서 이들 네트워크가 실제 시스템을 정확히 재현한다는 것을 증명한다. 실제 실험에서는 완전 학습을 달성하기는 어렵지만, 충분히 낮은 예측 오차와 안정적인 제어 성능을 보여 가정의 현실적 타당성을 뒷받침한다.
실험 플랫폼은 LEGO 부품으로 만든 2‑DoF 직접 구동 로봇 팔이며, 두 개의 롤러‑485 액추에이터와 MPU6886 IMU를 장착했다. 모델링 단계에서 OptiTrack 모션 캡처로 팁 위치 w 를 수집하고, 관절 각도와 IMU 데이터 y 를 동시에 기록했다. 수집된 데이터는 5 Hz(실제 제어는 50 Hz)로 샘플링되어, 과거 h_p 와 미래 h_f (예: h_p=10, h_f=20) 길이의 시퀀스로 변환되었다.
학습된 PVSID 모델을 NMPC에 적용할 때는 매 타임스텝마다 E_φ 로 현재 상태를 추정하고, P_θ 를 통해 미래 w_f 를 예측한다. 최적화 목표는 L(û_f, \hat{w}_f)=½ ‖ℓ(û_f)‖² 형식의 2차 비용이며, Levenberg‑Marquardt 방법으로 실시간(≤20 ms) 내에 해를 구한다. 결과는 모션 캡처를 직접 이용한 “전통 NMPC”와 거의 동일한 궤적 추적 오차(RMSE ≈ 2 mm)와 제어 입력 부드러움을 보였으며, 고가 센서 없이도 동일 수준의 성능을 달성함을 입증한다.
이 연구의 주요 기여는 (1) 고가 센서를 일시적으로 활용해 가상 센서를 학습하는 체계적 프레임워크, (2) NMPC에 최적화된 다단계 비선형 예측 모델 설계, (3) 실시간 구현을 위한 효율적인 네트워크 구조와 가중치 손실 설계, (4) 직접 구동 로봇 팔이라는 복잡한 비선형 시스템에 대한 실험적 검증이다. 제한점으로는 (i) 가상 센서 학습에 충분한 데이터가 필요하고, (ii) “완전 학습” 가정이 현실에서는 근사 수준에 머무를 수 있다는 점, (iii) 현재는 제약조건이 없는 비용 함수만 다루어 실제 산업 현장의 안전 제약을 반영하기 위해 추가 연구가 필요하다는 점을 들 수 있다. 향후 연구는 다중 로봇 시스템, 고차원 자유도, 그리고 강화학습과 결합한 하이브리드 제어 전략에 PVSID를 확장하는 방향으로 진행될 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기