준주기 가우시안 프로세스를 활용한 예측형 반복학습 제어

**1. 서론 및 배경** 반복적인 움직임을 수행하는 로봇 시스템에서는 매 반복마다 동일한 작업을 수행하지만, 환경 변화나 기계 마모 등으로 인해 성능이 점진적으로 저하된다. 반복학습 제어(ILC)는 이전 반복의 오류 정보를 활용해 제어 입력을 보정함으로써 이러한 저하를 극복한다. 그러나 전통 ILC는 과거 오류만을 반영하는 반응형 업데이트에 머물러, 오류 패턴이 주기적이거나 예측 가능한 경우 수렴 속도가 느려지는 한계가 있다. 이를 보완하기 위해 예측형 ILC(PILC)가 제안되었으며, 여기서는 시스템 모델을 이용해 차기 반복의 오류를 미리 예측하고 제어 입력에 반영한다. 기존 PILC는 선형 모델이나 신경망을 사용했으며, 가우시안 프로세스(GP)를 도입한 연구도 있다. 하지만 GP는 데이터가 누적될수록 O(N³) 복잡도가 급증해 실시간 적용이 어렵다. **2. 준주기 가우시안 프로세스(QPGP)의 도입** QPGP는 샘플 경로가 준주기적 패턴을 보이는 GP의 특수 형태이다. 최근 제안된 구조 방정식 형태는 상태 xᵢ₊₁ = ω xᵢ + εᵢ₊₁ (ω∈(−1,1)) 로 표현되며, ω는 반복 간 상관계수, ε는 i.i.d. 가우시안 잡음이다. 이 모델은 각 반복을 하나의 블록으로 보고, 블록 내부는 일반적인 주기 커널(예: RBF + cosine)로 표현한다. 핵심은 전체 데이터셋을 보관하지 않아도 최신 블록 eᵢ만으로 차기 블록 eᵢ₊₁을 예측할 수 있다는 점이다. 따라서 연산 복잡도가 O(p³) (p는 한 반복당 샘플 수)로 제한된다. **3. QPGP 기반 예측형 ILC 설계** 오류 동역학을 eᵢ₊₁ ≈ (Ω⊗I_p) eᵢ + εᵢ₊₁ (Ω=diag{ω₁,…,ω_n}) 로 근사하고, 각 출력 차원 j에 대해 독립적인 QPGP를 적용한다. 예측 단계는 두 가지 전략으로 나뉜다. - **요소별 예측**: 시간 스텝 t마다 조건부 평균을 계산해 식 (9)와 같이 상세히 예측한다. 이는 공분산 K_j를 완전히 활용해 높은 정확도를 제공하지만 O(p³) 연산이 필요하다. - **블록 예측**: 단순히 \hat e_{i+1,j}=ω_j e_{i,j} 로 계산한다. O(p) 연산으로 실시간 제어에 적합하지만 공분산 구조를 무시한다. 예측된 오류 \hat e_{i+1} 는 기존 ILC 업데이트 u_{i+1}=u_i+L_i e_i 에 추가적으로 K_i \hat e_{i+1} 을 더해 제어 입력을 보정한다(식 6). **4. 안정성 및 수렴 분석** Theorem 1에서는 요소별 및 블록 예측 각각에 대해 평균 오류와 공분산이 수축한다는 조건을 제시한다. 핵심 가정은 (i) ‖B_i‖₂≤γ_E < 1 또는 ‖A_i‖₂≤γ_B < 1, (ii) ‖K_j‖₂

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기