가우시안 프로세스 회귀의 균일 오류 경계와 안전 제어 적용

본 논문은 데이터‑드리븐 모델이 제한된 학습 데이터와 잡음으로 인해 발생하는 모델 오차를 정량화하고, 이를 안전‑중심 제어에 적용하기 위한 새로운 가우시안 프로세스(GP) 회귀의 균일 오류 경계(Uniform Error Bound)를 제시한다. **1. 서론 및 배경** 머신러닝 기반 제어가 복잡한 비선형 시스템 식별과 정책 탐색에 유망함에도 불구하고, 안전‑중심 분야에서는 모델 불확실성에 대한 정량적 보장이 부족해 적용이 제한돼 왔다. GP는 베이지안 회귀 방식으로 사후 평균과 분산을 제공해 불확실성을 자연스럽게 추정할 수 있지만, 기존의 균일 오류 경계는 강한 가정(예: 함수가 RKHS에 속하고 잡음이 유계 서브가우시안 등)에 의존한다. 이러한 가정은 실제 시스템에 적용하기 어려우며, 상수 계산이 복잡해 실용적 활용을 저해한다. **2. 기존 연구와 한계** 관련 연구에서는 RKHS 기반의 최대 정보 이득, 정규화 파라미터, 커버링 넘버 등을 이용해 확률적 오류 경계를 도출했지만, (i) 상수들의 계산이 어려워 실제 알고리즘에 적용하기 힘들고, (ii) 커널이 부드러울수록 적용 가능한 함수 공간이 제한되는 문제점이 있다. 특히, 잡음이 유계라는 가정은 실제 센서 잡음이 가우시안인 경우와 맞지 않는다. **3. 새로운 가정 및 이론적 접근** 저자들은 두 가지 핵심 가정을 도입한다. - **Assumption 3.1**: 목표 함수 f는 커널 k에 의해 정의된 GP(0, k)의 샘플이며, 관측은 i.i.d. 가우시안 잡음(분산 σ_n²)으로 오염된다. 이는 함수 공간을 커널이 정의하는 전체 샘플 집합으로 제한하면서도, 실제 물리 시스템에서 흔히 가정되는 연속·리프시츠 연속성을 포함한다. - **Lipschitz 연속성**: 커널 k와 목표 함수 f가 각각 리프시츠 연속(L_k, L_f)이라는 약한 조건을 가정한다. 대부분의 실용적 커널(제곱 지수, Matérn 등)은 이 조건을 만족한다. **4. 정리 3.1 – 확률적 균일 오류 경계** 정리 3.1은 posterior 평균 ν_N(x)와 표준편차 σ_N(x)의 리프시츠 상수 L_{ν_N}와 연속성 모듈러스 ω_{σ_N}(·)를 구하고, 이를 이용해 전체 입력 공간 X에 대한 확률적 균일 오류 경계 |f(x)−ν_N(x)| ≤ β(τ) σ_N(x) + γ(τ) ∀ x∈X 를 도출한다. 여기서 - β(τ) = 2 log( M(τ, X) / δ )는 격자 커버링 넘버 M(τ, X)와 신뢰 수준 δ에 의존한다. - γ(τ) = (L_{ν_N}+L_f) τ + p β(τ) ω_{σ_N}(τ) 로, τ는 격자 간격(그리드 상수)이다. L_{ν_N}는 (4)식으로 훈련 데이터와 커널에 의해 직접 계산 가능하고, ω_{σ_N}(τ)는 (5)식으로 커버링 넘버와 커널 최대값을 이용해 상한을 구한다. τ를 충분히 작게 잡으면 β와 γ는 로그·선형 성장에 그치므로, 실제 오류 경계는 σ_N(x)와 거의 비례하게 된다. **5. 정리 3.2 – 확률적 리프시츠 상수** 목표 함수 f에 대한 사전 지식이 전혀 없을 때도, 커널의 4차까지 연속 미분 가능성을 가정하면 파셜 파생 커널 k^{∂i}의 리프시츠 상수 L_{∂i}k와 자기상관 k^{∂i}(x,x)만으로 확률적 리프시츠 상수 L_f를 구할 수 있다. 이는 (11)식에 제시된 복합 로그·루트 형태이며, δ_L에 따라 1−δ_L 확률로 f가 해당 상수를 만족함을 보장한다. **6. 점근적 분석 (섹션 3.3)** 데이터가 충분히 많고 고르게 분포될 경우, 커버링 넘버 M(τ, X) ≈ (r/τ)^d 로 성장한다. τ를 N^{-α} (α>0) 로 선택하면 β(τ)·σ_N(x)와 γ(τ) 모두 O(N^{-α}) 수준으로 감소한다. 따라서 “무한히 많은 데이터” 가정 하에 오류 경계는 0에 수렴한다는 점근적 수렴 결과를 제시한다. 이는 기존 RKHS 기반 경계가 데이터 양에 따라 수렴률이 제한적인 것과 대비된다. **7. 안전 제어 설계 (섹션 4‑5)** 위 오류 경계를 이용해 Lyapunov 기반 안전 제어를 설계한다. 시스템 동역학 ẋ = f(x) + g(x)u + d(x) 에 대해, GP 모델을 사용해 f̂(x)=ν_N(x)와 불확실성 σ_N(x)를 얻고, 제어 입력을 u(x) = u_nom(x) − K ν_N(x) 와 같이 설계한다. Lyapunov 함수 V(x) = xᵀPx에 대해 \dot V ≤ −c‖x‖² + β σ_N(x) + γ 가 성립하도록 K와 P를 선택하면, V가 감소하는 영역이 정의되고, 시스템 상태는 이 영역 내에서 제한된다. 즉, 상태가 작은 집합 안에 수렴하고, 외란이나 모델 오차가 발생해도 오류 경계 내에서 안전하게 동작한다. **8. 실험** 로봇 매니퓰레이터 2‑DOF 모델에 위 제어법을 적용하고, GP를 이용해 관절 토크를 학습한다. 시뮬레이션 결과는 (i) 제어 목표를 정확히 추적하면서 (ii) 상태가 사전에 정의된 안전 집합 내에 머무른다. 또한, 데이터 양을 늘릴수록 σ_N이 감소하고, 실제 오류가 이론적 경계와 일치함을 확인한다. **9. 결론 및 기여** - GP 사전 분포와 커버링 넘버를 활용해 **계산 가능하고 실용적인 확률적 균일 오류 경계**를 제시. - **확률적 리프시츠 상수**를 도출해 사전 지식이 부족한 경우에도 안전 제어에 필요한 Lipschitz 상수를 확보. - 데이터가 충분히 많을 때 오류 경계가 임의로 작아질 수 있음을 **점근적 수렴**으로 증명. - 이론을 실제 로봇 매니퓰레이터에 적용해 **안전 제어**를 실증, 기존 RKHS 기반 방법보다 구현 난이도가 낮고 적용 범위가 넓음. 이 논문은 GP 기반 모델의 불확실성을 정량화하고, 이를 안전 제어 설계에 직접 연결할 수 있는 새로운 프레임워크를 제공함으로써, 데이터‑드리븐 제어가 안전‑중심 시스템에 실질적으로 도입될 수 있는 길을 열었다.

가우시안 프로세스 회귀의 균일 오류 경계와 안전 제어 적용

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기