쿠포먼 이론으로 안전한 제어 범위 예측하기

읽는 시간: 9 분
...

📝 원문 정보

- Title: Scalable Data-Driven Reachability Analysis and Control via Koopman Operators with Conformal Coverage Guarantees
- ArXiv ID: 2601.01076
- 발행일: 2026-01-03
- 저자: Devesh Nath, Haoran Yin, Glen Chou

📝 초록

본 연구에서는 알려지지 않은 비선형 동역학의 확률적 데이터 기반 안전 검증을 위한 확장 가능한 접근 가능성을 기반으로 하는 프레임워크를 제안합니다. 이에 Koopman 이론과 신경망(NN) 리프팅 함수를 사용하여 동역학의 근사 선형 표현을 학습하고, 이러한 공간에서 참조 궤적 분포의 클로즈드-루프 추적을 가능하게 하는 선형 제어기를 설계합니다. 클로즈드 루프 접근 가능한 집합은 리프팅된 공간에서 효율적으로 계산되며, NN 검증 도구를 통해 원래 상태 공간으로 다시 매핑됩니다. Koopman 동역학과 실제 시스템 간의 모델 불일치를 포착하기 위해 통계적 유효성을 갖는 오차 한계를 생성하기 위한 콘포멀 예측을 적용합니다. 이를 통해 사용자가 지정한 확률로 실제 궤적이 포함되도록 접근 가능 집합이 팽창됩니다. 이러한 경계는 참조에 따라 일반화되어 재사용 없이 재계산할 필요가 없습니다. 11차원 호퍼, 28차원 스위머로 구성된 고차원 MuJoCo 작업과 12차원 퀼코pter에서의 결과를 통해 기존 방법보다 개선된 접근 가능 집합 커버리지 비율, 계산 효율성 및 보수성을 확인할 수 있습니다.

💡 논문 해설

1. **스케일러블한 Koopman 기반 접근 가능성 프레임워크** - **단순 설명**: 복잡하고 알려지지 않은 로봇 동작을 이해하는 데 도움이 되는 방법론입니다. - **비유**: 이는 복잡한 건물을 이해하기 위해 간단한 다이어그램으로 그림을 그리는 것과 같습니다. - **Sci-Tube 스타일 스크립트**: "우리는 복잡한 로봇 동작을 이해하는 새로운 방법을 제시합니다. 이를 통해 우리는 안전성을 보장하면서도 빠르게 결과를 얻을 수 있습니다."
  1. Koopman 접근 가능성 집합 확대를 위한 준정형 예측 접근법

    • 단순 설명: Koopman 모델의 오차를 고려해 확률적 안전성을 보장합니다.
    • 비유: 이는 날씨 예보에서 기상 조건에 따른 변화를 반영하는 것과 같습니다.
    • Sci-Tube 스타일 스크립트: “우리는 Koopman 모델의 오차를 고려하여, 로봇 동작이 안전한 범위 내에 있도록 확률적 보장을 제공합니다.”
  2. 제어 설계 및 확장 가능한 예측 기반 제어

    • 단순 설명: 다양한 제어기로 작업할 수 있게 하여 효율성을 높입니다.
    • 비유: 이는 여러 가지 도구를 재사용하여 공사를 진행하는 것과 같습니다.
    • Sci-Tube 스타일 스크립트: “우리는 다양한 제어기로 작업할 수 있도록 설계했으며, 이를 통해 로봇이 효율적으로 다양한 임무를 수행할 수 있습니다.”

📄 논문 발췌 (ArXiv Source)

안전성이 중요한 제어, 접근 가능 집합, Koopman 연산자, 준정형 예측

/>
28차원 MuJoCo 수영선수 (a); 11차원 hopper (b)의 실행 트레젝토리 / 접근 가능 집합.

서론

접근 가능 집합을 계산하는 것은, 시간 범위 내에 도달 가능한 상태들의 집합인 것이 로봇 안전성에 핵심적입니다. 그러나 로봇의 접근 가능성 분석은 (i) 해석 모델이 부족한 경우, (ii) 고차원 비선형 동역학을 갖는 경우, 그리고 (iii) 장기 범위를 이해하는 것이 필요한 경우 어려움이 있습니다. 해석적 역학이 가능하더라도, 문제 (ii)와 (iii)가 비선형 접근 가능성 도구의 사용을 금지하거나 장기 범위에서 과도한 근사 오류를 초래할 수 있습니다. 분석 모델 없이 데이터 기반 접근 가능성을 사용할 수 있지만, 이는 데이터 효율성이 떨어질 수 있으며 추정된 집합이 가능한 모든 트레젝토리를 포함한다는 보장이 없습니다. 반면, 선형 접근 가능성은 장기 범위와 고차원에 대해 확장할 수 있습니다. Koopman 프레임워크는 신경망 (NN)을 통해 들어올린 상태 공간에서 선형 동역학을 학습하여 비선형 시스템을 근사합니다. 그러나 Koopman 선형화를 사용한 접근 가능 집합 계산은 기존 방법으로 근사된 들어올린 동역학에 대한 보장을 제공할 뿐입니다. 따라서 진짜 시스템에 대해 안전성이 보장되지 않을 수 있습니다. 게다가, 존재하는 Koopman 접근 가능성 방법은 단일 역학 시스템만 분석합니다. 그러나 로봇은 종종 서로 다른 임무를 완료하기 위해 여러 제어기들을 필요로 하며, 기존 방법들은 각각의 새로운 제어기에 대해 접근 가능 집합을 처음부터 다시 계산해야 하므로 비효율적입니다. 이전에 계산된 정보를 재사용하면 제어기를 넘어서 효율적인 접근 가능성 분석이 가능합니다.

이 확장성, 속도, 그리고 재사용성을 위한 격차를 메꾸기 위해 우리는 ScaRe-Kro (Scalable Reachability via Koopman Operators)을 제안합니다. 이는 Koopman 이론과 신경망 들어올림 함수를 사용하여 접근 가능성 분석 및 제어를 수행합니다. 자율 시스템에 대한 이전의 Koopman 접근 가능성 방법들과 달리, 우리는 이 들어올린 공간에서 참조 트레젝토리 분포를 추적하기 위한 선형 제어기를 설계합니다. 각각 다른 임무를 완료하는 ScaRe-Kro는 들어올린 Koopman 공간에서 유도된 선형 추적 오류 동역학 하의 닫힌 루프 접근 가능 집합을 효율적으로 계산하고, 신경망 검증 도구를 통해 이를 원래 상태 공간으로 맵핑합니다. Koopman 모델 오차를 고려하기 위해 우리는 준정형 예측 (CP)을 적용하여 통계적으로 유효한 오차 경계를 유도합니다. 이 CP 경계로 맵핑된 접근 가능 집합을 확장하면 사용자가 지정한 확률 (예: 97.5%)으로 진짜 시스템 트레젝토리가 포함되도록 보장됩니다. 또한, CP 경계는 트레젝토리 분포를 통해 교정되어 서로 다른 참조 및 닫힌 루프 시스템에 재사용할 수 있습니다. 이전 Koopman 접근법은 단일 자율 시스템만 인증합니다. 전체적으로, 선형 접근 가능성과 CP를 사용하여 우리의 방법은 확장 가능한 데이터 기반 확률적 검증 및 제어를 가능하게 하여 효율성과 보수성을 개선합니다. 우리의 기여는 다음과 같습니다:

  1. 신경망 들어올림 함수와 신경망 검증을 사용하여 알려지지 않은 비선형 동역학에 대한 확장 가능한 Koopman 기반 접근 가능성 프레임워크.

  2. CP를 사용한 결과 Koopman 접근 가능 집합의 확장을 통해 진짜 동역학에 대한 과대 근사화의 확률적 보장을 얻는 방법.

  3. 닫힌 루프 참조 트레젝토리 분포 추적을 위한 들어올린 공간에서 제어 설계, CP 기반 확장 경계는 분포를 통해 교정되어 재사용 가능하다.

  4. 다양한 고차원 로봇 시스템 (28D까지)에 대한 신뢰성 있는 검증을 보여주는 광범위한 평가, 안전률, 계산 속도 및 보수성에서 기준선보다 우수함.

관련 연구

선형 완화를 통한 접근 가능성

비선형 시스템에 대한 정확한 접근 가능 집합 계산은 일반적으로 불가능하지만, 접근 가능 집합 과대 근사 (RSOA)는 종종 안전성 인증을 위해 효율적으로 계산될 수 있습니다. 닫힌 루프 시스템이 신경망 구성 요소를 포함할 때 (예: 학습된 역학 또는 제어기), RSOA는 선형 완화 기반 신경망 검증 (NNV) 도구를 통해 계산될 수 있습니다. 여기서, 보수성은 비선형성의 수와 비례하며, 로봇 동역학에 대해 과도해질 수 있습니다. 심볼릭 및 일회용 방법이 이 문제를 완화하지만 실행 시간과 메모리 비용을 증가시킵니다. 우리는 대신 Koopman 선형화된 역학으로 로봇을 모델링하여 CG의 비선형성을 줄이고 확장성 (즉, 계산 시간 및 보수성)을 향상시킵니다.

Koopman 접근 가능성

Koopman 및 Carleman 선형화는 접근 가능성을 가속화하지만 근사 오차를 도입합니다. 또한, 존재하는 오차 경계 유도는 이차 또는 다항식 동역학에 제한되며, 로봇 동역학 모델에는 적용되지 않습니다. 기존 Koopman 접근 가능성 방법은 접근 가능 집합 커버리지 교정 없이, 관찰된 트레젝토리의 한정된 세트만 포함할 수 있습니다. 따라서 진짜 시스템의 이전에 보지 못한 트레젝토리에 대한 안전성을 확보하지 못합니다. 기존 방법들은 또한 신경망 들어올림을 지원하지 않으며 자율 시스템을 고려하여 단일 제어기를 고정합니다. 로봇은 종종 다양한 목표를 달성하기 위해 제어기 변경을 수행하므로, 이는 효율적이지 않습니다. 대조적으로, 우리는 신경망 들어올림을 지원하고 진짜 동역학에 대한 확률적 커버리지 보장을 제공하며 제어 설계를 통합하여 다양한 제어기를 통해 데이터 효율적인 접근 가능성을 실현합니다.

데이터 기반 접근 가능성

데이터 기반 접근 가능성은 블랙박스 트레젝토리 데이터를 사용합니다. 일부 방법은 Hamilton-Jacobi 분석을 수정하지만, 이는 고차원 시스템에 비용이 많이 들 수 있습니다. 다른 방법들은 접근 가능성을 학습하는 함수를 학습하지만, 정확한 일반화를 위해 밀도가 높은 데이터를 필요로 하거나 특권 시스템 데이터 (예: Lipschitz 상수)를 가정합니다. 샘플링 기반 방법은 짧은 범위에 한정됩니다. 시나리오 최적화는 확률적 보장을 제공하지만 Koopman 기반 방법보다 느릴 수 있습니다. 더불어, 이러한 방법들은 고정된 제어기를 가정하지만 로봇은 종종 다른 목표를 달성하기 위해 제어기 변경을 수행하고, 이로 인해 닫힌 루프 동역학이 변하며 접근 가능 집합을 다시 계산해야 합니다. 트레젝토리 추적 접근 가능성은 참조 트레젝토리를 통해 추적 오류 세트를 재사용할 수 있습니다. 데이터 기반 변형은 알려지지 않은 시스템의 추적 기반 접근 가능성을 위한 수축 지표를 학습하지만, 그러한 지표를 찾는 것은 일반적으로 어렵습니다. 우리는 이 연구를 바탕으로 Koopman 접근 가능성 집합을 얻습니다. 이는 빠르게 계산되고 장기 범위에 확장되며 다양한 닫힌 루프 동역학에 대해 재사용할 수 있습니다.

전제 조건

우리는 알려지지 않은, 블랙박스 비선형 시스템을 고려합니다. 오프-루프 [오프-루프 역학식] 또는 닫힌 루프 [닫힌 루프 역학식]:

MATH
%\label{오프-루프 역학식}
\begin{align}
    x_{t+1} &= f(x_t, u_t),
    \label{오프-루프 역학식}
\end{align}

\vspace{-30pt}
\begin{align}
    x_{t+1} &= f(x_t, \pi(x_t, t)) \doteq \tilde f(x_t),
    \label{닫힌 루프 역학식}
\end{align}
클릭하여 더 보기

여기서 시점 $`t \in \{0, \dots, T\} \doteq \mathcal{T}`$, 상태 $`x_t \in \mathcal{X}\subseteq \mathbb{R}^n`$, 제어 $`u_t \in \mathcal{U}\subseteq \mathbb{R}^m`$, 피드백 제어 법칙 $`\pi: \mathcal{X} \times \mathcal{T} \rightarrow \mathcal{U}`$. 초기 상태 $`x_0`$는 집합 $`\mathcal{X}_0 \subseteq \mathcal{X}`$에 있습니다. $`\textsf{Int}(\underline{a}, \overline{a}) = \{a \mid \underline{a} \le a \le \overline{a}\}`$ 는 $\underline{a}, \overline{a} \in \mathbb{R}^A$이고, 부등식은 각 요소에 대해 $\underline{a}_i \le a_i \le \overline{a}_i$, $`1 \le i \le A`$ 에서 성립합니다. $`\mathcal{B}_a(c) \doteq \{ x \mid \Vert x - c \Vert_\infty \le a\}`$을 $a`-볼, $q_{1:Q} \doteq \{q_1, q_2, \ldots, q_Q\} = \{q_i\}_{i=1}^Q$ 을 시퀀스로 표기합니다. 우리는 $\oplus$와 $\ominus$를 각각 미코프스키 합과 차이를 나타내는 기호로 사용합니다.

Koopman 연산자

우리의 연구는 Koopman 연산자를 바탕으로 합니다. 이에 대해 기본 개념을 설명하겠습니다. 자율 이산 시간 비선형 역학 $`x_{t+1} = f(x_t)`$를 고려합시다. Koopman 연산자 $`\mathcal{K}`$는 상태의 관측 가능성을 진화시키는 무한 차원 선형 연산자입니다. 여기서 $`\mathcal{K}\phi^\infty(x) = \phi^\infty \circ f(x)`$이며, $`\phi^\infty(x_{t+1}) = \mathcal{K}\phi^\infty(x_t)`$, 여기서 $`\circ`$는 함수 합성을 나타냅니다. 실용적으로 무한 차원 Koopman 연산자를 얻는 것은 불가능하므로, 유한 차원 들어올림 함수 $`\phi: \mathcal{X} \rightarrow \mathcal{Z} \subseteq \mathbb{R}^{l}`$ 와 행렬 $`K_{A}\in \mathbb{R}^{l \times l}`$을 사용하여 $`\mathcal{K}`$의 근사를 정의할 수 있습니다. 이는 들어올린 역학 $`z_{t+1} = K_{A}z_{t}`$ 를 정의하며, 여기서 $`z_t = \phi(x_t)`$는 들어올림 상태이고 $`z_{t} \in \mathcal{Z} \subseteq \mathbb{R}^{l}`$. $`l`$은 선택한 들어올림 함수 $`\phi`$에 의해 임의로 결정됩니다. 제어 입력이 있는 시스템 [오프-루프 역학식]에서, 들어올림 역학은 $`z_{t+1} = K_{A}z_{t} + K_{B}u_t`$와 같이 쓸 수 있습니다. 여기서 $`K_{B}\in \mathbb{R}^{l \times m}`$. 실제로, 데이터를 통해 $`\phi`$, $`K_A`$, 그리고 $`K_B`$를 학습할 수 있으며, 들어올림 함수 $`g`$는 다항식 또는 신경망을 사용하여 매개변수화됩니다. 본 연구에서는 신경망 기반 오토인코더 아키텍처를 활용합니다. 여기서 인코더 $`\phi: \mathcal{X} \rightarrow \mathcal{Z}`$는 들어올림 함수를 정의하고 디코더 $`\psi: \mathcal{Z} \rightarrow \hat{\mathcal{X}}`$ 는 학습된 역을 정의합니다, 즉 $`\psi(\phi(x)) \approx x`$. 만약 $`\psi`$가 완벽한 역이라면, $`\psi(\phi(x)) = x`$이고 $`\hat{\mathcal{X}} = \mathcal{X}`$입니다.

신경망 검증을 통한 접근 가능성 (NNV)

우리는 NNV를 사용하여 신경망 기반 들어올림 및 역 함수가 포함된 닫힌 루프 시스템의 접근 가능 집합을 계산합니다. NNV 도구는 입력에 적용되는 연산 순서를 인코딩하는 방향성 비순환 그래프 (CG)로 신경망을 표현합니다. 어떤 CG $`G`$가 입력 집합 $`\mathcal{S} \subseteq \mathbb{R}^{n_i}`$와 출력 $`G(\mathcal{S}) \subseteq \mathbb{R}^{n_o}`$를 가질 때, CROWN 기반 도구인 auto_LiRPA를 사용하여 그 이미지 $`G(\mathcal{S})`$의 보장된 과대 근사를 계산할 수 있습니다. 이러한 도구는 출력 $`G(\mathcal{S})`$에 대한 보장된 아핀 하한과 상한, 즉 $`\underline{G}`$, $`\overline{G}`$를 제공합니다. 이는 다음 정리로 표현됩니다:

-1어떤 CG $`G`$와 구간 $`\mathcal{S} \doteq \{s \in \mathbb{R}^{n_i} \mid \underline{s} \le s \le \overline{s}\}`$ 에 대해, 아핀 함수 $`\underline{G}`$, $`\overline{G}`$가 존재하여 $`\forall s \in \mathcal{S}`, $\underline{G}(s) \leq G(s) \leq \overline{G}(s)$. 부등식은 각 요소에 대해 성립하며, $\underline{G}(s) = \Psi s + \alpha$, $\overline{G}(s) = \Phi s + \beta$이고, $\Psi, \Phi \in \mathbb{R}^{n_o \times n_i}$ 이며 $\alpha, \beta \in \mathbb{R}^{n_o}$.

제어기 $`\pi`$, 역학 [오프-루프 역학식], 초기 집합 $`\mathcal{X}_0`$에 대해, $`T`$ 시간 스텝의 정확한 접근 가능 집합은 $`\mathcal{X}_{0:T} \doteq \{\mathcal{X}_0, f(\mathcal{X}_t, \pi(\mathcal{X}_t,t)) \}_{t=0}^{T-1}\}`$ 로 표기됩니다. 비선형 시스템에 대한 정확한 접근 가능성 분석은 일반적으로 불가능하지만, 접근 가능 집합 과대 근사 (RSOA) $`\overline{\mathcal{X}}_{0:T}`$를 계산하는 것은 종종 가능하며 이는 모든 $`t \in \{0,\ldots,T\}`$ 에 대해 $`\mathcal{X}_t \subseteq \overline{\mathcal{X}}_t`$를 만족합니다. $`\overline{\mathcal{X}}_{0:T}`$를 얻기 위해, 정리 [정리 cg_robustness]는 닫힌 루프 역학 $`\tilde f`$ [닫힌 루프 역학식] 의 $`T`$-스텝 합성 $`{\tilde f^{T}}(\cdot) \doteq \tilde{f} \circ \dotsb \circ \tilde{f}(\cdot)`$ 의 CG $`F`$, 즉, $`F(x_0) \doteq \{\tilde f(x_t) \doteq f(x_t, \pi(x_t, t)) \}_{t=0}^{T}`$ 에 적용되며 auto_LiRPA는 RSOA를 계산합니다.

준정형 예측 (CP)

우리의 RSOA 계산은 또한 CP에 의존합니다. 본 연구에서는 분할 CP를 사용합니다. 이는 i.i.d. 입력-출력 쌍 $`(v^{(i)}, y^{(i)}) \in \mathcal{V}\times\mathcal{Y}`$ 을 데이터셋 $`\mathcal{D} \doteq\{(v^{(i)}, y^{(i)})\}_{i=1}^{L+K}`$에서 크기-$`L`$ 학습 세트 $`\mathcal{D}_T`$와 크기-$`K`$ 교정 세트 $`\mathcal{D}_C`$로 분할합니다. 주어진 예측 함수 $`\mu:\mathcal{V}\!\to\!\mathcal{Y}`$ 에 대해, 우리는 $`\mathcal{D}_C`$의 $`K`$ 교정 쌍 각각에 대해 비일치 점수 $`R^{(i)}\!\doteq s(y^{(i)},\mu(v^{(i)}))`$를 계산합니다. 여기서 $`s: \mathcal{Y}\times \mathcal{Y} \rightarrow \mathbb{R}_{\ge 0}`$ 는 선택된 비일치 점수 함수입니다. 예를 들어, 학습된 역학 모델 $`\hat f`$의 $`\ell_2`$ 예측 오차를 이 프레임워크에서 표현하려면 $`v = (x_t, u_t)`$, $`y = x_{t+1}`$, $`\mu(v) = \hat f(v)`$, 그리고 $`s(y, \mu(v)) = \Vert y - \mu(v)\Vert_2`$로 정의할 수 있습니다. 미표본화 수준 $`\delta\in(0,1)`$ 에 대해, 임계값 $`C`$는 교정 점수의 ($`1-\delta`$)-분위수, 즉 $`C \doteq \text{Quantile}_{1-\delta}(R^{(1)},\dots,R^{(K)},\infty)`$ 로 정의됩니다. 이 임계값은 예측 집합 $`\mathcal{Y}(v) \doteq \{\,y\in\mathcal{Y} \mid s(y,\mu(v))\le C \,\}`$ 을 정의하며, 이것은 미표본화 데이터 포인트 $`(y^{(0)}, v^{(0)})`$에 대한 마진 커버리지 보장 $`\mathbb{P}(y^{(0)}\in\mathcal{Y}(v^{(0)})) \ge 1-\delta`$ 를 만족합니다.

문제 설정

-1우리는 블랙박스에 접근할 수 있는 $`f`$ [오프-루프 역학식] 즉, 그것의 해석적인 형태를 알지 못하며 그 출력은 데이터를 통해만 추정할 수 있습니다. 우리는 계획자 $`P: \mathcal{X} \rightarrow \mathcal{X}^{T+1} \times \mathcal{U}^T`$ 가 오프-루프 참조 트레젝토리 $`(x^\textrm{ref}_{0:T}, u^\textrm{ref}_{0:T-1})`$ 를 생성하여 [오프-루프 역학식] 를 만족하며, 초기 조건으로부터 시작합니다.



📊 논문 시각자료 (Figures)

Figure 1



Figure 2



Figure 3



Figure 4



Figure 5



Figure 6



Figure 7



Figure 8



Figure 9



Figure 10



Figure 11



Figure 12



감사의 말씀

이 글의 저작권은 연구하신 과학자분들께 있으며, 인류 문명 발전에 공헌해주신 노고에 감사를 드립니다.

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키