안전하고 안정적인 신경망 동적 시스템을 이용한 로봇 경로 계획
초록
본 논문은 시연 데이터로부터 로봇의 움직임을 학습하면서, 신경망 기반 동적 시스템에 대해 Lyapunov 안정성 인증과 Barrier 안전 인증을 동시에 학습한다. 기존의 다항식 기반 방법이 갖는 표현력 제한을 극복하고, split conformal prediction을 활용해 학습된 인증의 확률적 보장을 제공한다. 2D·3D 실험과 Franka Emika Panda 로봇의 실제 시연을 통해 안전하고 안정적인 궤적을 성공적으로 생성함을 입증한다.
상세 분석
S²‑NNDS는 로봇 학습‑시연(LfD) 문제를 “동적 시스템(DS) + 인증”이라는 삼중 목표로 재구성한다. 첫 번째 목표는 시연 데이터와 일치하는 비선형 벡터장 f(x)를 신경망으로 근사하는 것이며, 두 번째 목표는 Lyapunov 함수 V(x)를 통해 전역 혹은 지역적 수렴성을 보장하고, 세 번째 목표는 Barrier 함수 B(x)를 이용해 정적 장애물 영역을 피하도록 안전성을 인증한다. 기존 연구는 주로 다항식 파라미터화와 SOS 최적화를 사용했는데, 이는 다항식 차수가 높아질수록 수치 불안정과 과보수성을 초래한다. 반면 S²‑NNDS는 f, V, B를 모두 완전 연결 신경망으로 표현함으로써 복잡한 비선형 궤적과 비정형 장애물 형태를 자연스럽게 다룰 수 있다.
학습 과정은 세 개의 손실 함수를 동시에 최소화한다. ① MSE 손실 L_MSE는 시연 속도와 신경망 출력 속도의 차이를 최소화한다. ② Lyapunov 손실 L_lyap은 leaky‑ReLU 기반 힌지 손실을 통해 V(x) > 0, ∇V·f < 0 조건을 위반하는 샘플에 페널티를 부여한다. 여기서 λ_l1, λ_l2와 작은 허용치 δ_l1, δ_l2는 하이퍼파라미터로, 조건을 완화하면서도 충분한 마진을 확보한다. ③ Barrier 손실 L_bar는 초기 집합, 위험 집합, 그리고 전체 작업공간에 대한 B(x)와 ∇B·f 조건을 동시에 만족시키도록 설계된다. 특히 위험 영역에서는 B(x) > 0을 강제하고, 안전 영역에서는 B(x) ≤ 0을 유지하도록 한다.
하지만 샘플 기반 손실만으로는 연속적인 전체 도메인에 대한 보장을 제공하기 어렵다. 이를 보완하기 위해 저자들은 split conformal prediction을 적용한다. 데이터셋을 학습용과 캘리브레이션용으로 분리한 뒤, 캘리브레이션 집합에서 인증 함수들의 잔차 분포를 추정하고, 지정된 신뢰 수준(예: 95%)에 맞는 정량적 임계값을 계산한다. 이렇게 얻은 임계값을 사용해 테스트 시점에 V와 B가 조건을 만족하는지 확률적(Provably Approximately Correct) 보장을 제공한다.
실험에서는 LASA 손글씨 데이터셋, 2D 장애물 회피 시나리오, 그리고 3D Franka Emika Panda 로봇의 키네스틱 시연을 사용했다. 비교 대상인 ABC‑DS(다항식 SOS 기반)와 대비했을 때, S²‑NNDS는 복잡한 곡선 궤적을 더 정확히 재현하면서도 장애물 충돌을 0% 수준으로 억제했다. 특히 “unsafe demonstrations”라 불리는, 일부 시연이 장애물 내부를 통과하는 경우에도, 학습 과정에서 해당 구간을 자동으로 수정하고, 최종 DS는 안전한 궤적만을 생성한다. 계산 측면에서는 학습이 오프라인에서 수행되며, 실시간 제어 루프에 추가적인 최적화 연산이 필요 없으므로 기존 로봇 제어 주파수(1 kHz 이상)와 호환된다.
한계점으로는 (1) 인증 함수의 신경망 구조가 비교적 얕고, (2) 샘플링 기반 손실이 고차원 작업공간에서 충분히 밀집된 샘플을 요구한다는 점을 들 수 있다. 또한, 현재는 정적 장애물만을 고려했으며, 동적 장애물이나 환경 변화에 대한 적응 메커니즘은 별도 연구가 필요하다. 그럼에도 불구하고, 신경망 기반 인증과 conformal prediction을 결합한 접근법은 LfD 분야에서 안전·안정성을 동시에 만족시키는 새로운 패러다임을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기