리그드 로봇 상태 추정을 위한 불변 신경보강 칼만 필터
초록
본 논문은 기존의 불변 확장 칼만 필터(InEKF)의 비선형 오차를 보정하기 위해, Lie group 구조를 유지하면서 동작하는 신경망 기반 보상기를 도입한 Invariant Neural‑Augmented Kalman Filter(InNKF)를 제안한다. 시뮬레이션 기반 학습을 통해 접지 슬립·모델 불확실성·센서 노이즈 등으로 발생하는 추정 오차를 학습하고, SE₂(3) 군의 원소로 출력함으로써 상태의 불변성을 보존한다. 실험 결과, 복잡한 지형에서도 기존 InEKF 대비 위치·자세 추정 정확도가 크게 향상됨을 확인하였다.
상세 분석
이 논문은 레그드 로봇의 상태 추정 문제를 두 가지 관점에서 접근한다. 첫 번째는 Lie group 상에 상태를 정의함으로써 불변성을 확보하고 수렴 속도를 높이는 기존의 Contact‑aided Invariant EKF(InEKF)이다. InEKF는 접지 정보를 측정값으로 활용해 업데이트를 수행하지만, 상태 전이식의 1차 근사(Aₜ) 때문에 강한 비선형성이 존재하는 상황—예를 들어 접지 슬립, 모델 파라미터 오차, 고주파 센서 노이즈—에서 오차가 누적되어 드리프트가 발생한다.
두 번째 접근은 이러한 비선형 오차를 보정하기 위해 인공신경망을 도입하는 것이다. 핵심 아이디어는 “오차 자체를 학습한다”는 점이다. 논문에서는 시뮬레이션에서 수집한 Ground‑Truth와 InEKF 추정값의 차이를 라벨로 사용해, 시간‑합성곱 네트워크(TCN) 기반의 Neural Compensator(NC)를 학습한다. 중요한 설계 원칙은 NC가 출력하는 보정값이 SE₂(3) 군의 원소가 되도록 하는 것이다. 이를 위해 먼저 SE₂(3) 군의 리 대수인 se₂(3)의 9개의 생성자를 정의하고, TCN이 출력한 9차원 벡터를 이 생성자들의 선형 결합으로 매핑한다. 그 후 exponential map을 적용해 SE₂(3) 군 원소 ˆEᵣₜ를 얻고, 이를 InEKF의 업데이트된 상태 𝑋̅₊ₜ에 좌측 곱(ˆEᵣₜ⁻¹·𝑋̅₊ₜ)함으로써 최종 추정값 𝑋̈ₜ를 얻는다.
학습 과정에서는 회전 부분과 변위 부분을 각각 Frobenius norm과 geodesic distance, 그리고 MSE를 이용해 손실을 구성한다. 회전 손실은 SO(3) 상의 최소 각도 차이를 정확히 반영하도록 설계되었으며, 변위 손실은 속도·위치 성분을 직접 최소화한다. 최적화는 Adam optimizer(learning rate 5e‑4)로 수행되고, 입력 시퀀스는 0.1 s(50 step) 길이, 윈도우 이동은 1 step(0.002 s)으로 설정하였다.
실험에서는 4가지 지형(계단, 경사면, 무작위 고도, 이산 장애물)에서 100 s 동안 로봇이 이동하도록 시뮬레이션하고, 해당 데이터를 학습·검증에 활용하였다. 결과는 InNKF가 InEKF 대비 위치 RMS error를 평균 30 % 이상 감소시키고, 회전 오차 역시 유의미하게 낮추는 것을 보여준다. 특히 슬립이 빈번히 발생하는 구간에서 보상기가 비선형 오차를 효과적으로 추정해 드리프트를 억제한다는 점이 강조된다.
이 논문의 주요 기여는 다음과 같다. (1) 모델 기반과 학습 기반 접근을 결합한 하이브리드 추정기 설계, (2) Lie group 구조를 보존하는 신경망 설계로 불변성을 유지, (3) 시뮬레이션 기반 라벨링 및 손실 설계 방법론 제시. 또한, SE₂(3) 군을 활용한 보상기 설계는 다른 로봇 시스템(예: 드론, 차량)에도 일반화 가능성을 시사한다. 다만, 현재는 시뮬레이션 데이터에만 의존하고 실제 하드웨어 실험이 부족하다는 한계가 있다. 향후 실제 로봇에 적용하고, 실시간 연산 비용을 최적화하는 연구가 필요하다.
댓글 및 학술 토론
Loading comments...
의견 남기기