계층형 확산 기반 동작 계획 작업조건 불확실성 인식 사전

계층형 확산 기반 동작 계획 작업조건 불확실성 인식 사전
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 로봇 궤적 생성에 기존의 무편향·등방성 가우시안 잡음 대신, 작업과 동작 구조를 직접 반영한 편향·비등방성 가우시안 잡음 모델을 도입한다. 두 단계의 계층형 프레임워크를 제안하는데, 상위 단계에서는 작업 중심의 핵심 상태와 타이밍을 예측하고, 이를 통해 Gaussian Process Motion Planning(GPMP) 기반의 구조화된 사전(평균·공분산)을 구성한다. 하위 단계에서는 이 사전을 고정하고 전체 궤적을 역확산으로 복원한다. Maze2D와 KUKA 블록 스태킹 실험에서 기존 등방성 확산 모델보다 성공률과 궤적 부드러움이 크게 향상됨을 보인다.

상세 분석

이 연구는 로봇 궤적 계획에 확산 모델을 적용할 때 가장 큰 한계였던 “잡음 모델의 단순성”을 근본적으로 재설계한다. 기존 DDPM(denoising diffusion probabilistic model)은 단계별로 0 평균·단위 공분산의 가우시안 잡음을 추가하는데, 이는 로봇 궤적이 갖는 시간적 연속성, 동역학적 제약, 작업 목표와 같은 구조적 정보를 전혀 반영하지 못한다. 논문은 이를 해결하기 위해 두 가지 핵심 아이디어를 제시한다.

첫째, 편향·비등방성 잡음을 수학적으로 일반화한다. 전통적인 전진 과정 τ_i = √α_i τ_{i‑1} + √(1‑α_i) ε (ε∼N(0,I)) 를 τ_i ∼ N( √α_i τ_{i‑1} + (1‑√α_i) ξ, (1‑α_i) K ) 로 확장한다. 여기서 ξ와 K는 작업에 따라 달라지는 평균·공분산 행렬이며, K는 양의 준정부호인 전체 궤적 차원(H·d)×(H·d) 행렬이다. 이 일반화는 전진·역전 과정 모두에 닫힌 형태의 해를 유지하면서, 사전 분포가 N(ξ, K) 로 수렴하도록 만든다.

둘째, 계층형 구조를 도입한다. 상위 레벨에서는 “키 상태(key states)”와 그 타이밍을 예측한다. 키 상태는 시작·목표, 중간 웨이포인트, 접촉 이벤트 등 작업에 필수적인 몇 개의 중요한 상태를 의미한다. 이를 선택 행렬 C와 상태 행렬 Y로 표현하고, Y = C τ 로 정의한다. 이후 GPMP에서 사용되는 선형 시변(LTV) 동역학 모델을 기반으로, 무조건적인 GP 사전(평균 ξ̃, 공분산 K̃)을 구성한다. 키 상태와 그 불확실성 K_y 를 소프트 관측으로 간주해 GP를 조건부화하면, 새로운 평균 ξ와 공분산 K 가 (8)·(9) 식으로 얻어진다. 이 사전은 키 상태 주변에 낮은 분산을, 그 외 구간에는 높은 분산을 부여해, 역확산 과정이 “키 상태를 중심으로 부드러운 궤적”을 생성하도록 유도한다.

하위 레벨에서는 위에서 얻은 (ξ, K)를 초기 분포로 삼아, 기존 DDPM과 동일한 역확산 스케줄을 적용한다. 다만 손실 함수는 단순 MSE가 아니라 Mahalanobis 거리 ‖·‖_{K^{-1}}^2 로 정의해, 공분산 구조에 따라 오류를 가중한다. 이는 네트워크가 시간적 상관관계와 키 상태에 대한 신뢰도를 동시에 학습하게 만든다. 학습 시에는 실제 키 상태와 타이밍을 약간 변형(dC_w, dY_w)시켜, 상위 레벨 예측 오류에 대한 강인성을 확보한다.

실험에서는 Maze2D(2D 네비게이션)와 KUKA 로봇 팔을 이용한 블록 스태킹 두 도메인에서, (i) 단일 레벨 등방성 확산, (ii) 계층형이지만 조건만 제공, (iii) 비용 가이던스 기반 확산, (iv) 제안한 구조화 사전 기반 모델을 비교한다. 제안 모델은 성공률이 10~15%p 상승하고, 궤적 평활도(velocity jerk 등)에서 현저히 낮은 값을 기록했다. 특히 학습 초기에 “데이터 수준 평활도”가 빠르게 도달해, 사전 구조가 학습 효율을 크게 높임을 보여준다.

추가적인 Ablation 연구에서는 (1) 키 상태를 하드 제약으로 강제했을 때 성공률이 떨어짐을, (2) 사전 공분산을 단순히 스케일링한 등방성 잡음으로 대체했을 때 성능이 크게 감소함을 확인한다. 이는 “구조화된 잡음 자체가 중요한 인덕티브 바이어스”임을 증명한다.

전반적으로 이 논문은 확산 기반 로봇 계획에 있어 “잡음 모델 설계”가 모델 성능을 좌우한다는 새로운 관점을 제시하고, GPMP와 결합한 계층형 구조를 통해 작업 목표와 동역학적 부드러움을 동시에 만족시키는 실용적인 프레임워크를 제공한다.


댓글 및 학술 토론

Loading comments...

의견 남기기