동적 로프 조작을 위한 물리 기반 자기지도 학습 프레임워크 SPiD

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 질량‑스프링 모델에 고유 감쇠 항을 추가한 경량의 미분 가능 물리 모델과, 이를 활용한 자기지도 강화 학습을 결합한 SPiD 프레임워크를 제안한다. 로프의 에너지 최소화를 목표로 하는 손실 함수를 통해 신경망 기반 제어기를 오프라인에서 학습하고, 배포 중에는 OOD 탐지와 자기지도 DAgger 메커니즘으로 정책을 지속적으로 개선한다. 시뮬레이션·실험 모두에서 로프 안정화와 궤적 추적 과제를 수행하며, 마커리스 비전 인식을 포함한 저비용 센서에서도 견고한 성능을 보인다.

상세 분석

SPiD는 두 축을 중심으로 설계됐다. 첫 번째는 ‘동적 물리 모델링’이다. 기존 질량‑스프링 시스템(MSS)은 계산 효율성이 높지만, 고속 진동이나 비균일 질량 분포를 정확히 반영하지 못한다. 저자들은 각 질량점 사이에 선형·굽힘·비틀림 스프링과 함께 선형·굽힘·공기 저항 감쇠기를 도입하고, 이를 수치적으로 안정적인 해석식으로 정리했다. 이렇게 확장된 모델은 21개의 질량점(126 차원 상태)으로 구성된 로프의 장기 예측 정확도를 기존

동적 로프 조작을 위한 물리 기반 자기지도 학습 프레임워크 SPiD

초록

상세 분석

댓글 및 학술 토론

의견 남기기