범용 인체형 로봇을 위한 스케일러블 전신 제어 프레임워크

범용 인체형 로봇을 위한 스케일러블 전신 제어 프레임워크
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

XHugWBC는 물리적 일관성을 유지한 형태학적 랜덤화와 전역 관절 공간 정렬, 그래프‑기반 로봇 토폴로지를 결합해 하나의 정책으로 다양한 인간형 로봇을 제로샷으로 제어한다. 12개의 시뮬레이션 로봇과 7개의 실제 로봇에서 85% 수준의 전문 성능을 달성하고, 파인튜닝 시에는 전문 모델을 능가한다.

상세 분석

본 논문은 인간형 로봇의 형태학적 다양성과 동역학 차이를 극복하기 위해 ‘크로스‑임베디언트’ 학습 프레임워크 XHugWBC를 제안한다. 핵심 기여는 세 가지 축으로 정리된다. 첫째, 물리‑일관성을 보장하는 형태학적 랜덤화이다. 기존 도메인 랜덤화는 관성 파라미터를 무작위로 변형해 시뮬레이션‑실제 격차를 줄였지만, 인간형 로봇처럼 복잡한 구조에서는 비물리적 파라미터가 시뮬레이션 붕괴를 초래한다. 저자는 링크의 의사관성 행렬을 Cholesky 분해한 상삼각 행렬 L로 재파라미터화하고, L에 가우시안 노이즈를 더함으로써 J=LLᵀ 형태의 양의 정부호 조건을 자동으로 만족하도록 설계했다. 또한, 관절 위치·축·제어 파라미터를 질량 비례 스케일링하고, 일부 관절을 고정하거나 회전축을 변형함으로써 12~32개의 자유도를 갖는 다양한 로봇을 생성한다. 둘째, 전역 관절 공간 정렬이다. 모든 로봇을 Nmax=32 차원의 ‘전역 관절 벡터’에 매핑하고, 존재하지 않는 관절은 0으로 패딩한다. 이렇게 하면 정책 입력 차원이 고정되고, 관절의 의미적 역할(예: 왼쪽 힙 롤, 오른쪽 발목 피치 등)이 일관되게 유지된다. 셋째, 그래프‑기반 형태학적 표현과 하이브리드 마스크 트랜스포머(또는 GCN) 인코더이다. 전역 관절 벡터를 기반으로 연결성을 나타내는 인접 행렬을 구성하고, 병렬 메커니즘(예: 발목 복합 구조)을 단일 노드로 축소해 트리 형태의 kinematic graph를 만든다. 이 그래프는 각 로봇의 구조적 차이를 명시적으로 전달하고, 트랜스포머는 마스크를 통해 활성 관절과 고정 관절을 구분해 효율적인 특성 추출을 가능하게 한다. 학습은 강화학습 기반 보상(보행 안정성, 에너지 효율, 목표 트래젝터리 추적 등)과 모션 프라이어(다양한 보행·점프·조작 시퀀스)로 구성되며, 물리‑일관 랜덤화된 데이터셋에서 단일 정책을 최적화한다. 실험 결과, 12개의 시뮬레이션 로봇에 대해 전문 모델 대비 평균 85% 성능을 달성했으며, 7개의 실제 로봇(다양한 관절 수와 무게)에 대해 제로샷 전이 성공률이 92%에 달한다. 파인튜닝을 수행하면 전문 모델을 10% 이상 초과한다. 이러한 결과는 정책이 형태학적 편향을 내재화하고, 관절‑레벨의 일반화 능력을 획득했음을 의미한다. 또한, 텔레오퍼레이션 실험에서 장시간 전신 조작(물체 잡고 이동)과 복합 작업을 무리 없이 수행함으로써 실제 적용 가능성을 입증했다. 전체적으로 XHugWBC는 물리‑일관 랜덤화, 전역 관절 정렬, 그래프‑기반 토폴로지 인코딩이라는 세 축을 통해 인간형 로봇 제어의 스케일러빌리티와 범용성을 크게 향상시킨 혁신적 접근이다.


댓글 및 학술 토론

Loading comments...

의견 남기기