LAMP: 로봇 내비게이션을 위한 암시적 언어 지도
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.
초록
LAMP은 RGB 이미지와 대규모 언어 모델을 이용해 공간을 연속적인 언어 임베딩 필드로 표현한다. 명시적 벡터 저장 대신 신경망 기반 암시적 맵을 구축하고, 희소 토폴로지 그래프와 결합해 거친 경로를 찾은 뒤, 언어 임베딩 유사도를 최대화하는 미분 가능한 최적화로 목표 근처를 정밀하게 보정한다. 베이지안 방식으로 von Mises‑Fisher 분포를 도입해 임베딩 불확실성을 모델링하고, 시야 커버, 불확실성, 의미 민감도를 종합한 점수 기반 그래프 샘플링으로 대규모 환경에서도 메모리와 연산을 크게 절감한다. 시뮬레이션 및 실제 다층 건물 실험에서 기존 그리드·노드 기반 방법보다 메모리 효율과 목표 도달 정확도가 우수함을 입증한다.
상세 분석
본 논문은 로봇 내비게이션에서 “언어‑지도”라는 새로운 패러다임을 제시한다. 기존 연구는 2D 그리드나 토폴로지 노드에 CLIP 등 대형 언어 모델의 임베딩을 직접 저장해 왔으며, 이는 환경이 커질수록 메모리 사용량이 급증하고, 그리드 해상도 제한으로 미세 목표에 대한 정밀 제어가 어려웠다. LAMP은 이러한 한계를 극복하기 위해 암시적 신경 언어 필드(Implicit Neural Language Field) 를 도입한다. 핵심 아이디어는 카메라 포즈 (x =
댓글 및 학술 토론
Loading comments...
의견 남기기