적응형 선형 경로 모델 기반 확산
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.
초록
본 논문은 기존 모델 기반 확산(MBD)에서 사용되는 분산 보존 스케줄을 흐름 매칭에서 영감을 얻은 선형 확률 경로로 대체한 LP‑MBD를 제안한다. LP‑MBD는 최대 노이즈 스케일 σ_max와 확산 단계 수 T 두 개의 독립적인 파라미터만 필요해 튜닝 복잡도를 크게 낮춘다. 이를 기반으로 강화학습을 이용해 상황에 맞게 T와 σ_max를 실시간으로 조정하는 적응형 버전 ALP‑MBD를 설계하였다. 수치 실험, Brax 기반 로봇 시뮬레이션, 모바일 로봇 궤적 추적 실험을 통해 LP‑MBD는 기존 VP‑MBD와 동등하거나 더 나은 성능을 보이며, ALP‑MBD는 복잡한 환경에서 견고성과 효율성을 향상시킨다.
상세 분석
LP‑MBD의 핵심 아이디어는 흐름 매칭(Flow Matching)에서 제시된 선형 확률 경로 Yₜ = (1‑t)Y⁰ + tε (t∈
댓글 및 학술 토론
Loading comments...
의견 남기기