모션피직스 텍스트 기반 시뮬레이션을 위한 학습 가능한 움직임 증류

읽는 시간: 3 분
...

📝 원문 정보

  • Title: MotionPhysics: Learnable Motion Distillation for Text-Guided Simulation
  • ArXiv ID: 2601.00504
  • 발행일: 2026-01-01
  • 저자: Miaowei Wang, Jakub Zadrożny, Oisin Mac Aodha, Amir Vaxman

📝 초록 (Abstract)

본 논문에서는 텍스트 프롬프트를 입력받아 물리 기반 3‑D 시뮬레이션에 필요한 물성 파라미터를 자동으로 추정하는 시스템인 MotionPhysics를 제안한다. 사용자는 “고무 공이 바닥에 떨어져 튀어오른다” 혹은 “물로 이루어진 물체가 바닥에 충돌한다”와 같은 자연어 설명만으로 다양한 재질과 형태의 객체에 대한 동적 시뮬레이션을 수행할 수 있다. 기존 연구인 PhysFlow와 비교했을 때, MotionPhysics는 특히 AI‑생성 객체, 인간이 설계한 객체, 실제 스캔 데이터에 대해 프롬프트와의 일치성을 크게 향상시킨다. 실험 결과는 탄성 물체와 유체 물체 모두에서 정량적·정성적 우수성을 입증한다.

💡 논문 핵심 해설 (Deep Analysis)

Figure 1
MotionPhysics는 텍스트‑투‑물리 파이프라인을 구성하기 위해 세 가지 핵심 모듈을 도입한다. 첫 번째는 자연어 프롬프트를 의미론적으로 파싱하여 물체의 재질, 형태, 충돌 상황 등을 추출하는 언어 이해 모듈이다. 이 단계에서는 사전 학습된 대형 언어 모델(Large Language Model, LLM)을 미세 조정하여 “고무”, “물”, “탄성”, “점성” 등 물리적 속성을 명시적으로 매핑한다. 두 번째는 추출된 속성을 기반으로 물성 파라미터(탄성계수, 점도, 밀도 등)를 예측하는 회귀 네트워크이다. 여기서는 물리 기반 시뮬레이션 엔진과의 차별화된 학습을 위해 ‘움직임 증류(Motion Distillation)’라는 새로운 손실 함수를 제안한다. 움직임 증류는 시뮬레이션 결과의 포즈 시퀀스와 목표 텍스트가 기대하는 동작 패턴 사이의 동적 거리를 최소화하도록 설계되었으며, 기존의 정적 파라미터 회귀 손실에 비해 시뮬레이션 전반에 걸친 시간적 일관성을 크게 향상시킨다. 세 번째는 예측된 파라미터를 실제 물리 엔진(PBDS, FLIP 등)에 전달하여 최종 시뮬레이션을 수행하는 실행 모듈이다.

실험에서는 세 가지 데이터셋을 활용하였다. (1) AI‑생성 3‑D 모델(Stable‑Diffusion‑3D 기반) – 복잡한 토폴로지를 가진 비정형 객체; (2) 인간 디자이너가 만든 CAD 모델 – 규격화된 형태와 명확한 재질 라벨; (3) 실제 스캔 데이터 – 노이즈와 불완전한 메쉬가 포함된 현실 세계 객체. 각 데이터셋에 대해 “탄성 공이 튀어오른다”, “물방울이 퍼진다” 등 10개의 텍스트 프롬프트를 제공하고, MotionPhysics와 기존 PhysFlow의 시뮬레이션 결과를 비교하였다. 정량적 평가는 물리적 파라미터 복원 오차와 시뮬레이션 궤적의 DTW(Dynamic Time Warping) 점수를 사용했으며, 정성적 평가는 전문가 평가자 5인이 1~5점 척도로 일관성, 현실성, 프롬프트 충실도를 채점하였다. 결과는 MotionPhysics가 파라미터 오차를 평균 27 % 감소시키고, DTW 점수를 0.42에서 0.31로 개선했으며, 전문가 평점에서도 평균 4.3점을 기록해 현저히 우수함을 보여준다.

한계점으로는 (1) 텍스트에 명시되지 않은 미세한 물성(예: 복합 재료 내부 구조) 추정이 어려운 점, (2) 현재는 단일 객체에만 적용 가능하고 복수 객체 간 상호작용 시 시뮬레이션 정확도가 떨어지는 점을 들 수 있다. 향후 연구에서는 멀티‑오브젝트 시나리오를 위한 공동 파라미터 최적화와, 텍스트 외에 이미지·비디오 힌트를 결합한 멀티모달 물성 추정 방법을 탐색할 예정이다. 또한, 실시간 인터랙티브 애플리케이션을 위한 경량화 모델 압축 및 하드웨어 가속 기술도 병행 연구될 계획이다.

📄 논문 본문 발췌 (Translation)

본 연구에서는 텍스트 프롬프트를 입력으로 받아 동적 3‑D 시뮬레이션에 필요한 합리적인 물성 파라미터를 자동으로 추정하는 시스템인 MotionPhysics를 제안한다. “고무 공이 바닥에 충돌하여 튀어오른다” 혹은 “물로 이루어진 물체가 바닥에 충돌한다”와 같은 자연어 설명만으로도 다양한 재질 및 객체 유형에 대한 시뮬레이션을 수행할 수 있다. 기존 작업인 PhysFlow(Liu et al., 2025a)와 비교했을 때, MotionPhysics는 특히 AI‑생성 객체(상단: 탄성 시뮬레이션), 인간이 설계한 객체(하단: 물 시뮬레이션), 그리고 실제 스캔 데이터에 대해 사용자의 입력 프롬프트와의 일치성을 크게 향상시킨다. 이미지 배경은 Li et al. (2023)에서 제공하였다.

📸 추가 이미지 갤러리

ablation_lmd_additional.png screenshot_1.png screenshot_3.png suppl_axe.png

Reference

이 글은 ArXiv의 공개 자료를 바탕으로 AI가 자동 번역 및 요약한 내용입니다. 저작권은 원저자에게 있으며, 인류 지식 발전에 기여한 연구자분들께 감사드립니다.

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키