목표조건 트랜스포머를 이용한 통합 예측·플래닝 프레임워크

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

PlanTRansformer(PTR)는 목표(고레벨 명령)와 차선 정보를 조건으로 삼아, Gaussian Mixture 기반 트랜스포머 모델에 동적 타당성·충돌 회피 제약을 결합한 통합 예측·플래닝 방법이다. 교사‑학생식 마스킹 학습으로 주변 에이전트의 의도 정보를 점진적으로 제거해 추론 시와 동일한 입력 환경을 만들며, 기존 Motion Transformer(MTR) 대비 예측 mAP을 4.3 %/3.5 % 향상시키고 5 초 플래닝 오류를 15.5 % 감소시킨다.

상세 분석

PlanTRansformer(PTR)의 핵심 기여는 예측과 플래닝 사이의 구조적 불일치를 해소하기 위해 세 가지 요소를 동시에 도입한 점이다. 첫째, 고레벨 명령(HLC)을 명시적으로 입력에 포함시켜 목표‑조건화(goal‑conditioned) 방식을 구현한다. 명령은 좌·우·직진·정지·미확인·보행자·자전거 등 여섯 가지 클래스로 정의되며, 각 클래스마다 별도의 임베딩(e_c)을 통해 모션 쿼리의 초기값을 조정한다. 이는 디코더가 의도에 부합하는 모드로 빠르게 수렴하도록 돕는다. 둘째, 차선(polyline) 정보를 “도달 가능 차선”(reachable lanes) 형태로 인코딩하고, 디코더의 교차‑어텐션에 직접 주입한다. 차선 토큰은 지도 토폴로지를 보존하면서도 목표 차선으로의 제한을 제공해, 예측이 물리적으로 불가능한 경로를 생성하는 것을 방지한다. 셋째, 동적 타당성 및 충돌 회피 제약을 미분 가능 손실로 정의해 학습 단계에서 직접 최적화한다. 구체적으로 가속도·속도 한계, 차선 경계 위반, 다른 에이전트와의 거리 최소화 등을 정규화 항으로 추가함으로써, 모델이 안전하고 실행 가능한 궤적을 출력하도록 유도한다.

학습 전략에서도 혁신이 눈에 띈다. 교사‑학생 방식으로 주변 에이전트의 “명령”(즉, 의도 추정값)을 점진적으로 마스킹한다. 초기 단계에서는 완전한 명령 정보를 제공해 빠른 수렴을 돕고, 이후 마스킹 비율을 늘려 실제 추론 시와 동일한 정보 부족 상황에 적응한다. 이 과정은 모델이 의도 없는 상황에서도 안정적인 멀티모달 분포를 학습하게 만든다.

구조적으로는 MTR의 인코더‑디코더 파이프라인을 그대로 유지하면서, 로컬 어텐션(k‑nearest neighbor) 기반의 인코더와 명령‑조건화된 디코더를 추가한다. 로컬 어텐션은 메모리 효율성을 확보하면서도 도로 네트워크와 에이전트 간의 근접 상호작용을 효과적으로 포착한다. 디코더는 정적·동적 모션 쿼리 쌍을 사용해 각 모드별 평균·공분산을 예측하고, 이를 Gaussian Mixture Model(GMM) 헤드로 출력한다.

실험에서는 Waymo Open Motion Dataset을 사용해 두 가지 관점을 평가한다. 예측 측면에서는 marginal 및 joint mAP이 각각 4.3 %와 3.5 % 상승했으며, 이는 목표‑조건화와 차선 제약이 멀티모달 정확도를 크게 개선했음을 의미한다. 플래닝 측면에서는 GameFormer 대비 5 초 시계열에서 경로 오차가 15.5 % 감소했으며, 이는 충돌 회피·동적 타당성 손실이 실제 주행 시나리오에 유의미한 안전 이득을 제공함을 보여준다. 또한, PTR은 아키텍처‑불변성을 갖추고 있어 다른 트랜스포머 기반 예측 모델에도 손쉽게 적용 가능하다는 점을 강조한다.

전체적으로 PTR은 “예측 → 플래닝” 파이프라인을 하나의 통합 네트워크로 재구성함으로써, 데이터 라벨링의 한계(에이전트 의도 부재)와 안전 제약의 불일치를 동시에 해결한다. 이는 향후 자율주행 시스템이 예측 모듈을 별도 플래너에 의존하지 않고, 내재된 목표와 제약을 통해 직접 안전한 궤적을 생성할 수 있는 방향성을 제시한다.

목표조건 트랜스포머를 이용한 통합 예측·플래닝 프레임워크

초록

상세 분석

댓글 및 학술 토론

의견 남기기