장면 적응형 모션 플래너: 명시적 전문가 혼합과 상호작용 최적화
초록
EMoE‑Planner는 장면 라우터를 통해 시나리오별 전문가를 명시적으로 선택하고, 장면‑특정 쿼리와 상호작용‑지향 손실을 결합해 다중 모달 궤적 생성과 이웃 차량과의 상호작용을 동시에 고려한다. NuPlan 데이터셋에서 기존 SOTA와 규칙 기반 플래너를 모두 능가하는 성능을 보이며, 복잡한 도시 환경에서 최초로 순수 학습 모델이 규칙 기반을 앞선 결과를 얻었다.
상세 분석
본 논문은 자율주행 궤적 계획의 두 가지 핵심 문제—다중 모달성 처리와 에이전트 간 상호작용 고려—를 동시에 해결하기 위해 세 가지 혁신적 요소를 제시한다. 첫 번째는 ‘Explicit Mixture of Experts(EMoE)’이다. 기존 MoE는 라우터가 블랙박스 형태로 전문가를 선택해 로드 밸런스와 해석 가능성이 떨어지는 반면, EMoE는 장면 인코더에서 추출된 시맨틱한 장면 특징을 입력으로 하는 단일 라우터를 두어 사전에 정의된 7개의 시나리오(좌회전, 직진, 우회전, 라운드어밋, U‑턴 등) 중 하나를 명시적으로 분류한다. 라우터는 사전 라벨링된 데이터로 감독 학습되며, 각 전문가가 특정 시나리오에 전용되도록 설계돼 전문가당 학습 부담을 크게 감소시킨다. 또한, 시나리오 비율에 따라 자동 로드 밸런싱이 이루어져 데이터가 희소한 상황에서도 전문가가 과도하게 과부하되지 않는다.
두 번째 혁신은 ‘Scene‑Specific Query’이다. 전통적인 앵커‑프리 혹은 전역 쿼리 방식은 모든 가능한 목표 지점을 탐색하게 하여 불필요한 모달 붕괴와 저품질 궤적을 초래한다. 여기서는 라우터가 결정한 시나리오에 맞춰 목표 영역(예: 좌회전 시 좌전방)만을 포함하는 쿼리 벡터를 생성함으로써 모델이 의도된 행동에 집중하도록 유도한다. 이는 학습 안정성을 높이고, 불필요한 후보 궤적 생성을 억제해 다중 모달성 유지와 품질 향상을 동시에 달성한다.
세 번째는 ‘Interaction‑Oriented Loss’이다. 기존 모방 학습 손실은 ego 차량과 주변 에이전트 간의 상호작용을 무시해 복잡한 교차로에서 충돌률이 높았다. 논문은 (1) ego‑agent 상호작용을 고려한 주변 차량 궤적 예측, (2) 이 예측 결과를 기반으로 ego 궤적에 대한 상호작용 손실을 추가함으로써, ego 차량이 주변 차량의 반응을 예측하고 이에 맞게 계획을 수정하도록 학습한다. 이 손실은 특히 밀집 교통 상황에서 안전성을 크게 향상시킨다.
실험에서는 NuPlan 데이터셋의 다양한 시나리오에 대해 EMoE‑Planner를 기존 MoE 기반 플래너, anchor‑based 모델, diffusion 기반 모델 등과 비교하였다. 결과는 평균 ADE/FDE, 충돌 비율, 규칙 위반 지표 모두에서 현저히 우수했으며, 특히 라운드어밋·U‑턴·복합 교차로와 같은 데이터가 적은 시나리오에서 전문가 별 특화가 큰 이점을 제공함을 확인했다. 또한, 규칙 기반 플래너와 비교했을 때 폐쇄‑루프 시뮬레이션에서 거의 모든 상황에서 성능을 앞섰다.
한계점으로는 (1) 시나리오 라벨링이 사전 규칙에 의존해 라벨링 오류가 발생할 가능성, (2) 전문가 수가 고정돼 새로운 시나리오가 등장하면 모델 확장이 어려울 수 있음, (3) 라우터가 단일 레이어에 집중되면서 복합적인 장면 변화를 즉시 반영하기엔 제한적일 수 있다. 향후 연구에서는 라벨링 자동화, 전문가 동적 추가·제거 메커니즘, 그리고 라우터와 전문가 간의 피드백 루프를 도입해 이러한 제약을 완화할 수 있을 것이다.
댓글 및 학술 토론
Loading comments...
의견 남기기