통합 후보 집합과 장면 적응형 확산 정제로 구현하는 엔드투엔드 자율주행

통합 후보 집합과 장면 적응형 확산 정제로 구현하는 엔드투엔드 자율주행
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

CdDrive는 고정된 궤적 어휘와 장면‑조건부 확산 정제 후보를 하나의 풀에 결합하고, 공유 선택 모듈로 동시에 평가한다. 또한 HA TNA 모듈을 도입해 시간‑스케일에 맞는 노이즈 조절과 저역통과를 적용, 확산 후보의 부드러움과 연속성을 보강한다. NAVSIM v1·v2 실험에서 기존 방법들을 앞서며, 각 구성 요소의 효과를 입증한다.

상세 분석

본 논문은 엔드투엔드 자율주행 플래너에서 “후보 집합 설계”라는 핵심 문제를 두 가지 상반된 요구 사이에서 균형을 맞추는 새로운 접근법으로 해결한다. 첫 번째는 고정된 궤적 어휘(vocabulary)이다. 어휘는 K‑Means 클러스터링을 통해 전문가 시연 데이터를 압축해 만든 이산 궤적 집합으로, 일상적인 주행 상황에서는 충분히 다양하고 안정적인 커버리지를 제공한다. 그러나 복잡한 상호작용(예: 교차로, 차선 변경, 비보호 교차점)에서는 최적 궤적이 어휘 밖에 존재할 가능성이 높아, 어휘만으로는 서브옵티멀 선택에 머무를 위험이 있다.

두 번째는 장면‑조건부 정제 메커니즘이다. 기존 연구들은 교차‑어텐션 기반 회귀나 단순 오프셋 보정으로 어휘를 미세 조정했지만, 이러한 방법은 “과도한 보정(over‑correction)”이라는 부작용을 일으킨다. 즉, 이미 충분히 좋은 어휘 후보를 불필요하게 변형시켜 후보 품질을 저하시킨다.

CdDrive는 이 두 접근을 통합한다. 어휘 후보는 그대로 보존하고, 각 어휘를 초기값으로 하는 조건부 확산 디노이징 과정을 추가한다. 확산 모델은 노이즈가 섞인 궤적을 단계별로 복원하면서 현재 BEV( Bird‑Eye‑View ) 장면 표현 z에 조건화한다. 여기서 중요한 설계는 트렁케이티드(noise‑truncated) 스케줄이다. 완전한 노이즈(p_T ~ N(0,I))에서 시작하지 않고, 중간 단계 t_tr에서 노이즈를 주입해 연산량을 크게 줄이면서도 충분한 탐색 능력을 유지한다.

하지만 확산 후보는 노이즈 스케일이 시간에 따라 균일하게 적용될 경우, 근거리와 원거리 구간 사이에 스케일 불균형이 발생해 “지그‑잭” 형태의 궤적 불연속성이 나타난다. 이를 해결하기 위해 논문은 HA TNA(Horizon‑Aware Trajectory Noise Adapter) 를 제안한다. HA TNA는 (1) 시간축 저역통과(smoothing) 연산으로 고주파 노이즈를 억제하고, (2) “horizon‑aware scaling vector” s를 곱해 근거리에서는 작은, 원거리에서는 큰 노이즈 스케일을 적용한다. 이렇게 변형된 노이즈 ϵ′는 기존 확산 방정식에 그대로 삽입되며, 디노이징 네트워크 자체는 변경되지 않는다. 결과적으로 확산 후보는 어휘 후보와 동일한 수준의 부드러움과 기하학적 연속성을 확보한다.

후보 생성 후, 공유 선택 모듈이 모든 후보(어휘 + 확산) 를 동시에 평가한다. 선택 모듈은 다중 헤드 어텐션 기반의 스코어링 네트워크로, 각 후보의 안전성, 효율성, 편안함 등을 종합해 최종 실행 궤적을 결정한다. 어휘 후보가 충분히 좋은 경우 그대로 선택되고, 복잡한 상황에서는 확산 후보가 우위를 점한다.

실험에서는 NAVSIM v1·v2 두 벤치마크에서 ResNet‑34 백본을 사용해 기존 최첨단 모델(VADv2, UniAD, Hydra‑MDP 등)을 모두 앞선 성능을 기록한다. 주요 지표(NC, DA, EP, TTC, Comfort, PDMS) 모두에서 0.2~1.5%p 상승을 보였으며, 특히 복잡한 인터랙션 시나리오에서 성공률이 크게 개선되었다. Ablation study에서는 (1) 어휘만 사용했을 때와 (2) 확산만 사용했을 때의 성능 차이, (3) HA TNA 적용 여부에 따른 궤적 부드러움 및 선택 안정성을 정량적으로 분석해 각 구성 요소의 기여도를 명확히 증명한다.

요약하면, CdDrive는 고정 어휘의 안정성확산 기반 적응성을 효과적으로 결합하고, 시간‑스케일에 맞는 노이즈 조절을 통해 두 후보 유형 간의 품질 격차를 최소화한다. 이는 엔드투엔드 멀티모달 플래너가 일상 주행과 복잡 상호작용 모두에서 일관된 성능을 유지하도록 하는 실용적인 설계라 할 수 있다.


댓글 및 학술 토론

Loading comments...

의견 남기기