다목적 자율주행의 파레토 공간 학습: 모듈형 데이터 기반 접근법
초록
본 연구는 자연주의 주행 궤적 데이터를 이용해 안전·효율·상호작용이라는 세 가지 핵심 목표를 동시에 고려한 파레토 최적 프런티어를 경험적으로 추출한다. TGSIM Foggy Bottom·I‑395 데이터셋을 대상으로 제안된 프레임워크를 적용했으며, 전체 타임스텝 중 0.23 %만이 파레토 최적으로 식별되었다. 파레토 최적 상태는 비최적 상태에 비해 세 목표 모두에서 높은 평균 점수를 보였으며, 특히 상호작용 점수의 개선 여지가 가장 크게 나타났다.
상세 분석
이 논문은 자율주행 차량(AV)의 행동을 다목적 관점에서 정량화하기 위해 ‘안전(S)·효율(E)·상호작용(I)’이라는 삼차원 목표 공간을 정의한다. 안전 지표는 기존의 TTC·PET을 확장한 Generalized Surrogate Safety Measure(GSSM)를 사용해 위험 확률을 로그 스케일로 변환하고, 극단값은 GPD로 모델링한다. 효율은 전방 리더와의 평균 헤드웨이와 문자열 안정성 이득(Gain)을 결합해 정규화하였다. 상호작용은 급가속·감속을 나타내는 Jerk와 Deceleration을 평균화해 점수화한다. 모든 지표는 0‑1 구간으로 min‑max 정규화하고, 낮은 값이 좋을 경우 1‑x 형태로 변환한다.
다음으로 각 타임스텝을 (S,E,I) 복합 점수 벡터로 변환하고, 파레토 우위 관계를 적용해 비지배 집합을 추출한다. 비지배 집합은 전체 데이터의 0.23 %에 불과했으며, 이는 실제 운행에서 모든 목표를 동시에 최적화하기가 매우 어려움을 시사한다. 파레토 최적점에 대해 Gaussian Process Regression(GPR)을 이용해 연속적인 파레토 프런티어 표면을 학습함으로써, 관측된 잡음과 불연속성을 완화하고 매끄러운 무역‑오프 곡선을 얻었다.
실험 결과는 파레토 최적 상태가 비최적 상태에 비해 안전(0.92 vs 0.76), 효율(0.94 vs 0.80), 상호작용(0.76 vs 0.50) 모두에서 현저히 높은 평균 점수를 보였음을 보여준다. 특히 상호작용 점수의 ‘헤드룸’(프런티어와의 거리)이 가장 크게(0.45) 나타나, 향후 제어 전략이 상호작용 개선에 집중될 여지가 있음을 강조한다.
이 프레임워크는 kinematic·위치 데이터만으로 구현 가능하며, 별도의 센서나 고가 장비가 필요 없다는 점에서 확장성이 크다. 또한 오픈소스 코드와 전처리 파이프라인을 공개함으로써 재현성을 확보하고, 다른 데이터셋이나 추가 목표(예: 승차감, 에너지 소비)에도 손쉽게 적용할 수 있다. 다만, 현재는 정규화된 복합 점수에 가중치를 부여하지 않았으며, 목표 간 상관관계를 고려한 다중 목표 최적화 기법과의 비교가 부족한 점이 향후 연구 과제로 남는다.
댓글 및 학술 토론
Loading comments...
의견 남기기