고속도로 사고 사전 탐지를 위한 차량 궤적 기반 실시간 머신러닝 모델
초록
본 연구는 GPS 기반 차량 궤적 데이터를 활용해 I-10 고속도로에서 사고 발생 전후의 차량 움직임을 분석하고, 로지스틱 회귀, 랜덤 포레스트, XGBoost, 인공신경망 등 네 가지 머신러닝 알고리즘을 비교한다. 불균형 데이터 문제를 SMOTE로 보완하고, 가상 검지기를 도입해 공간적 일관성을 확보하였다. 실험 결과 랜덤 포레스트가 가장 높은 재현율과 판별력을 보이며, 실시간으로 하류 구간 사고 가능성을 예측하는 데 유망함을 확인했다.
상세 분석
이 논문은 차량 연결성 데이터가 기존 루프 검지기보다 제공할 수 있는 미세한 운전 행동 정보를 활용해 사고 조기 경보 시스템을 설계하고자 한다. 데이터는 2021년 허리케인 ‘아이다’ 대피 기간 동안 루이지애나 주 I‑10 구간에서 수집된 3일간의 GPS 궤적(135,204대)과 RITIS 사고 데이터(256건)를 사용한다. 주요 기술적 흐름은 다음과 같다.
-
데이터 정제 및 트립 분리: I‑10 구간 외 좌표를 제거하고, 연속된 GPS 포인트 사이 간격이 15분을 초과하면 새로운 트립으로 간주해 전체 트립을 11,674개로 축소하였다. 이동 방향은 모빌리티 각도로 추정해 동·서향 트립을 구분했다.
-
가상 검지기(Virtual Detector) 구축: 1/16마일(≈110 m) 간격으로 가상 검지기를 배치해 각 트립을 검지기 기반 시계열로 변환하였다. 이를 통해 속도, 속도 표준편차, 헤딩 각 등 정량적 특성을 동일한 공간 단위에 매핑함으로써 비균일한 샘플링 간격을 보정하고, 피크/오프피크 구간을 별도 변수로 포함시켰다.
-
기상 데이터 통합: 기상청 자료를 연계해 강수 여부를 이진 변수로 추가, 악천후가 사고 위험에 미치는 영향을 모델에 반영하였다.
-
사고‑트립 매칭: 각 사고에 가장 가까운 가상 검지기를 사건 검지기(event detector)로 지정하고, 해당 검지기를 통과한 트립을 사고와 연결시켰다. 시간적 윈도우는 사고 발생 시점 전후 2분 이내로 설정해 실제 운전자가 사고 구간을 통과했는지를 판단하였다.
-
불균형 처리: 사고 트립(양성)과 비사고 트립(음성)의 비율이 크게 차이나는 문제를 SMOTE 기법으로 보완하여 1:4 비율을 목표로 합성 샘플을 생성하였다.
-
모델링: 로지스틱 회귀(LR), 랜덤 포레스트(RF), XGBoost(XGB), 인공신경망(ANN) 네 가지 분류기를 학습시켰으며, 5‑fold 교차검증을 통해 정확도, 재현율, F1-score, AUC 등 다중 지표를 평가했다.
-
결과 해석: RF가 평균 재현율 0.78, AUC 0.84 등 가장 우수한 성능을 보였으며, 변수 중요도 분석에서 ‘피크 구간 평균 속도’, ‘속도 표준편차’, ‘헤딩 각 변화량’이 사고 예측에 핵심적인 역할을 함을 확인했다. ANN은 과적합 경향이 있었고, XGB는 성능이 RF에 근접했지만 학습 시간과 파라미터 튜닝 복잡도가 높았다.
-
실시간 적용 가능성: 가상 검지기 기반 데이터 구조는 스트리밍 환경에서도 실시간으로 업데이트 가능하며, RF 모델은 비교적 경량이라 현장 교통 관리센터에 배치하기에 적합하다.
핵심 인사이트
- 저주파(≤30 s) GPS 데이터라도 가상 검지기로 재구성하면 공간적 일관성을 확보하고, 실시간 사고 위험을 효과적으로 추정할 수 있다.
- 사고 전후 2분이라는 짧은 시간 윈도우가 충분히 사고와 연관된 트립을 포착함을 보여, 조기 경보 시스템의 반응 시간을 크게 단축할 수 있다.
- 변수 중요도 분석을 통해 속도 변동성과 헤딩 각 변화가 사고 전조 신호임을 확인, 향후 센서 설계 시 해당 특성을 강조하면 탐지 정확도를 높일 수 있다.
- SMOTE 기반 데이터 증강이 불균형 문제를 완화했으며, 실제 운영 단계에서는 온라인 학습과 함께 지속적인 데이터 리밸런싱이 필요하다.
댓글 및 학술 토론
Loading comments...
의견 남기기