예측시간이 늘어날수록 교통 흐름 모델 성능은 어떻게 변하는가
초록
본 연구는 캘리포니아 항구 고속도로의 실제 교통 속도·유량 데이터를 활용해 통계, 머신러닝, 딥러닝 모델 20개의 예측 윈도우(최대 1시간 40분)에서 RMSE, MAE, R² 지표로 성능을 평가한다. 초기 구간에서는 ANFIS‑GP가 RMSE 0.038, MAE 0.0276, R² 0.9983으로 최고였으며, 중·장기 예측에서는 시계열 종속성을 잘 포착하는 Bi‑LSTM이 RMSE 0.1863, MAE 0.0833, R² 0.987을 기록했다. 로그 변환 후 기울기 분석을 통해 모델의 견고성을 정량화했으며, 딥러닝 중 Bi‑LSTM이 가장 완만한 기울기(0.0454 RMSE, 0.0545 MAE)로 장기 예측에 강함을 보였다. 연구는 하이브리드 모델의 잠재력을 강조한다.
상세 분석
본 논문은 교통 흐름 예측에서 예측 시계가 길어질수록 모델 성능이 어떻게 감소하는지를 정량적으로 규명하고자 한다. 데이터는 캘리포니아 주 교통청이 운영하는 PeMS 시스템에서 수집한 Harbor Freeway 구간의 5분 간격 속도·유량 시계열이며, 결측치 보정 및 정규화를 거쳐 20개의 예측 윈도우(5분, 10분 … 100분)로 분할하였다. 통계 모델로는 ARIMA와 SARIMAX, 머신러닝 모델로는 랜덤 포레스트, XGBoost, SVR, 그리고 ANFIS‑GP(Adaptive‑Neuro‑Fuzzy Inference System with Genetic Programming)를 적용했으며, 딥러닝 모델로는 LSTM, Bi‑LSTM, GRU, Temporal Convolutional Network(TCN) 등을 구현하였다. 각 모델은 동일한 학습·검증·테스트 프로토콜을 따랐으며, 성능 평가는 RMSE, MAE, R²로 수행되었다.
결과는 초기 구간(5~15분)에서 ANFIS‑GP가 가장 낮은 오차와 높은 결정계수를 보이며, 이는 퍼지 규칙과 유전 알고리즘을 결합한 하이브리드 구조가 비선형 교통 변동을 빠르게 포착한다는 점을 시사한다. 그러나 예측 시계가 30분을 넘어가면 ANFIS‑GP의 오차 증가율이 급격히 상승한다. 반면 Bi‑LSTM은 양방향 구조가 과거와 미래 정보를 동시에 활용함으로써 장기 의존성을 효과적으로 학습하고, 20번째 윈도우(1시간 40분)에서도 RMSE 0.1863, MAE 0.0833, R² 0.987이라는 견고한 성능을 유지한다.
모델 성능 저하를 정량화하기 위해 로그 변환된 RMSE·MAE 값을 시간에 대한 선형 회귀로 피팅하고, 기울기(slope)를 ‘성능 저하율’로 정의하였다. 딥러닝 모델 중 Bi‑LSTM은 가장 완만한 기울기(0.0454 RMSE, 0.0545 MAE)를 보여 장기 예측에 가장 강인함을 나타냈으며, ANFIS‑GP는 0.1058(RMSE)·0.1037(MAE)로 비교적 급격히 악화된다. 이러한 분석은 모델 선택 시 예측 시계와 요구 정확도 사이의 트레이드오프를 명확히 제시한다.
마지막으로 논문은 하이브리드 접근법, 특히 딥러닝과 퍼지·진화 알고리즘을 결합한 모델이 초기·중기 예측에서 각각 강점을 살릴 수 있음을 제안한다. 향후 연구는 멀티스케일 입력, 외부 요인(날씨·사고) 통합, 그리고 온라인 학습을 통한 실시간 적응성을 탐구함으로써 ITS 현장 적용성을 높이는 방향을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기