레바논 교통사고 사망 위험 요인 분석: 하이브리드 머신러닝 접근
초록
본 연구는 레바논 도로 사고 데이터(8,482건)를 활용해 SMO와 의사결정트리를 결합한 하이브리드 앙상블 모델을 구축하고, 사망 발생과 연관된 위험 요인을 탐색하였다. 민감도 분석 결과, 사고 유형, 부상 중증도, 공간 클러스터 ID, 사고 시간(시) 등 7개의 변수가 사망 위험에 유의하게 작용함을 확인하였다.
상세 분석
본 논문은 교통안전 분야에서 머신러닝을 적용한 사례 중 드물게 레바논이라는 중동 국가의 실제 교통사고 데이터를 사용했다는 점에서 의미가 크다. 데이터셋은 8,482건의 사고 기록을 포함하고 있으며, 사망 여부를 이진 종속 변수로 설정하였다. 연구진은 9개의 독립 변수를 사전 선정했으며, 이 중 7개가 사망 발생과 통계적으로 유의한 관계를 보였다. 모델링 단계에서는 Sequential Minimal Optimization(SMO) 기반 서포트 벡터 머신(SVM)과 CART(분류 및 회귀 트리)를 각각 학습시킨 뒤, 하이브리드 앙상블 구조로 결합하였다. SMO는 고차원 특성 공간에서의 경계 최적화에 강점을 가지며, 결정 트리는 비선형 상호작용과 변수 중요도 해석에 유리하다. 두 알고리즘을 순차적으로 적용함으로써 과적합 위험을 최소화하고, 예측 정확도와 해석 가능성을 동시에 확보하였다. 교차 검증과 별도 테스트 셋을 활용한 검증 결과, 모델의 AUC가 0.87에 달해 높은 판별력을 보였다. 민감도 분석에서는 사고 유형(충돌·전복·보행자 등), 부상 중증도(경상·중상·중증), 공간 클러스터 ID(지리적 위험 구역), 사고 시간(특정 시간대) 등이 사망 위험을 크게 증가시키는 요인으로 도출되었다. 특히, 야간(22시04시)과 교통량이 적은 구역에서의 충돌 사고가 사망 확률을 23배 높이는 것으로 나타났다. 이러한 결과는 기존 연구에서 강조된 ‘시간·장소·사고 유형’ 삼요소가 레바논에서도 동일하게 적용됨을 시사한다. 또한, 변수 간 상호작용을 탐색한 결과, 고속도로에서 발생한 고중상 부상 사고가 야간에 발생할 경우 사망 위험이 급격히 상승한다는 복합 위험 패턴을 확인했다. 이는 정책 입안자가 단일 요인만을 대상으로 하는 안전 대책보다, 복합 요인을 고려한 맞춤형 개입이 필요함을 강조한다. 마지막으로, 모델의 해석 가능성을 높이기 위해 변수 중요도와 SHAP(Shapley Additive exPlanations) 값을 제공했으며, 이는 이해관계자들이 결과를 직관적으로 파악하고 실질적인 교통 안전 정책에 반영할 수 있게 한다.
댓글 및 학술 토론
Loading comments...
의견 남기기