마코프 전이 음이항 모델을 이용한 차량 사고 빈도 분석

본 논문은 인디애나 주 고속도로 구간의 5년간 사고 데이터를 이용해, 두 개의 잠재적 안전 상태를 가정한 마코프 전이 음이항(MSNB) 모델을 제안한다. 베이지안 추정과 MCMC 시뮬레이션을 통해 모델을 추정한 결과, 기존 단일 상태 음이항 모델보다 통계적 적합도가 크게 향상되었으며, 더 빈번히 나타나는 상태가 좋은 날씨와 연관되어 안전함을, 덜 빈번한 상태가 악천후와 연관되어 위험함을 확인하였다.

저자: Nataliya V. Malyshkina, Fred L. Mannering, Andrew P. Tarko

마코프 전이 음이항 모델을 이용한 차량 사고 빈도 분석
본 논문은 차량 사고 빈도라는 전형적인 카운트 데이터를 분석하기 위해, 두 개의 잠재적 안전 상태가 존재하고 시간에 따라 전이될 수 있다는 가정을 도입한 마코프 전이 음이항(MSNB) 모델을 제안한다. 기존의 포아송·음이항 모델은 사고 발생 과정을 단일 확률 과정으로 가정하지만, 실제 도로 환경은 날씨, 교통량, 도로 설계 등 다양한 요인에 의해 시시각각 변한다. 이러한 변동성을 반영하기 위해 저자들은 상태 변수 sₜ∈{0,1}를 도입하고, sₜ가 마코프 체인에 따라 전이되는 구조를 설계하였다. 전이 확률 p₀→₁과 p₁→₀는 각각 ‘안전 상태→위험 상태’와 ‘위험 상태→안전 상태’ 전이의 확률을 의미한다. 모델의 핵심은 상태별 평균 사고율 λₜ,ₙ을 로그선형 형태로 표현하고, 상태마다 별도의 과산포 파라미터 α를 허용한다는 점이다. 구체적으로 λₜ,ₙ=exp(β(0)·Xₜ,ₙ) (sₜ=0) 혹은 λₜ,ₙ=exp(β(1)·Xₜ,ₙ) (sₜ=1) 로 정의하고, 사고 건수 Aₜ,ₙ은 음이항 분포 P(Aₜ,ₙ|λₜ,ₙ,α) 를 따른다. 여기서 Xₜ,ₙ은 도로 길이, 곡률, 경사, 포장 상태 등 12개의 설명변수로 구성된다. 베이지안 추정을 위해 비정보적 사전분포를 설정하고, MCMC 시뮬레이션을 통해 사후분포를 샘플링한다. 전이 확률, β 파라미터, α 파라미터, 그리고 상태 시퀀스 S={s₁,…,s_T} 모두를 동시에 추정한다. 사후 샘플을 이용해 베이지안 팩터를 계산함으로써, MSNB 모델이 단일 상태 NB 모델보다 통계적으로 우수함을 검증한다. 실증 분석에서는 1995‑1999년 인디애나 주 고속도로 335개 구간에서 발생한 5,769건의 사고 데이터를 사용하였다. 데이터는 주간 단위(총 260주)로 집계되었으며, 모든 구간에 대해 동일한 상태 sₜ가 적용된다(즉, 전체 도로망이 동일한 안전 상태를 공유한다는 가정). 네 가지 모델을 비교하였다. 첫 번째는 전통적인 NB 모델을 MLE로 추정한 ‘NB‑by‑MLE’; 두 번째는 동일 모델을 베이지안‑MCMC로 추정한 ‘NB‑by‑MCMC’; 세 번째는 절편과 과산포 파라미터만 상태별로 다르게 허용한 ‘restricted MSNB’; 마지막은 모든 β와 α를 상태별로 자유롭게 추정한 ‘full MSNB’. 추정 결과, 전이 확률은 p₀→₁=0.12, p₁→₀=0.35 정도로, ‘더 빈번한 상태(sₜ=0)’가 평균적으로 74%의 시간 비중을 차지한다는 것을 보여준다. β 파라미터는 두 상태에서 유의미하게 차이가 나며, 특히 도로 길이와 곡률은 위험 상태에서 사고율을 크게 증가시키는 반면, 포장 상태는 안전 상태에서 더 큰 보호 효과를 보인다. 과산포 파라미터 α(0)와 α(1)도 차이를 보이며, 위험 상태에서 사고 건수의 변동성이 더 크다. 날씨와의 연계 분석에서는 기상청 자료와 매칭해, 평균 기온·시정·강수량이 좋은 주에 ‘안전 상태’가 85% 이상 유지되는 반면, 악천후(강수량 > 10mm, 시정 < 2km) 주에는 ‘위험 상태’ 전이 확률이 급증한다는 결과를 얻었다. 이는 기존 제로인플레이션 모델이 가정하는 ‘완전 안전 상태’를 필요로 하지 않으며, 두 개의 위험 수준이 동적으로 전이될 수 있음을 실증적으로 입증한다. 정책적 함의로는, 위험 상태 전이 확률을 실시간 기상·교통 정보와 결합해 사전 경보 시스템을 구축하고, 위험 상태가 감지될 경우 가변 속도 제한, 도로 조명 강화, 교통 관리 인력 배치를 통해 사고를 예방할 수 있다. 또한, 모델은 다중 상태(M>2)로 확장 가능하지만, 파라미터 식별성 및 계산 복잡도가 급증하므로 실제 적용 시 신중히 고려해야 한다. 결론적으로, 이 논문은 마코프 전이 음이항 모델을 교통 안전 분야에 성공적으로 적용함으로써, 카운트 데이터의 이질성·시간 변동성을 포착하는 새로운 통계적 프레임워크를 제시한다. 베이지안‑MCMC 기반 추정과 베이지안 팩터를 통한 모델 비교는 향후 교통 사고 분석뿐 아니라 다른 분야의 카운트 데이터에도 적용 가능한 강력한 방법론을 제공한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기