구글 기반 모드 선택 모델링 접근법

초록

본 논문은 여행 조사 데이터를 활용해 개인이 실제로 직면한 교통 대안들을 구체적으로 재구성하고, 특히 대중교통 접근성이 지역마다 크게 차이나는 점을 강조한다. 구글 지도 API를 이용해 실시간·실제 가능한 경로를 생성함으로써 전통적인 모드 선택 모델이 간과한 제약조건을 반영한다. 이를 토대로 구축한 모드 선택 모델은 기존 모델 대비 예측 정확도가 향상되었으며, 정책 시뮬레이션 시 보다 현실적인 결과를 제공한다.

상세 분석

이 연구는 활동 기반 교통 모델링의 핵심 과제인 ‘대안 집합(choice set)’ 형성에 초점을 맞추었다. 전통적인 모드 선택 모델은 통계적 가정에 의존해 가용 대안을 추정하지만, 실제 현장에서는 거리, 시간, 서비스 빈도 등 물리적·운영상 제약이 복합적으로 작용한다. 저자들은 2019년 전국 여행 조사 데이터를 기반으로, 각 여행자·여행 목적지 쌍에 대해 구글 지도 API를 호출해 도보, 자전거, 자동차, 대중교통(버스·지하철·열차) 경로를 자동으로 생성하였다. 이 과정에서 ‘최단 시간’, ‘최단 거리’, ‘최소 환승’ 등 다중 목표 최적화를 적용해 실제 이용자가 선택할 가능성이 높은 3~5개의 후보 경로를 도출한다.

특히 대중교통의 경우, 구글이 제공하는 GTFS(General Transit Feed Specification) 데이터를 활용해 노선·운행시간·정류장 정보를 실시간에 가깝게 반영하였다. 이를 통해 조사 지역 중 교외·시골 지역에서는 대중교통 옵션 자체가 존재하지 않거나, 환승 횟수가 과도해 실질적인 선택지에서 제외되는 현상을 정량화했다. 결과적으로, 전체 표본의 27%가 조사 시점에 실제 이용 가능한 대중교통 대안을 전혀 갖지 못했으며, 이는 기존 모델이 가정한 ‘모든 모드가 가용하다’는 전제와 큰 차이를 보인다.

모드 선택 모델은 다항 로짓 구조를 유지하면서, 각 대안의 가용성 지표(예: 대중교통 가용 여부, 예상 소요 시간, 비용)를 새로운 설명 변수로 포함시켰다. 변수 선택 과정에서 LASSO 회귀를 적용해 과적합을 방지하고, 교차 검증을 통해 모델의 일반화 성능을 검증하였다. 결과는 기존 베이스라인 모델 대비 전체 정확도가 4.3%p 상승했으며, 특히 대중교통 선택 예측에서 9.1%p 향상을 기록했다. 이는 대안 집합을 실제 상황에 맞게 재구성한 것이 모델 성능에 직접적인 영향을 미쳤음을 시사한다.

또한, 정책 시뮬레이션(예: 새로운 버스 노선 추가, 기존 노선 연장)에서 구글 기반 대안 생성 모듈을 재활용함으로써, 제안된 정책이 실제 이용자에게 제공되는 대안 수와 질을 정량적으로 평가할 수 있었다. 이는 정책 입안자가 ‘대안 부족’이라는 구조적 제약을 사전에 인지하고, 목표 지역에 맞는 맞춤형 교통 인프라를 설계하는 데 실질적인 도움을 준다.

이 논문의 주요 기여는 다음과 같다. 첫째, 여행 조사 단계에서 수집된 제한된 정보만으로도 구글 지도 API와 GTFS 데이터를 결합해 고품질 대안 집합을 자동 생성할 수 있음을 입증했다. 둘째, 대안 가용성 변수를 모드 선택 모델에 통합함으로써 예측 정확도를 실질적으로 개선했다. 셋째, 정책 평가 시 대안 집합의 변화를 정량화함으로써 보다 현실적인 시뮬레이션 결과를 제공했다. 마지막으로, 데이터 접근성(구글 API 무료 이용)과 구현 용이성(파이썬 스크립트 기반) 덕분에 다른 지역·국가에서도 손쉽게 적용 가능한 프레임워크를 제시했다.

이러한 접근법은 특히 대중교통 서비스가 불균형하게 분포된 대도시 주변 지역이나 교외 지역에서 유용하며, 향후 교통 수요 모델링의 표준 절차에 대안 집합 자동 생성 단계가 포함될 가능성을 열어준다. 향후 연구에서는 실시간 교통 상황(혼잡도, 사고)까지 반영한 동적 대안 생성, 그리고 머신러닝 기반 대안 선택 예측 모델과의 통합을 통해 더욱 정교한 수요 예측 체계를 구축할 수 있을 것이다.