단기 예측 후 클러스터링 기반 식사 배달 서비스 최적화 프레임워크
초록
본 논문은 실시간 운영 효율성을 높이기 위해 단기 수요 예측과 공간적 제약을 고려한 클러스터링을 순차적으로 적용하는 프레임워크를 제안한다. 앙상블 학습 기반의 포인트·분포 예측 모델과 새롭게 설계한 제약 K‑Means(CKMC) 및 연속성 제약 계층적 클러스터링(CCHC‑ICE)을 결합해 유럽·대만 사례에서 정확도와 계산 효율성을 입증하였다.
상세 분석
이 연구는 온디맨드 식사 배달(ODMD) 플랫폼의 실시간 의사결정을 지원하기 위해 ‘예측‑후‑클러스터링(predict‑then‑cluster)’이라는 두 단계 구조를 채택한다. 첫 단계에서는 다변량 특성(시간 지연 수요, 날씨, 공휴일 등)을 활용한 앙상블 학습 모델—특히 Random Forest와 Gradient Boosting 기반의 Quantile Regression Forest(QRF)—를 이용해 포인트 예측과 동시에 확률분포(분위수) 예측을 수행한다. 기존 시계열 모델(SARIMA, TBA‑TS) 대비 QRF는 복합 계절성 및 데이터 희소성에 강인하며, 특히 대만과 같이 관측치가 제한된 지역에서도 높은 예측 정확도를 보인다.
두 번째 단계인 클러스터링에서는 예측된 수요와 지리적 좌표를 동시에 고려한다. CKMC은 K‑Means에 클러스터 크기·최소/최대 수요 제약을 추가해 운영상의 한계를 반영한다. CCHC‑ICE는 계층적 병합 과정을 거치면서 연속성(인접성) 제약을 반복적으로 적용하고, 사용자가 정의한 최대 클러스터 면적·최소 클러스터 수 등을 동적으로 만족시킨다. 이러한 제약 강화는 주문 번들링, 배차 구역 설정 등 실제 운영에서 필수적인 지리적 연속성을 보장한다.
실험 결과는 두 가지 주요 관점에서 의미 있다. 첫째, 예측 정확도(RMSE, MAE)와 분포 예측 신뢰구간 커버리지는 전통적 시계열 모델보다 10~15% 개선되었으며, 학습·예측 시간도 30% 이상 단축되어 실시간 업데이트가 가능함을 보여준다. 둘째, 예측 기반 클러스터링은 실제 수요와의 차이를 최소화했으며, 특히 불확실성이 큰 피크 시간대에 분포 예측을 활용한 클러스터링이 기존 정적 클러스터 대비 평균 12% 높은 운영 효율성을 달성했다. 시뮬레이션에서는 예측된 수요를 이용해 유휴 차량을 사전 재배치함으로써 평균 배달 시간과 차량 대기 시간을 각각 8%와 11% 감소시켰다.
또한, 코드와 데이터셋을 공개함으로써 재현성을 확보하고, 다른 온디맨드 물류·모빌리티 서비스에 프레임워크를 확장 적용할 수 있는 기반을 제공한다. 제약 기반 클러스터링과 분포 예측의 결합은 기존 ‘예측‑후‑클러스터링’ 연구에서 간과되던 불확실성 관리와 운영 제약을 동시에 해결한다는 점에서 학문적·실무적 기여가 크다.
댓글 및 학술 토론
Loading comments...
의견 남기기