예측 정확도를 넘어 재고 비용 절감까지: 다계층 공급망에서의 모델 평가

본 논문은 M5 Walmart 데이터셋을 활용해 전통 통계 모델, 머신러닝 회귀기, 딥러닝 시계열 모델 등 7가지 예측 방법을 통합한 파이프라인을 구축하고, 이를 단일·이중 계층 뉴스벤더 시뮬레이터에 연계하여 재고 비용과 서비스 수준(충족률) 측면에서 성능을 비교한다. 결과는 Temporal CNN과 LSTM이 통계 기반 베이스라인 대비 재고 비용을 18% 이상 절감하고 충족률을 약 10%p 향상시킴을 보여준다.

저자: Swata Marik, Swayamjit Saha, Garga Chatterjee

본 논문은 ‘예측 정확도’를 넘어 ‘재고 비용 절감’이라는 실질적인 운영 가치를 평가하고자, 디지털화된 예측‑재고 최적화 파이프라인을 설계·구현하였다. 연구 배경으로는 현대 공급망이 급격한 수요 변동과 외부 충격에 직면하면서 AI 기반 의사결정 지원이 필수적이라는 점을 들며, 특히 수요 예측이 재고 최적화와 서비스 수준에 미치는 영향을 강조한다. 기존 연구는 통계·머신러닝·딥러닝 모델을 개별적으로 비교하거나, 재고 시뮬레이션에 실제 수요를 투입하지 않는 경우가 많아, 예측 개선이 실제 비용 절감으로 이어지는지를 명확히 보여주지 못했다. 특히 다계층(DC‑Store) 네트워크에서의 실증 연구는 드물다. 이를 해결하기 위해 저자들은 네 가지 주요 기여를 제시한다. 첫째, M5 Walmart 데이터셋을 기반으로 7가지 모델(통계 3종, 머신러닝 2종, 딥러닝 2종)을 동일한 피처 엔지니어링·학습 파이프라인에 통합하였다. 둘째, 각 모델의 예측을 뉴스벤더 기반 재고 시뮬레이터에 직접 연결해, 보유비용(h)와 부족비용(b) 비율에 따른 일일 평균 비용과 충족률을 KPI로 측정하였다. 셋째, 단일 계층뿐 아니라 DC‑Store 이중 계층 시뮬레이션을 구현해 상류·하류 예측 정확도가 전체 비용에 미치는 영향을 분석하였다. 넷째, 부족비용 비율(b/h) 변동에 대한 민감도 분석을 수행해 모델의 견고성을 검증하였다. 데이터 전처리에서는 M5의 일일 판매량과 캘린더 정보를 병합하고, 캘리포니아 주 FOODS 1 카테고리만을 선택해 실험을 제한하였다. 피처는 전통적인 lag와 rolling mean 외에 요일·월·프로모션(SNAP) 등 캘린더 변수를 포함했다. 훈련‑검증‑테스트는 28일씩 롤링 방식으로 분할했으며, 모든 모델은 동일한 데이터 스플릿에서 학습·튜닝되었다. 예측 모델 상세는 다음과 같다. (1) Naïve lag‑1은 가장 간단한 지속성 베이스라인, (2) Holt‑Winters ES는 주기적(7일) 계절성을 포착, (3) ARIMA(1,1,1)는 차분 기반 선형 모델, (4) Gradient Boosting Regressor와 (5) XGBoost는 트리 기반 앙상블으로 비선형 관계를 학습, (6) LSTM은 전역 시계열을 순환 신경망으로 처리, (7) Temporal CNN은 인과적 팽창 합성곱을 이용해 장기 컨텍스트를 효율적으로 모델링한다. 재고 시뮬레이터는 전형적인 뉴스벤더 구조를 따르며, 주문량 Q는 예측값의 양수 부분만 사용한다(Q = max(0, ŷ)). 일일 비용은 보유비용·부족비용을 각각 곱한 초과·부족 수량의 합으로 계산하고, 충족률은 실제 수요 대비 충족된 수량 비율로 정의한다. 이중 계층에서는 DC가 전체 매장 수요를 집계하고, 매장은 DC에서 할당받은 재고를 비례 배분받는다. 실험 결과는 두 부분으로 나뉜다. 첫째, 단일 계층에서는 Temporal CNN이 평균 일일 비용 3.674(단위 미제시)와 충족률 0.632를 기록해 Naïve 대비 비용을 18.7% 절감하고 충족률을 9.8 pp 향상시켰다. LSTM은 비용 3.704와 충족률 0.620을 보여 두 번째로 우수했다. XGBoost와 GBR도 통계 모델 대비 약 15% 비용 절감 효과를 보였다. 둘째, 부족비용 b를 2, 5, 10으로 변화시킨 민감도 분석에서, 모든 모델의 비용은 b가 커짐에 따라 상승했지만, 비용 절감 비율과 순위는 크게 변하지 않았다. 특히 Temporal CNN은 b/h 비율이 커져도 가장 낮은 비용을 유지해 비용 구조에 대한 강건성을 입증했다. 이중 계층 실험에서는 DC‑Store 간 재고 흐름이 전체 비용에 미치는 영향을 확인했다. DC 수준에서의 예측 오차가 매장 수준보다 전체 비용을 크게 증가시켰으며, 딥러닝 기반 DC 예측이 비용을 최소화했다. 이는 상류 예측 정확도가 하류 서비스 수준을 좌우한다는 실무적 인사이트를 제공한다. 논의에서는 딥러닝 모델이 장기 패턴을 효과적으로 학습해 비대칭 비용 상황에서도 비용 절감과 서비스 개선을 동시에 달성한다는 점을 강조한다. 또한, 연구 범위가 단일 카테고리·주에 국한되고, 주문 정책이 단순 포인트 예측에 의존해 가격·프로모션·대체 효과를 반영하지 못한다는 한계를 인정한다. 향후 연구 방향으로는 (1) 다양한 카테고리·지역 확대, (2) 가격·프로모션 반영 모델링, (3) 분위수(분포) 예측을 통한 재고 정책 최적화, (4) 강화학습 기반 다계층 재고 제어, (5) 수평 전송(트랜스시핑)과 같은 복합 제약 조건을 포함한 시뮬레이션을 제시한다. 결론적으로, 본 논문은 예측 모델을 단순 정확도 지표가 아닌 재고 비용·충족률이라는 비즈니스 KPI와 직접 연결해 평가함으로써, 공급망 관리자가 데이터‑드리븐 의사결정을 내릴 때 실질적인 비용 절감 효과를 정량화할 수 있음을 입증한다. 딥러닝, 특히 Temporal CNN이 다양한 비용 구조와 다계층 네트워크에서 가장 일관된 성과를 보이며, 향후 실무 적용 가능성이 높다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기