다품목 다기간 재고 관리 실험 설계와 편향 분석

다품목 다기간 재고 관리 실험 설계와 편향 분석
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 손실 판매와 창고 용량 제약이 있는 다품목·다기간 재고 시스템에서 A/B 테스트를 설계할 때 발생하는 편향을 체계적으로 분석한다. 스위치백 실험은 시간적 캐리오버로 인해 전반적인 처리 효과를 과소평가하고, 품목 수준 무작위화는 용량 경쟁으로 인한 캔ibalization으로 효과를 과대평가한다는 정량적 결과를 제시한다. 두 설계의 편향 방향을 정리한 뒤, 아이템·시간을 동시에 무작위화하는 쌍별 설계를 제안하고, 실데이터 기반 시뮬레이션을 통해 이론을 검증한다.

상세 분석

이 연구는 재고 관리라는 전통적으로 시뮬레이션에 의존해 온 분야에 실험적 방법론을 도입함으로써, 정책 평가의 신뢰성을 크게 향상시킬 수 있음을 보여준다. 먼저, 저자는 손실 판매와 용량 제약이 동시에 존재하는 다품목·다기간 모델을 수학적으로 정의하고, 정책의 핵심 차별점이 수요 예측기의 평균 차이인지 분산 차이인지에 따라 두 가지 전형적인 실험 설계가 어떻게 서로 다른 편향을 야기하는지 분석한다.

스위치백 실험에서는 모든 품목에 대해 동일한 처리(신규 정책 또는 기존 정책)를 일정 기간 동안 적용하고, 그 후 교체한다. 이때 정책이 재고 수준에 미치는 영향이 다음 기간의 초기 재고에 반영되므로, “시간적 간섭”이 발생한다. 저자는 평균 차이가 지배적인 경우, 스위치백 설계가 실제 전역 처리 효과(Global Treatment Effect, GTE)를 체계적으로 낮게 추정한다는 정리를 제시한다. 이는 정책이 재고를 과잉 축적하거나 부족하게 만들면서, 이후 기간에 발생하는 매출·비용이 왜곡되기 때문이다. 반대로, 예측기의 분산 차이가 주요 요인일 때는 스위치백이 오히려 효과를 과대평가할 수 있음을 보인다.

품목 수준 무작위화는 각 품목을 독립적으로 처리·통제 그룹에 배정한다. 그러나 창고 용량이 제한돼 있기 때문에, 한 품목에 더 많은 재고를 할당하면 다른 품목의 주문 가능량이 감소한다. 이는 “캔ibalization”이라 불리는 공간적 간섭을 초래한다. 평균 차이가 큰 경우, 이 설계는 GTE를 지속적으로 높게 추정한다. 즉, 처리 그룹이 재고를 더 많이 확보함에 따라 매출이 증가하지만, 실제로는 용량 제한으로 인해 통제 그룹의 매출이 억제된 결과가 반영된 것이다. 반면, 분산 차이가 주된 경우에는 무작위화가 거의 편향이 없으며, 추정량이 일치한다는 점을 논문은 증명한다.

두 기존 설계의 한계를 극복하고자 저자는 “쌍별 랜덤화(pairwise randomization)”를 제안한다. 이는 시간과 아이템을 동시에 두 차원에서 무작위화하여, 각 기간마다 일정 비율의 품목이 처리, 나머지는 통제에 배정되는 구조이다. 이 설계는 시간적 캐리오버와 용량 간섭을 동시에 분산시켜, 평균 차이가 지배적인 상황에서는 아이템 수준 무작위화보다 편향이 현저히 감소한다. 그러나 분산 차이가 주요 요인일 때는 오히려 편향이 커질 수 있음을 명시한다.

이론적 결과를 뒷받침하기 위해 저자는 Dingdong Fresh의 실제 신선식품 데이터셋을 활용한다. 데이터는 수요가 검열(재고 소진 후 관측 불가)된 특성을 가지고 있으며, 여러 예측 모델(ARIMA, LSTM, 베이지안 네트워크 등)을 학습시켜 평균·분산 차이를 인위적으로 조절한다. 시뮬레이션을 통해 각 실험 설계별 추정값과 실제 GTE 사이의 차이를 측정했으며, 논문에서 제시한 편향 방향과 크기가 실증적으로 확인되었다.

전반적으로 이 논문은 (1) 재고 관리에서 SUTVA 위반이 어떻게 발생하는지, (2) 두 전형적 설계가 각각 어떤 상황에서 편향을 일으키는지, (3) 상황에 맞는 설계 선택 기준을 제시한다는 점에서 학술적·실무적 기여가 크다. 특히, “예측기의 평균 vs. 분산 차이”라는 새로운 분류 기준은 정책 입안자가 실험 설계를 사전에 판단할 수 있는 실용적인 체크리스트를 제공한다.


댓글 및 학술 토론

Loading comments...

의견 남기기