제한된 최적 충격 제어와 재고 모델의 새로운 접근
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.
초록
**
본 논문은 무한 시간 horizon와 할인 비용을 갖는 결정론적 충격 제어 문제에 기능적 제약을 추가하고, 이를 마코프 결정 과정(MDP)으로 재구성한다. 점유 측도(occupation measure)를 이용한 원시(convex) 및 선형 프로그램을 제시하고, 그에 대한 쌍대 프로그램의 존재와 해석 가능성을 조사한다. 마지막으로 재고 관리 예시를 통해 제약 최적 전략이 ‘주문 전 대기’ 현상을 보임을 확인한다.
**
상세 분석
**
본 연구는 기존 충격 제어 문헌에서 다루어지지 않았던 세 가지 요소를 동시에 고려한다. 첫째, 상태공간을 일반적인 Borel 공간으로 확장함으로써 연속·이산 상태 모두를 포괄한다. 둘째, 할인된 총비용을 목적함수로 채택하면서도 여러 개의 기능적 제약(예: 재고 수준, 주문 빈도 등)을 동시에 부과한다. 셋째, 이러한 제약을 포함한 문제를 마코프 결정 과정(MDP)으로 변환하고, 점유 측도라는 무한 차원 확률 측도의 관점에서 원시(convex) 및 선형 프로그램을 구성한다.
MDP의 상태공간은 원래의 상태 X에 비용이 없는 흡수점 Δ를 추가한 XΔ 로 정의하고, 행동공간은 대기시간 θ와 충격 a 로 이루어진 B=
댓글 및 학술 토론
Loading comments...
의견 남기기