시나리오 배치 GPU 커널로 동적계획법을 대규모 확률 조합 최적화에 적용하기

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 시나리오 기반 샘플 평균 근사(SAA)에서 NP‑hard 정수형 2단계 문제를 GPU‑가속 동적계획법(DP) 커널로 동시에 수백만 개 시나리오에 대해 해결함으로써 1~5자리 수의 속도 향상을 달성하고, 이를 차량 라우팅 분할과 재고 재삽입 문제에 적용해 의사결정 품질을 크게 개선한다.

상세 분석

이 연구는 “시나리오‑배치”라는 새로운 패러다임을 제시한다. 전통적인 SAA에서는 첫 단계 결정이 고정되면 각 시나리오에 대한 2단계 정수 최적화가 독립적으로 수행되어 CPU 기반에서는 수천수만 개 시나리오가 한계였다. 저자들은 동적계획법의 벨만 업데이트를 (min,+) 세미링에서 행렬‑벡터 곱 형태로 재구성하고, 이를 GPU의 워프·블록 수준에서 동시에 수행하도록 커널을 설계했다. 핵심은 세 차원의 병렬성을 동시에 활용한다는 점이다. 첫 번째 차원은 시나리오 수(수십만백만)이며, 두 번째 차원은 각 DP 단계에서 가능한 전이(전 단계 상태 → 현재 상태)이며, 세 번째 차원은 전이마다 존재할 수 있는 여러 라우팅 옵션이나 재고 보충 옵션이다.

구현에서는 (min,+) 연산을 텐서 브로드캐스팅과 마스크된 최소화 연산으로 구현하고, 불가능한 전이는 +∞ 로 마스킹한다. 시나리오 × 전이 2D 구조는 CUDA 블록을 시나리오에, 워프를 전이 집합에 매핑해 워프 내 최소화(reduction)를 수행한다. 재고 재삽입 문제처럼 전이마다 여러 후보 라우트가 존재하는 경우에는 3D 구조(시나리오 × 전이 × 옵션)로 확장해 옵션 차원에서도 워프‑레벨 최소화를 먼저 수행한 뒤 전이 차원에서 다시 축소한다.

두 가지 실험 사례—(i) 확률적 차량 라우팅에서의 split operator와 (ii) 주문‑업‑투‑정책 하의 재고 재삽입 DP—에서 제안 방법은 시나리오 수가 10⁶까지 선형적으로 확장되며, CPU 기반 MILP 혹은 기존 DP 구현 대비 10¹~~10⁵ 배의 속도 향상을 보였다. 특히 재고 재삽입에서는 4~~5자리 수의 가속을 기록했으며, 메모리 사용량은 11 GB GPU 기준 10⁶ 시나리오를 충분히 수용할 수 있음을 확인했다.

속도 향상이 직접적인 의사결정 품질 개선으로 이어졌다. 동일 시간 예산 내에서 탐색 가능한 첫 단계 후보 수와 시나리오 샘플 수가 크게 늘어나면서, SAA 해의 목표값이 일관되게 감소하였다. 이는 “더 많은 시나리오 = 더 정확한 기대값 추정”이라는 전통적인 SAA 이론과 완벽히 부합한다. 또한, 제안된 GPU‑DP 프레임워크는 기존의 연속 최적화 가속 기법과 달리 이산 조합 구조를 그대로 유지하면서도 대규모 병렬성을 확보한다는 점에서 학문적·실무적 의미가 크다.

시나리오 배치 GPU 커널로 동적계획법을 대규모 확률 조합 최적화에 적용하기

초록

상세 분석

댓글 및 학술 토론

의견 남기기