연속 선형 수치 변화를 다루는 플래너 COLIN

초록

COLIN은 FF 스타일의 전방 탐색과 선형 계획법(LP)을 결합해 PDDL의 완전한 시간 의미론과 연속 선형 수치 변화를 동시에 처리한다. LP를 이용해 각 상태의 변수 범위를 추정하고, 이를 통해 적용 가능한 행동을 제한한다. 또한 CRIKEY3의 시간적 완화 계획 그래프 히스토리(Temporal Relaxed Planning Graph)를 연속 변화에 맞게 확장했으며, 해 찾은 뒤에는 혼합 정수 계획법(MIP)으로 행동 타임스탬프를 최적화한다. 실험 결과, 연속 수치 효과를 포함한 다양한 벤치마크에서 기존 최첨단 플래너 대비 우수한 확장성을 보였다.

상세 분석

COLIN은 전통적인 FF 기반 전방 탐색에 선형 계획법(LP)을 실시간으로 삽입함으로써, 시간·수치 제약이 얽힌 복합 상태 공간을 효율적으로 탐색한다는 점에서 혁신적이다. 기존 플래너들은 연속적인 수치 변화—예를 들어 연료 소모, 온도 상승 등—를 이산적인 효과로 근사하거나 무시하는 경우가 많았다. COLIN은 이러한 연속 선형 변화를 ‘gradient’ 변수로 명시하고, 행동의 지속 시간에 비례하는 수치 변화식을 직접 LP에 포함한다. 이때 LP는 두 가지 역할을 수행한다. 첫째, 현재 상태에서 모든 변수의 가능한 값 범위를 계산해, 불가능한 행동을 사전에 차단한다(프루닝 효과). 둘째, 행동들의 시작·종료 시점을 변수로 두고, 시간 제약(예: 최소·최대 지속시간, 동시성 제약)과 수치 제약을 동시에 만족하는 해를 검증한다. 이러한 통합 검증은 전통적인 CSP 기반 검증보다 훨씬 강력하며, 특히 ‘duration‑dependent effects’와 ‘duration inequalities’를 동시에 다룰 때 필수적이다. 히스토리(heuristic) 측면에서는 CRIKEY3의 Temporal Relaxed Planning Graph(TRPG)를 연속 효과를 반영하도록 확장했다. 구체적으로, 연속 변화는 그래프의 레이어 간에 연속적인 비용 흐름으로 모델링되며, 이는 목표 달성에 필요한 최소 시간·자원 추정치를 더 정확히 제공한다. 마지막으로, 계획이 발견된 뒤에는 혼합 정수 계획법(MIP)을 이용해 행동들의 정확한 타임스탬프를 최적화한다. 이는 단순히 실행 가능성을 확인하는 수준을 넘어, 전체 플랜의 makespan이나 에너지 소비와 같은 최적화 목표를 달성하도록 한다. 실험에서는 연속 연료 소모가 포함된 로봇 이동, 온도 조절이 필요한 화학 공정, 연속 충전·방전이 있는 전력망 관리 등 다양한 도메인에서 기존 플래너 대비 탐색 속도와 해결 규모가 크게 향상된 것을 확인했다. 이러한 결과는 연속 선형 수치 변화와 복합 시간 제약을 동시에 다루는 실제 응용 분야에 COLIN이 실용적인 솔루션이 될 수 있음을 시사한다.