랜드마크 기반 비용 민감형 언제든지 플래너 LAMA

랜드마크 기반 비용 민감형 언제든지 플래너 LAMA

초록

LAMA는 Fast Downward 위에 구축된 히스토리 기반 플래너로, 랜드마크 히ュー리스틱과 비용 민감형 FF 히ュー리스틱을 다중 휴리스틱 탐색에 결합한다. 가중치가 점차 감소하는 Weighted A*를 반복 실행해 고품질 해를 지속적으로 탐색하며, 2008 IPC 순차 만족 트랙에서 최고의 성능을 기록했다. 실험 결과 랜드마크 사용이 성능을 크게 향상시키지만, 행동 비용을 히ュー리스틱에 반영하는 것이 오히려 성능을 저하시킬 수 있음을 보여준다.

상세 분석

LAMA의 핵심 설계는 세 가지 축으로 요약할 수 있다. 첫째, 랜드마크 히ュー리스틱은 문제 정의에 필수적인 중간 목표(랜드마크)를 추출하고, 현재 상태에서 아직 달성되지 않은 랜드마크의 최소 비용 합을 하향식 추정값으로 제공한다. 이 과정에서 랜드마크 간 전후 관계를 그래프 형태로 모델링해, 순서 제약을 보존하면서도 계산 비용을 최소화한다. 둘째, 비용 민감형 FF 히ュー리스틱은 전통적인 FF 히ュー리스틱을 확장해 행동 비용을 고려한다. 목표까지의 relaxed plan을 구성할 때, 각 행동의 실제 비용을 가중치로 사용해 비용 기반 추정값을 얻는다. 셋째, **Iterated Weighted A***는 초기에는 큰 가중치(예: 5)를 적용해 탐색을 빠르게 진행하고, 이후 가중치를 점진적으로 감소시켜 최적에 가까운 해를 찾아낸다. 이때 두 히ュー리스틱을 다중 히ュー리스틱 방식으로 동시에 활용한다. LAMA는 각 노드에 대해 두 추정값을 별도로 계산하고, 비용이 낮은 히ュー리스틱을 우선적으로 선택해 열린 리스트를 정렬한다.

실험에서는 20여 개 도메인에 대해 개별적인 성능 분석을 수행했으며, 특히 랜드마크가 탐색 공간을 크게 축소시켜 성공률을 높인 반면, 행동 비용 통합은 일부 도메인에서 오히려 탐색을 방해했다. 이는 비용 민감형 히ュー리스틱이 비용이 높은 행동을 회피하려다 보니, 비용이 균일하지 않은 도메인에서 탐색 경로가 비효율적으로 제한되는 현상으로 해석된다. 또한, Weighted A*의 가중치 감소 스케줄이 적절히 설계되지 않으면 초기 해의 품질이 낮아 전체 실행 시간이 늘어날 위험이 있다.

LAMA의 설계 교훈은 다음과 같다. (1) 랜드마크는 문제 구조를 파악하고 탐색을 가이드하는 강력한 도구이며, 특히 목표 간 의존성이 높은 도메인에서 효과적이다. (2) 비용을 히ュー리스틱에 직접 반영하는 접근은 현재 구현 방식에서는 제한적이며, 비용 정보를 활용하는 더 정교한 방법(예: 비용 기반 플래닝 그래프, 비용-가중 랜드마크) 개발이 필요하다. (3) **Iterated Weighted A***는 초기 탐색 속도와 최종 해 품질 사이의 균형을 조절하는 핵심 메커니즘으로, 가중치 감소 정책을 도메인 특성에 맞게 튜닝하면 시너지 효과를 기대할 수 있다.

전반적으로 LAMA는 다중 히ュー리스틱과 가중치 조정 전략을 결합해 비용 민감형 플래닝에서 새로운 기준을 제시했으며, 향후 연구는 비용 정보를 보다 효율적으로 활용하면서도 랜드마크의 구조적 이점을 유지하는 방향으로 진행될 필요가 있다.