단순하고 확장 가능한 병렬 최우선 탐색 전략 평가
초록
본 논문은 해시 기반 분산 방식을 이용한 병렬 A* 구현인 HDA를 소개하고, 8코어 멀티코어 머신부터 2400프로세서 규모의 클러스터까지 다양한 환경에서의 확장성을 실험적으로 평가한다. 또한, 동일한 해시 기반 IDA 구현인 TDS와 비교하여 계획 문제에서 HDA*가 월등히 높은 성능을 보임을 입증하고, 두 알고리즘의 장점을 결합한 하이브리드 방식을 제안한다.
상세 분석
HDA*는 탐색 상태를 해시 함수에 의해 결정된 프로세서에 비동기적으로 할당함으로써 작업 스케줄링과 메모리 분산을 동시에 수행한다. 이 설계는 전통적인 마스터‑워커 구조에서 발생하는 병목을 제거하고, 각 프로세서가 독립적으로 오픈 리스트와 클로즈드 리스트를 관리하도록 함으로써 높은 동시성을 확보한다. 해시 함수의 균등성은 워크로드 균형을 보장하는 핵심 요소이며, 논문에서는 상태 특성에 따라 여러 해시 함수를 실험적으로 비교하여 최적의 분산 효과를 얻었다.
실험 환경은 크게 세 단계로 나뉜다. 첫 번째는 8코어 공유 메모리 머신으로, 여기서 HDA는 순차 A와 거의 동일한 탐색 순서를 유지하면서도 오버헤드가 최소화된다는 것을 확인했다. 두 번째는 64코어까지 확장 가능한 commodity 클러스터이며, 코어 수가 증가함에 따라 탐색 시간은 거의 선형적으로 감소하고, 메모리 사용량은 분산 효과 덕분에 개별 노드당 수십 기가바이트 수준으로 유지된다. 세 번째는 2400프로세서 규모의 고성능 클러스터로, 테라바이트 수준의 RAM을 요구하는 문제도 성공적으로 해결하였다. 특히, 메모리 요구량이 큰 플래너 문제에서 HDA*는 기존 단일 머신 한계(수백 기가바이트)를 훨씬 초과하는 규모를 처리할 수 있었다.
TDS와의 비교에서는 두 알고리즘 모두 해시 기반이지만, TDS는 IDA의 깊이 제한과 재귀 호출 구조 때문에 비동기 통신 비용이 상대적으로 높고, 탐색 순서가 비최적화될 위험이 있다. 실험 결과, 동일한 플래너 도메인에서 HDA는 평균 3배 이상 빠른 해결 시간을 보였으며, 특히 해시 충돌이 적은 도메인에서 그 차이가 두드러졌다.
하이브리드 접근법은 초기 단계에서 HDA*의 빠른 전파와 메모리 분산을 이용하고, 탐색 깊이가 일정 수준에 도달하면 TDS로 전환하여 깊이 제한 탐색의 장점을 살린다. 이 방식은 두 알고리즘의 장점을 조화시켜, 특정 문제에서 추가적인 10~15% 성능 향상을 달성했다.
전체적으로 논문은 해시 기반 작업 분산이 병렬 최우선 탐색에 있어 가장 실용적이고 확장 가능한 전략임을 증명한다. 다만, 해시 함수 설계와 충돌 관리, 네트워크 지연에 대한 민감도가 존재하므로, 향후 연구에서는 동적 해시 재조정 및 압축 전송 기법을 탐색할 필요가 있다.