동적 작업 그래프 스케줄링에서 제한적 선점 전략의 효과 분석
초록
본 논문은 동적으로 도착하는 작업 그래프들을 스케줄링할 때, 전체를 재배치하는 전면 선점 방식과 기존 할당을 고정하는 비선점 방식을 비교한다. 저자들은 최근 K개의 그래프만을 선택적으로 재배치하는 “Last‑K 선점” 모델을 제안하고, 합성 워크로드, RIoTBench, WFCommons, 그리고 악의적 인스턴스를 이용해 makespan, 공정성, 자원 활용도, 스케줄러 런타임을 평가한다. 실험 결과, 적당한 K값을 사용한 부분 선점이 전체 선점과 거의 동등한 성능을 보이면서도 공정성 손실과 오버헤드를 크게 줄임을 확인한다.
상세 분석
이 연구는 동적 환경에서 작업 그래프가 연속적으로 도착하는 상황을 수학적으로 모델링하고, 기존의 두 극단적 스케줄링 패러다임—전면 선점(preemptive)과 비선점(non‑preemptive)—의 한계를 명확히 규명한다. 전면 선점은 모든 대기 중인 작업을 재배치함으로써 전체 makespan을 최소화할 수 있지만, 이미 실행 중인 작은 작업들을 지속적으로 미루어 공정성(fairness) 문제가 발생한다. 반면 비선점은 기존 할당을 고정해 오버헤드를 최소화하지만, 큰 루트 작업이 작은 후속 작업에 의해 차단되는 경우 전체 실행 시간이 급격히 늘어나는 병목 현상이 나타난다. 저자들은 이러한 트레이드오프를 완화하기 위해 “Last‑K 선점”이라는 중간 전략을 도입한다. 구체적으로, 새로운 그래프가 도착하면 가장 최근에 도착한 K개의 그래프만을 대상으로 재배치를 수행하고, 그 이전 그래프는 기존 할당을 유지한다. 이 접근법은 선점 범위를 제한함으로써 스케줄링 복잡도와 재배치 비용을 크게 낮추면서도, 최신 작업에 대한 적응성을 확보한다.
실험 설계는 네 가지 워크로드 유형을 포함한다. (1) 합성 그래프는 트리, 포크‑조인, 체인 등 네 가지 토폴로지를 균등히 섞어 다양한 의존 관계와 작업/통신 비용을 시뮬레이션한다. (2) RIoTBench은 실제 IoT 파이프라인(ETL, Predict 등)을 재현해 이질적인 연산과 데이터 흐름을 제공한다. (3) WFCommons는 과학 워크플로우(Genome, Blast 등)로 복잡한 크리티컬 패스와 높은 통신 비중을 특징으로 한다. (4) 악의적 인스턴스는 대용량 루트와 다수의 얕은 후속 작업으로 구성된 아웃‑트리 형태이며, 통신‑연산 비율을 낮춰 스케줄러가 후속 작업을 과도하게 분산시키는 상황을 유도한다.
평가 지표는 총 makespan, 평균 makespan(그래프 별 평균 완료 시간), 평균 flowtime(그래프 내부 작업 간 시간 간격), 노드 활용도, 스케줄러 런타임 다섯 가지를 사용한다. 결과는 다음과 같다. 전면 선점(P‑HEFT, P‑CPOP 등)은 대부분의 경우 가장 짧은 총 makespan을 달성했지만, 평균 flowtime이 크게 증가해 작은 작업이 지속적으로 지연되는 현상이 관찰되었다. 비선점(NP‑HEFT, NP‑CPOP 등)은 평균 flowtime은 낮지만, 특히 악의적 인스턴스에서 총 makespan이 1.6배까지 늘어나는 심각한 병목을 보였다. 부분 선점(예: 5P‑HEFT, 10P‑CPOP 등)은 K값을 늘릴수록 전면 선점에 근접한 makespan을 얻으면서도 평균 flowtime과 공정성 지표는 비선점 수준에 가깝게 유지되었다. 특히 K=5~10 정도가 대부분의 워크로드에서 최적의 균형을 제공했으며, 스케줄러 런타임도 비선점에 비해 크게 증가하지 않아 실시간 적용 가능성을 시사한다.
또한, 노드 활용도 측면에서 전면 선점이 약간 앞섰지만, 이미 높은 활용도(>85%)를 보이는 환경에서는 차이가 미미했다. 이는 자원 포화 상태에서는 선점이 가져오는 추가 이득이 제한적임을 의미한다. 전체적으로, 논문은 “선점 범위 제한 = 성능·공정성·오버헤드 삼위일체 최적화”라는 새로운 설계 원칙을 제시하고, 실제 시스템 설계 시 K값을 동적으로 조정하는 적응형 메커니즘의 필요성을 강조한다.
댓글 및 학술 토론
Loading comments...
의견 남기기