다중계층 시스템을 위한 확장 가능한 가변 병렬 작업 스케줄링

다중계층 시스템을 위한 확장 가능한 가변 병렬 작업 스케줄링
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 다중코어·다중프로세서 환경에서 가변(malleable) 병렬 작업을 효율적으로 배치하기 위한 계층적 스케줄링 알고리즘 AC‑DS를 제안한다. AC‑DS는 피드백 기반 적응 스케줄러, 요구량 집계(DESIRE‑SUM) 및 동적 공정자 균등 할당(DEQ) 정책을 결합하여, 계층 깊이에 관계없이 전체 작업 완료 시간(메이크스팬)에 대해 O(1) 경쟁성을 보장한다. 이론적 증명과 실험을 통해 AC‑DS가 기존 전략보다 확장성과 성능 면에서 우수함을 입증한다.

상세 분석

논문은 먼저 멀티코어·멀티프로세서 기반 클라우드·그리드 환경을 트리 형태의 계층 구조로 모델링한다. 각 작업은 말레블(malleable) 특성을 가지며, 실행 중 할당받은 프로세서 수와 실제 병렬도에 따라 실행 속도가 결정된다. 이때 작업 i의 순간 병렬도 h_i(t)와 할당 프로세서 수 a_i(t)로부터 실행률 Γ_i(t)=min{a_i(t),h_i(t)}가 정의된다. 이러한 모델은 기존 고정·유연 작업 모델을 일반화하며, 작업의 전체 작업량 w_i와 스팬 l_i(무한 프로세서 가정 시 실행 시간)도 명시한다.

계층적 스케줄링 문제는 온라인·비예측(non‑clairvoyant) 조건 하에, 루트에서 전체 P개의 프로세서를 하위 노드와 최종 작업까지 분배하면서 메이크스팬을 최소화하는 것이다. 기존 2‑레벨 스케줄링 연구와 달리, 본 논문은 레벨 수 K가 임의일 때도 적용 가능한 프레임워크를 제시한다.

핵심 알고리즘 AC‑DS는 세 가지 구성요소로 이루어진다.

  1. A‑Control (AC) 적응 스케줄러 – 하위 레벨(작업)에서 일정 퀀텀 q마다 작업의 평균 병렬도 A_i(q)=w_i(q)/l_i(q)를 측정하고, 이를 다음 퀀텀의 프로세서 요구량 d_i(q+1)으로 설정한다. 초기 요구량은 1로 시작한다. 이 방식은 퀀텀이 충분히 짧을 경우 현재 병렬도가 미래 요구량을 잘 예측한다는 가정에 기반한다.

  2. Desire‑Sum (DS) 집계 – 중간 노드 n_k_i는 직계 자식들의 요구량을 모두 합산(d_k_i = Σ_j d_{k‑1}_j)하여 상위 노드에 전달한다. 퀀텀 길이는 레벨마다 정수 배 관계를 유지하도록 가정해, 상위 레벨이 오래된 요구량을 무시하고 최신 요구량만 사용한다.

  3. Dynamic Equi‑Partitioning (DEQ) 할당 – 상위 노드가 받은 총 프로세서 a_k_i를 자식들에게 공정하게 배분한다. 먼저 요구량이 현재 평균 할당량보다 작거나 같은 자식들을 만족시킨 뒤, 남은 프로세서를 동일 비율로 재분배한다. 이 과정을 재귀적으로 수행해 모든 자식이 만족되거나 더 이상 할당이 불가능할 때까지 진행한다. 논문은 분석 편의를 위해 프로세서의 분할을 연속형(분수)으로 허용한다.

이 세 구성요소를 결합하면, 각 레벨에서 요구량과 할당량이 일관되게 조정되어 전체 시스템에 걸친 자원 활용 효율이 극대화된다. 논문은 경쟁 분석을 통해 AC‑DS가 최적 오프라인 스케줄러 대비 메이크스팬이 상수 배(c=O(1)) 이내임을 증명한다. 핵심 증명은 (1) 각 작업이 자신의 평균 병렬도에 비례하는 프로세서를 받으면 실행률이 최소 ½ 수준으로 유지된다는 Lemma, (2) DS와 DEQ가 요구량 총합을 초과하지 않으면서도 가능한 한 많은 작업을 만족시키는 것이 보장된다는 Theorem, (3) 트리 깊이에 관계없이 위 두 성질이 재귀적으로 전파되어 전체 메이크스팬이 O(1) 경쟁성을 갖는다는 결론이다.

실험에서는 기존의 Equal‑Partition(EP)와 Fixed‑Quota(FQ) 전략을 비교한다. 작업 워크로드는 새롭게 제안된 말레블 모델을 사용해 다양한 병렬도 변동 패턴(점진적 증가, 급격한 감소, 주기적 변동 등)을 포함한다. 시뮬레이션 결과, AC‑DS는 특히 레벨이 46까지 늘어날 때도 메이크스팬 증가율이 거의 일정하게 유지되며, EP 대비 평균 1530%·최악 경우 50% 이상의 개선을 보였다. 또한, 프로세서 요구량이 과다하거나 부족한 상황에서도 DEQ가 자동으로 과잉 할당을 억제하고 부족을 최소화해, 시스템 전체의 이용률을 85~95% 수준으로 유지한다.

이 논문의 주요 기여는 (1) 계층적·비예측 환경에서도 O(1) 경쟁성을 보장하는 일반적인 프레임워크를 제시한 점, (2) 피드백‑드리븐 적응 스케줄링과 공정 할당 정책을 결합해 확장성을 확보한 점, (3) 실제 시스템 특성을 반영한 말레블 작업 모델을 구축해 다양한 시나리오에서 알고리즘을 검증한 점이다. 향후 연구에서는 이질적인 코어 성능, 네트워크 지연, 동적 레벨 추가·삭제와 같은 현실적인 변수를 모델에 포함시키는 것이 제안된다.


댓글 및 학술 토론

Loading comments...

의견 남기기