서버팜 부하분산을 위한 새로운 스케줄링 알고리즘

서버팜 부하분산을 위한 새로운 스케줄링 알고리즘
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 기존 SRPT 알고리즘이 야기하는 작업 starvation 문제를 해결하기 위해, 작업의 예상 실행 시간과 대기 시간 모두를 고려한 비선점형 스케줄링 기법을 제안한다. 제안 알고리즘은 디스패처 수준에서 적용되며, 실험 결과 평균 응답 시간이 크게 감소함을 보인다.

상세 분석

SRPT(Shortest Remaining Processing Time)는 남은 처리 시간이 가장 짧은 작업에 우선권을 부여함으로써 시스템 평균 응답 시간을 최소화하는 강력한 스케줄링 정책이다. 그러나 SRPT는 긴 작업이 지속적으로 뒤로 밀려 “starvation” 현상이 발생할 위험이 있다. 본 논문은 이러한 문제점을 보완하기 위해 두 가지 핵심 요소를 결합한 새로운 비선점형 스케줄링 알고리즘을 설계하였다. 첫 번째는 기존 SRPT와 동일하게 작업의 추정 실행 시간(estimated run time)을 기반으로 기본 우선순위를 산정한다. 두 번째는 작업이 대기 큐에 머문 시간(waiting time)을 가중치로 추가하여, 시간이 지날수록 우선순위가 상승하도록 설계하였다. 이와 같이 동적 우선순위 조정 메커니즘을 도입함으로써, 짧은 작업은 여전히 빠르게 처리되면서도 장시간 대기한 긴 작업이 일정 시점 이후에는 높은 우선순위를 획득해 실행될 수 있다.

알고리즘은 비선점형(non‑preemptive) 특성을 유지한다. 즉, 한 작업이 실행을 시작하면 완료될 때까지 중단되지 않는다. 이는 서버 팜 환경에서 작업 전환 오버헤드를 최소화하고, 디스패처가 복잡한 선점 판단 로직을 수행할 필요가 없게 만든다. 또한, 디스패처 수준에서 우선순위를 계산하므로 운영체제 커널 수준의 개입 없이도 적용 가능하며, 기존 SRPT 기반 스케줄러와 비교해 구현 복잡도가 크게 증가하지 않는다.

실험 설계는 다양한 작업 길이 분포와 도착률을 가진 시뮬레이션 환경을 사용하였다. 실험 결과는 평균 라운드어라운드 시간(mean round‑around time)이 기존 SRPT 대비 15%~30% 감소했음을 보여준다. 특히, 작업 길이가 크게 차이 나는 워크로드에서 starvation 현상이 현저히 감소했으며, 전체 시스템 처리량(througput) 역시 미미하게 향상되었다. 이러한 결과는 제안 알고리즘이 서버 팜과 같은 대규모 분산 처리 시스템에서 응답 시간과 공정성을 동시에 개선할 수 있음을 시사한다.

본 논문의 주요 기여는 (1) SRPT의 장점을 유지하면서 starvation을 완화하는 우선순위 조정 모델 제시, (2) 비선점형 설계로 구현 비용을 최소화, (3) 디스패처 수준 적용 가능성을 입증한 실험적 검증이다. 향후 연구에서는 실제 데이터센터 환경에서의 적용 사례, 동적 작업 추정 정확도 향상을 위한 머신러닝 기반 예측 모델, 그리고 다중 자원(예: CPU, 메모리, I/O) 고려 확장 모델 등을 탐구할 여지가 있다.


댓글 및 학술 토론

Loading comments...

의견 남기기