다양한 목표를 위한 데이터센터 네트워크 시장 메커니즘
초록
DMart는 각 애플리케이션이 자신의 성능 목표와 긴급성을 토큰 형태의 입찰로 표현하도록 하여, 스위치‑레벨의 초당 경매를 통해 대역폭을 할당한다. 분산형 설계와 2차 가격 경매 방식을 사용해 기존 단일 목표 스케줄러(pFabric, Sincronia)와 비교했을 때 마감 기한 위반을 2배, 코플로우 완료 시간을 1.6배 개선하면서 짧은 흐름의 지연도 거의 유지한다.
상세 분석
DMart는 데이터센터 네트워크가 현재 “단일 목표 독재”에 빠져 있다는 문제점을 근본적으로 재구성한다. 기존의 공정성, SRPT, EDF 등은 각각 특정 메트릭에 최적화돼 있지만, 서로 다른 목표를 가진 흐름이 동시에 경쟁할 경우 전체 SLO 만족도가 급격히 떨어진다. DMart는 이러한 이질성을 ‘시장’이라는 추상화 레이어로 매핑한다. 각 흐름은 자신의 목표(예: 평균 흐름 완료 시간 최소화, 마감 기한 만족도 최대화, 공정성, 코플로우 완료 시간 최소화)를 반영한 입찰 전략을 구현하고, 스위치가 매 RTT마다 로컬 2차 가격 경매를 수행한다.
핵심 설계 포인트는 다음과 같다. 첫째, 경매는 스위치‑레벨에서 독립적으로 진행되어 전역 컨트롤러 없이도 수백만 건의 경매를 초당 처리할 수 있다. 둘째, 흐름은 동일한 입찰을 경로상의 모든 링크에 전파하므로, 경로 전체가 승리해야만 해당 RTT 동안 전송이 허용된다. 이는 “전송 권한”을 토큰 형태로 부여하는 메커니즘이며, 실제 전송 속도 제어는 엔드호스트가 담당한다. 셋째, 2차 가격 방식을 채택함으로써 입찰자는 자신의 실제 가치보다 높은 가격을 지불하지 않으며, 과도한 전략적 입찰을 억제한다. 넷째, DMart는 입찰 전략에 최소한의 제한을 두어 수렴성을 보장한다. 예를 들어, 입찰은 비음수이며, 예산(엔타이틀먼트)과 현재 RTT 입찰(긴급성) 사이에 명확한 관계를 유지해야 한다. 이러한 제약은 입찰자 간의 무한 진동을 방지하고, 전체 시스템이 안정적으로 수렴하도록 만든다.
논문은 네 가지 대표 목표에 대한 입찰 알고리즘을 제시한다. (i) 평균 흐름 완료 시간 최소화는 SRPT와 유사한 동적 입찰을 사용해 남은 데이터량 대비 남은 RTT를 고려한다. (ii) 마감 기한 만족도는 남은 시간과 남은 데이터량을 곱한 형태의 비용 함수를 기반으로 입찰을 조정한다. (iii) 공정성은 예산을 사전에 할당하고, 현재 입찰은 남은 예산 비율에 비례하도록 설계한다. (iv) 코플로우 최적화는 코플로우 전체에 대한 중앙화된 조정자를 두어 코플로우 내 흐름들의 입찰을 조정하고, 전체 코플로우가 최소한의 RTT 동안 연속적으로 승리하도록 만든다.
시뮬레이션 결과는 DMart가 기존 전용 스케줄러와 동일하거나 더 나은 성능을 보이며, 특히 다중 목표 혼합 워크로드에서 뛰어난 균형을 제공함을 입증한다. 마감 기한 위반률은 2배 감소하고, 코플로우 평균 완료 시간은 1.6배 개선되었으며, 짧은 흐름의 평균 완료 시간은 pFabric 대비 5% 이내의 차이만을 보였다. 또한, 토큰 기반 입찰은 실제 화폐가 아니라 가상의 크레딧으로 구현 가능하므로 운영 비용이나 보안 문제도 최소화한다.
전반적으로 DMart는 “목표 간 호환성 격차”를 시장 메커니즘으로 메우는 혁신적인 접근법이며, 향후 새로운 워크로드가 등장하더라도 입찰 전략만 추가하면 기존 인프라를 그대로 활용할 수 있다는 미래‑프루프성을 제공한다.
댓글 및 학술 토론
Loading comments...
의견 남기기