OMNeT 기반 RoCEv2 네트워크에서 PFC와 RCM 구현 및 시뮬레이션

초록

본 논문은 데이터센터와 슈퍼컴퓨터에서 발생하는 혼잡을 완화하기 위해, OMNeT 시뮬레이터에 IEEE 802.1Qbb 기반의 Priority‑based Flow Control(PFC)과 RoCEv2 Congestion Management(RCM)를 구현한 방법을 제시한다. 구현된 모델을 통해 복잡한 토폴로지와 트래픽 패턴에서 혼잡 지점을 식별하고, 최적의 제어 파라미터를 탐색할 수 있음을 보인다.

상세 분석

현대 데이터센터와 TOP500 슈퍼컴퓨터는 수천 대의 서버가 고속 RDMA(RoCEv2) 인터커넥트를 통해 연결되며, 트래픽 패턴이 비정형적이고 토폴로지가 복잡해짐에 따라 네트워크 혼잡이 빈번히 발생한다. 혼잡이 발생하면 패킷 손실·재전송·지연이 급증해 전체 애플리케이션 성능이 크게 저하된다. 실제 운영 환경에서는 혼잡 제어 메커니즘을 바로 적용하기 어렵다. 설정이 부적절하면 작업이 비정상 종료되거나 성능이 역효과를 낼 위험이 있기 때문이다. 따라서 사전 시뮬레이션을 통해 혼잡 발생 지점을 정확히 파악하고, PFC와 RCM 같은 제어 기법의 파라미터를 최적화하는 것이 필수적이다.

논문은 OMNeT++를 선택한 이유를 두 가지로 설명한다. 첫째, 모듈형 구조와 풍부한 네트워크 프로토콜 라이브러리를 제공해 IEEE 802.1Qbb와 RoCEv2 스택을 손쉽게 확장할 수 있다. 둘째, 이벤트 기반 시뮬레이션으로 대규모 클러스터 환경을 현실적인 시간 스케일로 재현할 수 있다. 구현 단계에서는 먼저 IEEE 802.1Qbb 표준을 기반으로 PFC 모듈을 설계하였다. 각 가상 채널(Virtual Lane, VL)에 대해 흐름 제어 임계값을 설정하고, 임계값 초과 시 PAUSE 프레임을 전송해 송신 측을 일시 정지한다. 이때 프레임 전송 지연, PAUSE 타이머 정확도, 그리고 다중 VL 간 상호작용을 고려해 시뮬레이션 정확도를 높였다.

다음으로 RoCEv2 Congestion Management(RCM)를 구현하였다. RCM은 네트워크 장비가 혼잡을 감지하면 ECN(Explicit Congestion Notification) 비트를 설정하고, 수신 측에서 이를 기반으로 Congestion Notification Packet(CNP)를 송신해 송신 측이 전송 윈도우를 감소시키는 메커니즘이다. 논문은 혼잡 감지 로직을 두 단계(버퍼 사용률 기반, 포트 큐 깊이 기반)로 구현하고, ECN 마스킹 및 CNP 전송 타이밍을 정확히 모델링했다. 또한, RCM과 PFC가 동시에 동작할 때 발생할 수 있는 “PAUSE‑CNP 경쟁” 현상을 분석하고, 이를 완화하기 위한 파라미터 조정 방안을 제시한다.

시뮬레이션 환경은 Fat‑Tree와 Dragonfly 두 가지 대표적인 데이터센터 토폴로지를 사용했으며, 인피니밴드와 100 GbE 수준의 링크 대역폭을 가정하였다. 트래픽은 파라메트릭한 인코밍/아웃고잉 흐름과 실세계 HPC 워크로드(예: LINPACK, HPCG)를 재현했다. 실험 결과, PFC만 적용했을 때는 특정 VL에서 심각한 헤드‑오브‑라인(Head‑of‑Line) 블로킹이 발생해 전체 지연이 2배 이상 증가했지만, RCM을 함께 적용하면 혼잡 신호가 빠르게 전파되어 전송 윈도우가 적절히 축소되고, 평균 지연이 30 % 이상 감소하였다. 또한, 파라미터 스윕을 통해 최적의 PAUSE 타이머와 ECN 임계값을 도출함으로써, 동일한 네트워크에서 최대 15 %의 스루풋 향상을 달성했다.

핵심 기여는 다음과 같다. 첫째, OMNeT++ 기반의 PFC·RCM 통합 모델을 공개함으로써 연구자와 엔지니어가 손쉽게 재현·확장할 수 있게 했다. 둘째, PFC와 RCM의 상호작용을 정량적으로 분석하고, 실제 클러스터 운영에 적용 가능한 파라미터 튜닝 가이드를 제공했다. 셋째, 복잡한 토폴로지와 실제 워크로드를 사용한 광범위한 평가를 통해 제안된 시뮬레이션 프레임워크의 실용성을 입증했다. 향후 연구에서는 동적 트래픽 예측 기반의 적응형 PFC·RCM 스키마와, 머신러닝을 활용한 자동 파라미터 최적화 기법을 탐색할 계획이다.