전력 제한이 인텔 KNL·KNM에서 MapReduce 미니앱 성능에 미치는 영향
초록
본 연구는 인텔 Xeon Phi KNL과 Knights Mill(KNM) 아키텍처에서 MapReduce 기반 데이터 집약형 미니앱을 실행할 때 전력 제한(power capping)이 성능과 에너지 소비에 미치는 영향을 정량적으로 분석한다. PAPI ‘powercap’ 모듈을 이용해 데이터셋의 고유 단어 수, 시스템 종류, 그리고 Combiner 사용 여부라는 세 가지 변수에 따라 실행 조건을 최적화하고, 데이터 이동이 에너지와 실행 시간에 큰 비용을 초래함을 확인하였다.
상세 분석
본 논문은 현대 HPC 환경에서 데이터 이동이 차지하는 비중이 급증함에 따라, 전력 제한이 실제 애플리케이션 성능에 어떤 영향을 미치는지를 실증적으로 조사한다. 연구 대상은 MapReduce 프로그래밍 모델의 핵심 연산인 WordCount를 축소한 미니앱이다. 이 미니앱은 Map 단계에서 입력 텍스트를 토큰화하고, Reduce 단계에서 동일 키(단어)의 출현 빈도를 집계한다. 여기서 Combiner 최적화는 Map 단계에서 로컬 집계를 수행해 Shuffle 단계에서 전송되는 데이터 양을 크게 감소시킨다.
실험 플랫폼은 두 종류의 인텔 가속기 아키텍처이다. 첫 번째는 64코어, 1.3 TB/s 대역폭을 제공하는 MCDRAM을 탑재한 Xeon Phi KNL이며, 두 번째는 72코어와 2.0 TB/s 대역폭을 갖춘 Knights Mill(KNM)이다. 두 시스템 모두 고성능 메모리와 다중 스레드 실행 환경을 제공하지만, 전력 관리 메커니즘과 메모리 서브시스템 구조가 다르다. 연구팀은 PAPI의 ‘powercap’ 컴포넌트를 활용해 전력 제한값을 120 W, 150 W, 180 W 등 여러 단계로 설정하고, 각 단계에서 실행 시간, 평균 전력, 에너지 소비(전력 × 시간)를 측정하였다.
데이터셋은 고유 단어 수가 10⁴, 10⁵, 10⁶인 세 가지 규모로 구성했으며, 동일한 총 토큰 수를 유지해 데이터 이동량만을 조절했다. 실험 결과, 고유 단어 수가 많을수록 Shuffle 단계에서 전송되는 레코드 수가 급증해 메모리 대역폭과 네트워크 인터페이스에 큰 부하가 걸렸다. 전력 제한을 낮게 설정하면 CPU 코어가 전력 제한에 도달해 클럭 속도가 감소하고, 이로 인해 메모리 대역폭 활용 효율이 떨어져 전체 실행 시간이 크게 늘어났다. 특히 KNL에서는 MCDRAM을 활용한 고대역폭 접근이 전력 제한에 민감하게 반응해, 120 W 이하에서는 메모리 대역폭이 30 % 이상 감소하는 현상이 관찰되었다. 반면 KNM은 보다 넓은 전력 허용 범위와 고성능 코어 설계 덕분에 동일 전력 제한에서도 상대적으로 안정적인 성능을 유지했다.
Combiner 최적화를 적용한 경우, Shuffle 단계에서 전송되는 데이터 양이 평균 65 % 감소했으며, 이는 전력 제한 하에서도 전력 소모와 실행 시간을 현저히 낮추는 결과로 이어졌다. 특히 전력 제한이 150 W 이하인 상황에서 Combiner를 사용하지 않은 경우와 비교했을 때, 에너지 효율이 1.8배 이상 향상되었다. 이러한 결과는 데이터 이동 자체가 에너지 비용의 주된 원인임을 재차 확인시켜 주며, 전력 제한 정책을 설계할 때 데이터 이동 최소화 전략이 필수적임을 시사한다.
요약하면, 전력 제한은 코어 클럭과 메모리 대역폭 활용에 직접적인 영향을 미치며, 데이터 이동이 많은 MapReduce 워크로드에서는 전력 제한이 성능 저하를 가속화한다. Combiner와 같은 로컬 집계 기법은 전력 제한 환경에서도 데이터 이동을 억제해 에너지 효율을 크게 개선한다. 또한, KNL과 KNM 사이의 아키텍처 차이는 전력 제한에 대한 민감도 차이를 만들며, 시스템별 최적 전력 정책을 수립할 필요가 있음을 보여준다.
댓글 및 학술 토론
Loading comments...
의견 남기기