에너지 효율성 평가 보고서: 다양한 NWP 모델 구성
초록
ESCAPE 프로젝트의 일환으로 Intel E5‑2697v4 프로세서에서 여러 수치예보(NWP) 모델·다워프의 에너지 소비를 측정하였다. BiFFT, Acraneb, ALARO 2.5 km LAM, COSMO‑EULAG 등 네 가지 구성에 대해 에너지 지표와 측정 방법을 제시하고, 실행 시간과 에너지 소비 간의 U자형 관계를 발견했다. 또한 광학 프로세서인 Optalysys와 비교했을 때, 광학 장치는 에너지 면에서는 우수하지만 성능·정밀도에서는 뒤처진다는 결론을 내렸다.
상세 분석
본 보고서는 ESCAPE( Energy‑efficient Scalable Algorithms for Weather Prediction at Exascale) 프로젝트의 목표와 연계하여, 기후·날씨 예보에 필수적인 ‘Weather & Climate dwarfs’를 다양한 하드웨어에서 에너지 효율적으로 실행하기 위한 기초 데이터를 제공한다. 측정 대상은 Intel Xeon E5‑2697v4(코어 18, 2.3 GHz) 기반의 다중 노드 시스템이며, 에너지 측정은 전원 공급 장치(PDU)와 내부 전력 센서를 병행해 1 s 이하의 샘플링 주기로 수행하였다. 주요 지표는 총 소비 전력(와트), 실행 시간(초), 그리고 총 에너지(줄)이며, 시뮬레이션 일수당 에너지(J / sim‑day)와 코어당 에너지 효율(J / core·hour)도 계산하였다.
BiFFT(양방향 푸리에 변환)와 Acraneb(대기 방사선) 다워프는 연산 강도가 높아 코어 수를 늘릴수록 평균 전력은 포화 현상을 보였지만, 실행 시간은 급격히 감소하였다. 이로 인해 전체 에너지는 코어 수가 적을 때와 많을 때 모두 높아지는 ‘U‑shaped’ 곡선을 형성한다. 즉, 최적의 에너지 효율점은 중간 규모(예: 72 ~ 144 코어)에서 관측되었으며, 이는 전력 관리가 비선형적으로 작동함을 시사한다.
ALARO 2.5 km LAM과 COSMO‑EULAG LAM은 물리‑화학적 파라미터화와 고해상도 격자 계산을 포함하고 있어 메모리 대역폭과 통신 비용이 지배적이다. 이들 모델은 코어 수를 늘릴수록 통신 오버헤드가 증가해 전력 효율이 급격히 저하되었으며, 결과적으로 에너지 소비는 코어 수가 적은 경우보다 크게 늘어났다. 특히, COSMO‑EULAG은 MPI‑기반의 강력한 스케일링을 보였지만, 전력 소비는 노드당 평균 210 W 수준으로, 동일한 성능을 내는 BiFFT 대비 약 1.8배 높은 에너지를 요구한다.
Optalysys 광학 프로세서와의 비교에서는, 동일한 BiFFT 작업을 수행했을 때 광학 장치가 약 30 % 적은 에너지를 사용했지만, 실행 시간은 4배 이상 오래 걸렸다. 또한, 광학 연산의 부동소수점 정밀도가 32‑bit 부동소수점 기준에서 평균 1.2 %의 오차를 보였으며, 이는 운영 예보에 필수적인 수치 안정성 기준을 충족하지 못한다는 점에서 실용성이 제한적이다.
이러한 결과는 에너지 효율성을 최적화하려면 단순히 코어 수를 늘리는 것이 아니라, 전력‑성능 곡선을 정밀히 모델링하고, 통신·메모리 병목을 최소화하는 알고리즘 설계가 필요함을 강조한다. 또한, 도메인‑특화 언어(DSL)를 활용해 하드웨어 추상화를 구현하면, 다양한 아키텍처 간 포터블한 최적화를 가능하게 하여, 향후 Exascale 수준의 날씨 예보 시스템 구축에 기여할 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기