하이퍼파라미터 최적화 알고리즘의 단기 전력 부하 예측 효능 비교
초록
본 연구는 파나마 전력 수요 데이터(48,049건)를 활용해 XGBoost 기반 단기 부하 예측 모델에 대해 다섯 가지 하이퍼파라미터 최적화(HPO) 알고리즘(Random Search, CMA‑ES, Bayesian Optimization, PSO, NGOpt)의 정확도(MAPE, R²)와 실행 시간을 비교한다. 샘플 크기를 1,000~20,000까지 변화시키며 성능을 시각화하고, Kruskal‑Wallis 검정을 통해 통계적 차이를 검증한다. 결과는 Random Search가 가장 느리며, Bayesian Optimization이 단변량 상황에서 정확도가 가장 낮았음을 보여준다.
상세 분석
이 논문은 단기 부하 예측(STLF)이라는 실용적 문제에 초점을 맞추어, 하이퍼파라미터 최적화가 모델 성능에 미치는 영향을 정량적으로 평가한다. 데이터는 2015‑2020년 파나마 전국 전력 수요와 기상·휴일·학일 등 부가 변수를 포함한 시계열이며, 결측치 없이 전처리 후 Min‑Max 정규화를 적용하였다. XGBoost를 서브시스템으로 선택한 이유는 높은 예측 정확도와 비교적 짧은 학습 시간으로, HPO 알고리즘 간 실행 시간 차이를 명확히 드러낼 수 있기 때문이다.
다섯 가지 HPO 알고리즘은 각각 탐색 전략이 다르다. Random Search는 무작위 샘플링으로 베이스라인을 제공하고, CMA‑ES는 진화적 접근으로 공분산 행렬을 적응시켜 탐색 효율을 높인다. Bayesian Optimization은 가우시안 프로세스를 이용해 탐색‑활용 균형을 조절하지만, 단변량 모델에서는 과적합이나 탐색 공간의 비선형성 때문에 정확도가 저하되는 경향을 보였다. PSO는 입자 군집의 사회적 행동을 모방해 전역 탐색 능력을 갖추었으며, NGOpt은 Nevergrad 라이브러리 내 메타‑알고리즘으로, 문제 특성에 따라 최적의 서브알고리즘을 자동 선택한다는 장점이 있다.
실험은 Google Colab Pro+ 환경(A100 GPU)에서 50번의 반복 평가를 수행했으며, 조기 종료(Early Stopping)와 5‑fold 교차 검증을 적절히 결합해 과적합을 방지하였다. 최적화 목표는 RMSE 최소화였으며, 최종 성능 평가는 MAPE, R², 그리고 전체 탐색 시간으로 정의했다. 성능 지표는 0‑1 정규화 후 1,000~20,000 샘플 크기 구간별로 플롯화했으며, Kruskal‑Wallis 검정과 Bonferroni 보정된 사후 검정을 통해 알고리즘 간 차이를 통계적으로 검증했다.
주요 결과는 다음과 같다. (1) 모든 지능형 HPO 알고리즘이 Random Search 대비 실행 시간이 현저히 짧았다. 특히 Bayesian과 NGOpt은 평균 실행 시간이 약 30‑40% 감소하였다. (2) 단변량 상황에서 Bayesian Optimization은 다른 알고리즘에 비해 MAPE와 R² 모두 낮은 성능을 보였으며, 이는 탐색 공간이 제한적일 때 모델이 복잡한 가우시안 프로세스 추정에 과도하게 의존하기 때문으로 해석된다. (3) 다변량 모델에서는 샘플 크기가 증가함에 따라 모든 HPO 알고리즘이 MAPE를 지속적으로 감소시켰고, 정확도 차이는 통계적으로 유의미하지 않게 되었다. 이는 추가적인 외생 변수(기상·휴일 등)가 Bayesian Optimization의 탐색 효율을 보완했음을 시사한다. (4) CMA‑ES는 PSO보다 실행 시간이 길었으며, Random Search는 가장 오래 걸렸다.
제한점으로는 실험이 단일 데이터셋(파나마)과 단일 베이스 모델(XGBoost)에 국한됐으며, GPU 환경에 최적화된 구현이 다른 하드웨어에서 동일한 결과를 보장하지 않을 수 있다. 또한, 하이퍼파라미터 탐색 범위와 초기 설정이 알고리즘 성능에 미치는 영향을 충분히 분석하지 않았다. 향후 연구는 다양한 전력 시장 데이터, 다른 머신러닝/딥러닝 모델(LSTM, Transformer 등), 그리고 멀티‑목표 최적화(정확도와 비용 동시 고려)를 포함해 HPO 알고리즘의 일반화 가능성을 검증할 필요가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기