PCA 기반 일일 전력가격 예측으로 재생에너지 통합 가속

본 논문은 캘리포니아 전력시장의 2016‑2021년 시간별 가격·수요 데이터를 활용해, 전통적 IQR 이상치 제거와 새로운 감독형 강건 주성분 분석(RPCA)을 결합한 전처리 방법이 가격 예측 정확도를 크게 향상시킴을 입증한다. 변환된 특징을 이용한 다중선형회귀 모델이 가장 높은 성능을 보였으며, 특히 SAS Sparse Matrix 기반 RPCA가 모델

PCA 기반 일일 전력가격 예측으로 재생에너지 통합 가속

초록

본 논문은 캘리포니아 전력시장의 2016‑2021년 시간별 가격·수요 데이터를 활용해, 전통적 IQR 이상치 제거와 새로운 감독형 강건 주성분 분석(RPCA)을 결합한 전처리 방법이 가격 예측 정확도를 크게 향상시킴을 입증한다. 변환된 특징을 이용한 다중선형회귀 모델이 가장 높은 성능을 보였으며, 특히 SAS Sparse Matrix 기반 RPCA가 모델 개선에 핵심 역할을 한다. 결과는 재생에너지 비중이 높은 시장에서 일일 예측 정확도가 그리드 운영 및 재생에너지 확대에 미치는 긍정적 영향을 강조한다.

상세 요약

이 연구는 전력가격 예측이 전력계통 안정성, 재생에너지 통합, 시장 변동성 관리 등에 필수적이라는 전제 하에, 복합적인 발전 믹스와 이질적(heteroskedastic) 노이즈가 예측 정확도를 저해한다는 문제점을 지적한다. 데이터는 CAISO가 제공한 2016‑2021년의 시간별 LMP(Locational Marginal Price)와 전력수요를 사용했으며, 연도·계절·시간대별 변동성을 분석해 전형적인 비대칭성과 높은 왜도를 확인했다.

첫 단계에서는 전통적인 IQR(Interquartile Range) 방법으로 이상치를 탐지·제거했으며, 이는 데이터의 중앙 집중성을 약간 개선했지만 여전히 긴 꼬리와 비정규성을 완전히 해소하지 못했다. 이를 보완하기 위해 저자들은 ‘감독형 강건 주성분 분석(Robust PCA, RPCA)’을 도입했다. RPCA는 행렬을 저랭크(주성분)와 희소(이상치) 성분으로 분해함으로써, 통계적 이상치뿐 아니라 구조적 이상치까지 효과적으로 식별한다. 특히 SAS의 PROC RPCA를 활용한 Sparse Matrix 구현은 대규모 시간‑시계열 데이터를 메모리 효율적으로 처리하면서도 높은 정밀도의 이상치 판별을 가능하게 했다.

전처리 후, 원시 변수와 PCA 변환 변수 두 그룹을 각각 다중선형회귀(Multiple Linear Regression, MLR) 모델에 투입했다. PCA 단계에서는 누적 설명분산이 95 % 이상이 되도록 8개의 주성분을 선택했으며, 이들 주성분은 원시 변수 간의 다중공선성을 크게 감소시켜 회귀계수의 안정성을 확보했다. 모델 성능 평가는 RMSE, MAE, MAPE 등 3가지 지표를 사용했으며, 전통적 IQR 전처리만 적용한 경우와 RPCA 전처리를 병행한 경우를 비교했다.

실험 결과, RPCA‑후 PCA 변환 특징을 이용한 MLR 모델이 RMSE 기준으로 약 12 % 개선되었고, MAE와 MAPE에서도 각각 10 %·9 % 정도의 향상을 보였다. 특히, 전력가격이 급등·급락하는 피크 구간에서 오류가 크게 감소했으며, 이는 재생에너지(특히 태양광·풍력)의 변동성이 큰 시간대에서 모델이 보다 견고하게 작동함을 의미한다. 또한, RPCA가 식별한 희소 행렬은 실제로 데이터 수집 오류, 통신 지연, 비정상적인 시장 조작 등 물리적·운영상의 이상 현상과 일치함을 사후 검증을 통해 확인했다.

이러한 결과는 두 가지 중요한 시사점을 제공한다. 첫째, 전력시장 데이터는 고차원·비정규적 특성을 갖기에, 단순 통계적 이상치 제거보다 구조적 이상치 탐지가 필수적이다. 둘째, PCA와 같은 차원 축소 기법을 적용하기 전에 강건한 전처리를 수행하면, 회귀 기반 예측 모델의 일반화 능력이 크게 향상된다. 특히, 재생에너지 비중이 급증하고 가격 변동성이 확대되는 현대 전력시스템에서, 일일(DA) 예측 정확도의 미세한 개선도 운영 비용 절감·배전망 안정성 강화에 직결될 수 있다.


📜 논문 원문 (영문)

🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...