전력수요와가격 일일곡선 부트스트랩 예측구역

본 논문은 스페인 본토 전력시장의 2012년 일일 전력수요와 가격 곡선을 대상으로, 함수형 회귀모형에 기반한 1일 앞선 예측구역을 구축한다. 부트스트랩을 활용한 세 가지 방법(Lₚ 노름, 가변분산 가중치, 함수형 깊이)으로 일반적인 함수형 데이터에 적용 가능한 예측구역을 제시하고, 실험을 통해 각 방법의 정확도와 구역 넓이를 비교한다.

저자: Rebeca Peláez, Germán Aneiros, Juan Vilar

전력수요와가격 일일곡선 부트스트랩 예측구역
본 연구는 전력수요와 가격을 함수형 데이터로 취급하여, 1일 앞선 전체 곡선에 대한 예측구역을 구축하고자 한다. 서론에서는 전력시장의 특성(전력은 저장이 어려워 정확한 수요·가격 예측이 필수)과 기존 연구들을 검토한다. 기존 문헌은 대부분 스칼라 변수에 초점을 맞추었으며, 함수형 회귀모형을 이용한 곡선 예측은 제한적이었다. 특히 Aneiros et al. (2016)에서는 함수형 응답을 도입했지만, 예측구역이 아닌 점예측에 머물렀다. 본 논문은 이러한 격차를 메우기 위해, 일반적인 함수형 회귀모형 ζ_i = r(ζ_{i‑1},x_i,ξ_i)+ε_i 를 설정한다. 여기서 ζ_i 는 하루 전체 24시간을 연속적으로 관측한 전력수요·가격 곡선, x_i 는 온도·풍력 등 스칼라 외생변수, ξ_i 는 전일 가격·수요와 같은 함수형 외생변수이다. r(·)는 비선형 연산자로, 파라메트릭·비파라메트릭·반파라메트릭 형태를 모두 포괄한다. 예측구역을 만들기 위해 부트스트랩 재표본화 알고리즘(BR)을 제안한다. 먼저 기존 데이터에 대해 비모수적 커널 추정 b_r_h(·) 로 ζ_i 를 예측하고, 잔차를 중심화한다. 이후 잔차의 경험분포에서 무작위로 재추출해 부트스트랩 샘플 ζ_i^* 를 생성한다. 이 과정을 B번 반복해 부트스트랩 예측값 b_r_h^*(χ_{N+1}) 와 부트스트랩 오차를 얻는다. 세 가지 구역 구성 방법은 다음과 같다. 1. **Lₚ 방법**: 함수 공간에 Lₚ 노름을 적용, 부트스트랩 오차 ‖ζ_{N+1}^* – b_r_h^*(χ_{N+1})‖_p 의 1‑α 분위수를 구해, 중심 추정값 주위 반경 ρ*_α 로 원형 구역을 만든다. 이는 가장 직관적이며, 노름 선택(p=2,∞ 등)에 따라 구역 형태를 조절할 수 있다. 2. **가변분산 방법**: 곡선 전역에서 분산이 시점별로 다를 수 있음을 반영해, 각 시점 t 에 대한 표준편차 σ̂(t) 로 정규화한 후 L_∞ 노름을 적용한다. 결과적으로 구역은 시점별 폭이 가변적인 “밴드” 형태가 되며, 피크 구간에서 넓게, 평탄 구간에서 좁게 설계된다. 이는 전력시장에서 피크 부하에 대한 위험 관리에 유리하다. 3. **깊이 기반 방법**: 함수형 데이터의 중심성을 측정하는 band depth 혹은 modified band depth 를 이용한다. 부트스트랩 샘플들을 깊이 순위별로 정렬하고, 상위 (1‑α) 비율에 해당하는 곡선들의 envelope 를 구역으로 정의한다. 이 방법은 비대칭 구역을 제공하며, 데이터의 비정규성이나 이상치에 강인한 특성을 가진다. 각 방법의 구현 세부사항으로는 커널 종류(가우시안, 에피네프리시스 등), 대역폭 h 선택(교차검증, 최소 평균 제곱오차), 부트스트랩 반복 횟수 B(500~1000) 등이 있다. 또한, 모델 추정 단계에서 사용되는 함수형 변수 ξ_i 의 차원 축소(예: FPCA)와 스칼라 변수 선택(예: LASSO)도 논의된다. 실증 분석에서는 2011~2012년 스페인 본토 전력시장의 일일 수요·가격 데이터를 사용한다. 데이터는 24시간을 96개의 15분 구간으로 discretize 하였으며, 온도·풍력 발전량을 스칼라 외생변수, 전일 가격·수요 곡선을 함수형 외생변수로 포함시켰다. 회귀모형은 반파라메트릭 부분선형 모델과 비선형 커널 회귀를 조합한 형태를 채택하였다. 예측구역의 성능 평가는 (i) 커버율(실제 곡선이 구역에 포함되는 비율), (ii) 평균 구역 폭(시간별 상·하한 차이 평균), (iii) 피크 시점 커버율(특히 18~20시 사이) 등을 사용한다. 결과는 Lₚ 방법이 가장 높은 전체 커버율(≈96%)을 보였지만, 평균 구역 폭이 가장 넓었다. 가변분산 방법은 전체 커버율이 약 94%로 약간 낮지만, 평균 구역 폭이 15% 정도 감소하였다. 깊이 기반 방법은 비대칭 구역을 제공해 피크 시점 커버율이 98%로 가장 높았으며, 전체 커버율도 95% 수준을 유지했다. 결론에서는 세 방법이 각각 장단점을 가지고 있음을 강조한다. Lₚ 방법은 구현이 간단하고 이론적 근거가 명확하지만 구역이 과도하게 보수적일 수 있다. 가변분산 방법은 실용적인 구역 폭 감소에 기여하며, 특히 피크 부하 관리에 적합하다. 깊이 기반 방법은 비정규성에 강인하고 비대칭 위험을 포착하는 데 유리하다. 향후 연구로는 다변량 함수형 응답(수요·가격 동시) 모델링, 실시간 온라인 부트스트랩, 그리고 전력시장 정책 시뮬레이션에의 적용을 제안한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기