섬 지역 무기상관측소 없이 PV 발전량 예측하기: 인공신경망(ANN) 기반 일·시간 일사량 전이 학습
📝 Abstract
The official meteorological network is poor on the island of Corsica: only three sites being about 50 km apart are equipped with pyranometers which enable measurements by hourly and daily step. These sites are Ajaccio (seaside), Bastia (seaside) and Corte (average altitude of 486 meters). This lack of weather station makes difficult the predictability of PV power grid performance. This work intends to study a methodology which can predict global solar irradiation using data available from another location for daily and hourly horizon. In order to achieve this prediction, we have used Artificial Neural Network which is a popular artificial intelligence technique in the forecasting domain. A simulator has been obtained using data available for the station of Ajaccio that is the only station for which we have a lot of data: 16 years from 1972 to 1987. Then we have tested the efficiency of this simulator in two places with different geographical features: Corte, a mountainous region and Bastia, a coastal region. On daily horizon, the relocation has implied fewer errors than a naive prediction method based on the persistence (RMSE=1468 Vs 1383Wh/m2 to Bastia and 1325 Vs 1213Wh/m2 to Corte). On hourly case, the results were still satisfactory, and widely better than persistence (RMSE=138.8 Vs 109.3 Wh/m2 to Bastia and 135.1 Vs 114.7 Wh/m2 to Corte). The last experiment was to evaluate the accuracy of our simulator on a PV power grid localized at 10 km from the station of Ajaccio. We got errors very suitable (nRMSE=27.9%, RMSE=99.0 W.h) compared to those obtained with the persistence (nRMSE=42.2%, RMSE=149.7 W.h).
💡 Analysis
**
1. 연구 배경 및 필요성
- 관측소 부족: 코르시카는 50 km 간격으로 3곳만 관측소가 있어, 특히 섬 외곽·산악 지역의 일사량 데이터가 거의 없다.
- 재생에너지 정책: 섬 지역 전력 자립과 화석연료 절감 목표에 따라 정확한 PV 발전량 예측이 필수적이다.
2. 방법론
| 단계 | 내용 |
|---|---|
| 데이터 전처리 | 연간·일일 주기성을 제거하기 위해 외부 태양복사량(외계 복사)으로 정규화. 시간 경우에는 태양고도 사인값까지 나눔. |
| ANN 설계 | 다층 퍼셉트론(MLP) – 입력 8개(과거 7시점 + 현재), 은닉층 3뉴런, 출력 1개(다음 시점). 80 % 학습 / 20 % 검증 비율. |
| 학습 데이터 | 아작시오 관측소 1972‑1987년 16년간 일·시간 일사량 (총 5,844일·140,256시간). |
| 전이 학습(Transfer Learning) | 동일 ANN 구조를 그대로 사용해 바스티아·코르테에 적용(학습 파라미터는 아작시오에서만 학습). |
| 비교 모델 | (A) 전이 학습 ANN, (B) 현지 데이터로 재학습한 ANN, (C) 영구성(persistence) 기반 “naïve” 예측. |
| 성능 지표 | RMSE, nRMSE, 95 % 신뢰구간, 상관계수(CC). |
3. 주요 결과
- 전이 학습의 유효성
- 전이 ANN(A)은 현지 학습 ANN(B)와 거의 동등한 성능을 보이며, 특히 일일 예측에서 현지 데이터가 부족한 경우에도 영구성보다 월등히 낮은 오차를 기록.
- 지형·기후 영향
- 코르테(산악)보다 바스티아(해안)에서 일일 예측 오차가 다소 크게 나타났으며, 이는 해안·산악의 구름 변동성 차이와 데이터 정규화 과정에서 최대·최소값 차이 때문으로 해석.
- 시간 예측
- 시간 스케일에서는 두 지역 모두 전이 ANN이 영구성 대비 20‑30 % 정도 낮은 nRMSE를 달성, 특히 일일보다 변동성이 큰 시간대에서도 안정적인 예측 가능.
- PV 발전량 적용
- 10 km 거리의 실제 PV 플랜트에 적용했을 때 nRMSE ≈ 28 % (RMSE ≈ 99 Wh)로, 영구성(≈ 42 %) 대비 큰 개선을 보여 실용적 가치를 입증.
4. 강점
- 데이터 효율성: 16년이라는 장기간 데이터만으로도 다른 지역에 적용 가능한 모델을 구축, 현지 관측소가 전혀 없는 경우에도 활용 가능.
- 단순 구조: 은닉층 3뉴런이라는 매우 간단한 MLP에도 불구하고 충분한 예측 정확도 확보, 구현·운용 비용 절감.
- 물리‑통계 결합: 외계 복사와 태양고도 정규화를 통해 비정상성을 효과적으로 제거, ANN이 순수히 ‘구름‑변동’ 패턴을 학습하도록 함.
5. 한계 및 개선점
| 항목 | 내용 |
|---|---|
| 데이터 편향 | 학습에 사용된 아작시오 데이터는 1972‑1987년 구시대 기록이며, 현재 기후 변화 추세를 반영하지 않을 수 있음. 최신 데이터와 결합 필요. |
| 정규화 범위 차이 | 전이 시 최대·최소값을 아작시오 기준으로 정규화해 현지 극값(특히 산악 지역)에서 오차가 발생. 지역별 정규화 파라미터를 동적으로 조정하는 방안 검토. |
| 모델 복잡도 | 현재는 단일 MLP 구조이지만, 장기·단기 패턴을 동시에 포착하기 위해 LSTM·GRU와 같은 시계열 전용 딥러닝 모델을 도입하면 성능 향상 가능. |
| 검증 기간 | 일일·시간 예측 모두 1년(바스티아 1996년, 코르테 2007년)만을 사용해 검증했으며, 다년간의 계절·극한 상황에 대한 일반화 검증이 부족함. |
| PV 시스템 모델링 | PV 출력 계산에 고정 효율(13 %)을 사용했으나, 실제 효율은 온도·오염·시스템 손실 등에 따라 변동. 보다 정교한 PV 모델(예: PVSYST 기반)과 연계 필요. |
6. 향후 연구 방향
- 다중 지역 학습: 아작시오 외에도 바스티아·코르테 데이터를 포함한 다중 지역 학습을 통해 보다 일반화된 전이 모델 개발.
- 하이브리드 모델: 물리 기반 클라우드 커버 모델(예: Clear‑Sky 모델)과 ANN을 결합한 하이브리드 접근법으로 극한 구름 상황 예측 강화.
- 실시간 업데이트: 현장에 설치된 저비용 광센서(예: 파라볼릭 센서)와 연계해 온라인 학습/재학습 체계 구축, 모델 드리프트 방지.
- 경제성 평가: 예측 정확도가 PV 운영·전력 시장 참여(예: 전력 구매 계약, 배터리 충전 스케줄링)에 미치는 경제적 영향을 정량화.
**
📄 Content
제목 5: 태양광 시스템, 하위 주제 5.1 태양광 발전소
섬 현장에서 기상 관측소가 없는 태양광 전력망 성능 예측가능성: 인공 신경망(ANN) 활용
Cyril Voyant¹,², Marc Muselli², Christophe Paoli², Marie Laure Nivet², Philippe Poggi²*
1 – 캐스텔루치오 병원 방사선치료부, B.P.85 20177 아작시오 – 프랑스
2 – 코르시카 대학/CNRS UMR SPE 6134, {Rte des Sanguinaires, 20000 아작시오/캠퍼스 그리말디, 20250 코르테} – 프랑스
*: 교신 저자 전화/팩스 +33(0)4 955 241 30/42, marc.muselli@univ-corse.fr
※ 본 연구의 일부는 CTC(코르시카 지방자치단체)의 지원으로 수행되었습니다.
초록
코르시카 섬의 공식 기상 관측망은 매우 열악합니다. 약 50 km 간격으로 배치된 세 곳(아작시오, 바스티아, 코르테)만이 파이라노미터를 갖추고 있어 시간별·일별 데이터를 제공하고 있습니다.
- 아작시오 (41°55′ N, 8°48′ E, 해안)
- 바스티아 (42°33′ N, 9°29′ E, 해안)
- 코르테 (42°30′ N, 9°15′ E, 고도 ≈ 486 m)
기상관측소가 부족하면 태양광 전력망 성능을 예측하기가 어렵습니다. 본 연구는 다른 위치에서 확보한 데이터를 활용해 일일·시간별 전역 태양복사를 예측하는 방법론을 제시합니다. 이를 위해 예측에 널리 사용되는 인공 신경망(ANN)을 적용했습니다.
아작시오 관측소(1972 ~ 1987 년, 16 년간 데이터)에서 학습된 시뮬레이터를 구축한 뒤, 지형적 특성이 다른 두 지역(산악 코르테와 해안 바스티아)에서 그 효율성을 검증했습니다.
- 일일 예측에서는 “지속성(persistence)” 기반 단순 예측보다 오차가 작았습니다(RMSE = 1468 vs 1383 Wh/m² (바스티아), 1325 vs 1213 Wh/m² (코르테)).
- 시간별 예측에서도 지속성보다 우수한 결과를 얻었습니다(RMSE = 138.8 vs 109.3 Wh/m² (바스티아), 135.1 vs 114.7 Wh/m² (코르테)).
마지막으로, 아작시오 관측소에서 10 km 떨어진 PV 전력망에 대한 시뮬레이션을 수행했으며, 오차는 nRMSE = 27.9 %(RMSE = 99 Wh)로 지속성( nRMSE = 42.2 %, RMSE = 149.7 Wh)보다 현저히 낮았습니다.
1. 제시 및 문제 정의
전역 복사를 예측하기 위해 인공 신경망(ANN)을 활용한 결과를 보고합니다. ANN은 생물학적 신경망을 모방한 인공지능 기법으로, 의사결정, 최적화, 제어, 예측 등 다양한 분야에서 활용됩니다[1‑3]. 본 연구의 핵심 질문은 다음과 같습니다.
“풍부한 태양복사 데이터가 존재하는 한 지역에서 ANN을 학습시킨 뒤, 이를 다른 지역의 PV 전력망 성능 예측에 활용할 수 있는가?”
코르시카 섬은 지중해성 기후와 구불구불한 지형을 가지고 있으며, 공식 기상망은 세 곳(아작시오, 바스티아, 코르테)만이 파이라노미터를 갖추고 있습니다. 이들 관측소는 시간별·일별 데이터를 제공하지만, 관측소가 없는 지역에서는 태양복사량을 직접 측정할 수 없습니다.
본 연구는 수평면에 대한 전역 태양복사량을 일일·시간별 시간축으로 예측하는데 초점을 맞추었습니다. 이러한 시간 단계는 전력회사(EDF)가 화석연료 절감량을 추정하는 데 필요로 하는 기준이며, 전력 공급이 어려운 원격 지역에서 전력화 가능성을 평가하는 데도 중요합니다[4].
2. 물리적 현상
태양복사를 정량화하는 방법은 크게 두 가지가 있습니다.
- 물리적 모델링 – 대기 중 물리적 과정(산란, 흡수 등)을 기반으로 한 모델[5].
- 통계적 기후학 – 시계열 분석에 기반한 접근법[5].
본 연구에서는 두 방법을 결합해 예측 정확도를 높이고자 했습니다. 특히, 계절성과 일주기성을 제거하기 위해 **외부천체 복사량(Extraterrestrial Global Horizontal Irradiance, E₀)**을 이용해 시계열을 정규화했습니다.
- 일일 경우: 연간 주기성(계절성)만 존재합니다.
- 시간별 경우: 연간 주기성 외에 일주기성(태양 고도각에 따른 변동)도 존재합니다.
따라서 시계열을 E₀와 태양 고도각의 사인값으로 나누어 다중(곱)형 정규화를 수행했습니다. 이렇게 하면 결정론적 성분이 감소하고, **확률적 성분(구름량)**이 보다 두드러지게 됩니다.
3. 실험 데이터가 없는 지역에 대한 태양복사 예측
ANN은 복잡한 비선형 관계를 학습하는 데 강점이 있어, 전통적인 물리 기반 모델을 대체하거나 보완할 수 있습니다. 주요 과제는 학습 데이터 양, 데이터 품질, 최적 ANN 구조를 확보하는 것입니다[8].
3.1 학습 및 검증 절차
- 데이터: 1972 ~ 1987 년(16 년) 동안 아작시오 관측소에서 수집된 전역 복사량(Wh/m²).
- 학습/검증 비율: 전체 데이터의 80 %를 학습, 20 %를 검증에 사용.
- 모델: 다층 퍼셉트론(MLP) – 입력 8개(전시간 t, t‑1 ~ t‑7), 은닉층 3개 뉴런, 출력 1개(다음 시간 t+1).
- 도구: MATLAB을 이용해 모델을 구현.
학습된 모델은 **같은 장소(아작시오)**에서 일일 및 시간별 예측을 수행했을 때 nRMSE < 20.3 % (일일), **nRMSE ≈ 19.5 % (시간별)**의 성능을 보였습니다.
3.2 다른 지역에의 전이(재학습)
아작시오에서 학습된 ANN을 **코르테(산악)**와 **바스티아(해안)**에 적용해 보았습니다. 세 가지 예측 방식을 비교했습니다.
- A 방식: 아작시오 데이터(16 년)로 학습된 ANN을 그대로 적용.
- B 방식: 해당 지역(코르테 5 년, 바스티아 5 년) 데이터를 사용해 새롭게 학습.
- C 방식: 지속성(persistence) 기반의 “단순” 예측.
일일 예측 결과 (표 1)
| 위치 | 방법 | RMSE (Wh/m²) | nRMSE (%) ± IC95 | 상관계수 (CC) |
|---|---|---|---|---|
| 아작시오 (A) | 1383 / 29.19 ± 0.13 | 0.842 | ||
| 바스티아 (B) | 1288 / 27.51 ± 0.2 | 0.842 | ||
| 바스티아 (C, 1996) | 1468 / 31.4 | 0.807 | ||
| 아작시오 (A) | 1213 / 25.88 ± 0.17 | 0.887 | ||
| 코르테 (B) | 1112 / 23.73 ± 0.15 | 0.887 | ||
| 코르테 (C, 2007) | 1325 / 28.3 | 0.844 |
시간별 예측 결과 (표 2)
| 위치 | 방법 | RMSE (Wh/m²) | nRMSE (%) ± IC95 | 상관계수 (CC) |
|---|---|---|---|---|
| 아작시오 (A) | 109.3 / 22.36 ± 0.32 | 0.916 | ||
| 바스티아 (B) | 109.1 / 22.32 ± 0.32 | 0.916 | ||
| 바스티아 (C, 1996) | 138.8 / 27.22 | 0.869 | ||
| 아작시오 (A) | 114.7 / 23.12 ± 0.6 | 0.916 | ||
| 코르테 (B) | 109.6 / 22.08 ± 0.32 | 0.919 | ||
| 코르테 (C, 2007) | 135.1 / 26.50 | 0.889 |
해석
- **재학습 없이 전이(A 방식)**는 지속성(C 방식)보다 일관되게 낮은 RMSE를 보였으며, 특히 시간별 예측에서는 두 방법 간 차이가 크게 나타났습니다.
- 코르테는 산악 지형 특성상 일일 예측이 바스티아보다 더 정확했습니다(복합적인 지형·기후 요인).
- 상관계수는 A·B 방식 모두에서 0.84 ~ 0.92 수준으로, 두 방법 간 차이가 크지 않음을 보여줍니다.
3.3 예시 그래프
- 그림 1(a): 바스티아(일일)에서 시뮬레이션(점선)과 실제 측정(실선)의 비교.
- 그림 1(b): 코르테(시간별)에서 동일한 비교.
- 그림 1(c, d): 각각 일일·시간별 예측값과 실제값 사이의 상관관계.
그래프에서 볼 수 있듯이, 극단적인 구름량이 발생한 날(오류 점선이 크게 나타나는 경우)에는 ANN이 정확히 예측하지 못하는 경향이 있습니다. 이는 데이터 정규화 과정에서 아작시오와 다른 지역 간 최대·최소 복사량 차이가 반영되지 않기 때문일 수 있습니다.
4. PV 시스템에 대한 전이 방법 적용
아작시오 연구실에 최근 설치된 전면형(PV) 시스템(정격 6.525 kW, 1.8 kW (비정질) + 4.725 kW (단결정) 모듈, 6 개 독립 전력 서브시스템)에서 ANN 기반 예측을 검증했습니다.
- 시스템 구성: SUNTECH 175S‑24Ac 9 대(총 1.175 kW) → 1.85 kW SUNNY BOY SMA 인버터.
- 예측식: (E_{PV}(Wh) = \eta_{PV} \times I_{\beta} \times S)
- (\eta_{PV}=13%) (KLA I‑V 곡선 측정)
- (I_{\beta}) = 기울기 β = 80° 에서 ANN이 예측한 시간별 전역 복사량
- (S = 10.125 m^{2}) (활용 면적)
기울기 80°에 대
이 글은 AI가 자동 번역 및 요약한 내용입니다.