범용 태양광 에너지 예측 모델
초록
본 논문은 일년치 기상·태양광 데이터(일일 평균 기온, 일조 시간, 전역 복사량 등)를 이용해 나이브 베이즈 분류기로 일일 총 발전량을 예측한다. 범주형 변환 후 민감도와 정밀도를 향상시켰으며, 각 특성이 발전량에 미치는 영향을 분석한다.
상세 분석
본 연구는 태양광 발전량 예측에 머신러닝을 적용하려는 시도 중, 가장 단순한 확률 모델인 나이브 베이즈(Naive Bayes)를 선택한 점이 흥미롭다. 나이브 베이즈는 특성 간 독립성을 가정하는데, 실제 기상 변수(온도, 일조시간, 전역 복사량 등)는 상호 연관성이 높다. 따라서 독립성 가정 위반으로 인한 예측 편향이 발생할 가능성이 있다. 논문에서는 모든 입력 변수를 ‘범주형’으로 변환했는데, 연속형 데이터를 인위적으로 구간화하면 정보 손실이 발생한다. 구간 설정 기준이 명시되지 않아 재현성이 떨어진다. 또한 데이터셋이 단일 설치된 태양광 시스템의 1년치에 국한돼 있어, 계절성·지역성 차이를 포괄적으로 검증하기 어렵다. 평가 지표로 민감도와 정밀도만 제시했는데, 회귀 문제인 발전량 예측에서는 평균 절대 오차(MAE), 평균 제곱근 오차(RMSE) 등 연속값 오류 측정이 더 적절하다. 비교 대상 모델(선형 회귀, 랜덤 포레스트, LSTM 등)과의 성능 대비가 없으므로, 나이브 베이즈가 실제로 ‘우수’한지 판단하기 어렵다. 그럼에도 불구하고, 저비용·저복잡도 구현 가능성, 빠른 학습·추론 속도는 실시간 모니터링 시스템에 유용할 수 있다. 향후 연구에서는 특성 독립성 가정을 완화하는 베이즈 네트워크, 혹은 시계열 특성을 반영한 딥러닝 모델과의 비교, 다중 지역·다중 연도 데이터를 활용한 일반화 검증이 필요하다.
댓글 및 학술 토론
Loading comments...
의견 남기기