The Korean Society For New And Renewable Energy
[ Article ]
New & Renewable Energy - Vol. 22, No. 1, pp.92-103
ISSN: 1738-3935 (Print) 2713-9999 (Online)
Article No. [2026-3-PV-009]
Print publication date 25 Mar 2026
Received 28 Nov 2025 Revised 28 Jan 2026 Accepted 02 Feb 2026
DOI: https://doi.org/10.7849/ksnre.2026.2044

공간 통계 기법을 적용한 기상 데이터 기반 태양광 발전량 예측 모델 연구

김민준1) ; 김범주2) ; 이원철3), *
A Study on a Solar Power Generation Forecasting Model Based on Meteorological Data Using Spatial Statistical Methods
Min-Joon Kim1) ; Beom-Joo Kim2) ; Won-Cheol Lee3), *
1)M.S. Student, Department of Energy Policy and Technology Convergence, Soongsil University
2)R&D Center General Manager, Research Institute, Nuriflex
3)Professor, School of Electronic Engineering, Soongsil University

Correspondence to: * wlee@ssu.ac.kr Tel: +82-2-816-6606 Fax: +82-2-816-6606

© 2026 by the New & Renewable Energy
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Abstract

Accurate photovoltaic (PV) power forecasting has become increasingly critical with the rapid expansion of renewable energy. In Korea, the Korea Power Exchange has reinforced error thresholds and settlement rules to improve forecasting accuracy, reducing the average error rate from 8.3% to 5.7%. However, stricter regulations may impose disproportionate burdens on small-scale producers and exacerbate market polarization, highlighting the need for more precise forecasting approaches. Previous studies have largely relied on short-term deep learning models using meteorological data from nearby stations, which fail to capture actual generation characteristics when geographical factors are excluded. This study proposes a deep learning-based forecasting model integrating geographical attributes of PV plants and meteorological variables such as temperature, precipitation, wind direction, wind speed, humidity, solar irradiance, sunshine hours and cloud cover. Geostatistical interpolation was applied to estimate these meteorological variables at unsampled locations, and the results were incorporated into the forecasting dataset. Experimental results demonstrate that the proposed model consistently outperforms conventional approaches, confirming that the joint consideration of geographical and meteorological factors substantially improves the accuracy of PV power forecasting.

Keywords:

Spatial statistics, Ordinary kriging, AI model, Solar power prediction, Hybrid model

키워드:

공간 통계, 정규 크리깅, 인공지능 모델, 태양광 발전량 예측, 하이브리드 모델

1. 서 론

최근 국내 재생에너지 확대 정책에 따라 KPX가 태양광 발전 예측 오 기준을 8.3%에서 5.7%로 개선하는 등 예측제도의 정확도 향상을 위해 제도를 전면 개편하고 있다. 그러나 예측 오차 기준 강화는 중소 태양광 발전 사업자에게 수익 감소 및 시장 경쟁력 약화로 이어질 수 있다는 지적이 제기되며, 예측제도의 실효성과 균형성 확보가 새로운 과제로 떠오르고 있다. 이러한 환경에서 태양광 발전량을 보다 정밀하게 예측할 수 있는 기술적 접근이 그 어느 때보다 중요해지고 있다.[1]

태양광 발전은 일반적인 발전원과는 달리 일사량, 일조시간, 기온 등 다양한 기상학적인 요인에 따라 직접적으로 영향을 받는다. 특히, 구름의 이동이나 풍속의 시간적 변동성을 정확히 예측하기 어렵기 때문에 발전량의 실시간 예측과 안정적인 전력망 운영에는 본질적인 불확실성이 내재되어 있다. 이러한 출력 변동성을 완화하기 위해 에너지 저장장치(Energy Storage System, ESS)를 설치가 활용되지만, 건설 및 유지 비용 증가와 자원 소모로 인해 발전 단가가 상승하는 한계가 존재한다. 따라서 ESS에 의존하지 않고 발전량의 변동성을 최소화하기 위해서는 태양광 발전 예측 기술의 고도화가 필수적이다.[2,3]

태양광 발전 예측은 주로 기상 인자(일사량, 온도, 풍속, 운량 등)와 시간적 패턴을 분석하여 향후 발전량을 추정하는 과정으로, 전력계통 운영의 안정적 확보와 경제적 효율성 향상에 핵심적인 역할을 한다. 특히 최근에는 물리적 모델(physical model)과 데이터 기반 모델(data-driven model)이 함께 활용되며, 인공지능과 기상 예보 정보를 결합한 하이브리드 예측 기법이 발전하고 있다.[4] 이러한 접근은 기상학적 불확실성을 줄이고 출력 예측 정확도를 향상시켜, 분산형 전력망에서의 안정적인 재생에너지 관리를 가능하게 한다. 태양광 발전 예측을 위해 물리적 모델과 통계적 기법(statistics-based model)에 기반한 시계열 분석 및 회귀 분석 연구가 수행되어 왔다. 그러나 이러한 선행 연구들은 발전소의 위치 정보와 설비 용량 등의 세부 자료가 부족하여, 공공기관이나 지자체에서 운영하는 AWS 또는 ASOS 등 공공 기상관측소의 인근 지점 데이터를 대푯값으로 활용하는 방식으로 예측을 수행하였다.[5,6] 이러한 접근은 발전소와 관측소 간의 거리 차이에 비례하는 불확실성을 유발할 수 있으며, 결과적으로 태양광 발전량 예측의 정확도를 저하시킬 가능성이 있다.

지역 규모의 기상 변수를 산출하기 위해서는공간 보간 기법의 적용이 필요하다. 공간 보간 기법은 특정 지역 내에서 관측된 데이터를 기반으로 미관측 지점의 기상 변수를 추정하는 과정으로 정의되며, 관측 장비가 설치되어 있지 않는 태양광 발전소 지역의 기상요소를 보완적으로 예측하는데 활용될 수 있다.[7]

공간 보간 기법을 이용한 태양광 발전량 예측은 확률·통계 기반 모델, 머신러닝 기반 모델, 그리고 물리 및 회귀 모델 적용 연구로 구분할 수 있다. Nam과 Hur(2018)[8]은 크리깅(Kriging) 기법으로 발전소 지점의 기상요소를 공간적으로 추정한 뒤, 나이브 베이즈 분류기(Naive Bayes Classifier)를 이용하여 확률적 발전량 예측 모델을 제시하였다. 제안된 모델은 지속성 모형 대비 평균 NMAE 4% 수준으로 예측 정확도가 향상되었으나, 단일 부지 사례에 국한되고 계절별 변동성 반영이 미흡하다는 한계가 있다. 이후 Kim과 Hur(2019)[9]은 크리깅으로 추정한 일사량을 SVR모델의 입력으로 활용하여 단기 PV 출력 예측을 수행하였다. 그 결과 MAPE 7.4%, RMSE 0.86 MW로 기존 ARIMAX 및 지속성 모델보다 약 3배 높은 정확도를 보였으나, 단일기간 데이터와 입력오차 전파의 한계가 지적되었다. 한편 Lee et al.등[5]은 IDW(Inverse Distance Weighting) 보간법으로 기상자료를 격자화하여 이를 물리식 기반 발전량 예측에 적용한 결과, ASOS 자료를 직접 활용한 경우보다 약 1.4배 높은 예측 정확도를 보였다. 유사하게 Choi et al. (2022)등[10]은 IDW 보간을 이용해 일사량 예측 정확도를 검증한 결과, 다중회귀모델보다 1.46배 우수한 성능, 특히 저일사 기간에서의 향상된 예측력을 확인하였다.

기존 연구들은 대부분 단일 시점 또는 단기간의 기상자료를 활용하는 과정에서 시계열적 상관성이 충분히 고려되지 못한 한계가 있다.

본 연구에서는 이러한 한계를 보완하기 위해 태양광 발전소 인근 기상 관측 지점들의 자료를 활용하고, 병렬 처리 기반 크리깅(parallel kriging)기법을 적용하여 발전소 위치에서의 기상 요소 값을 시간 단위로 추정하였다. 또한 크리깅을 통해 산출된 기상 변수를 딥러닝 기반 예측 모델(DNN) 및 순환신경망 예측 모델(RNN, LSTM, GRU)의 입력으로 적용하여 태양광 발전량 예측을 수행하고, 인근 관측소의 실측 기상 자료를 입력으로 한 예측 결과와 비교·분석함으로써 공간보간 기법의 적용이 예측 정확도에 미치는 영향을 정량적으로 검증하고자 하였다.


2. 태양광 발전 예측 데이터 구축

본 연구는 2013년부터 2015년까지의 기상청 관측소 539개 지점의 시간별 예보 자료와 전라도 A 태양광 발전소의 시간별 발전량 데이터를 활용하여 데이터베이스 모델링을 수행하였다. 구축된 데이터베이스는 태양광 발전 출력 예측 모델의 훈련 데이터로 활용되었다. 특히, Python 환경에서 병렬 처리를 효율적으로 수행할 수 있도록 지원하는 라이브러리 Joblib[11]을 이용하여, 시간 단위 크리깅 연산을 수행하는 함수를 정의하고 이를 월 단위(batch)로 병렬 처리하였다. 최종적으로, 병렬 처리 기반 크리깅을 통해 추출된 기상 요소 데이터를 태양광 발전 예측 모델의 입력 변수로 적용하였다. 아래의 Fig. 1은 본 연구에서 수행한 데이터 처리 및 병렬 크리깅 절차를 나타내는 프레임워크이다.

Fig. 1.

Parallelized framework for kriging-based extraction of solar power plant data

2.1 태양광 발전소 기상 데이터 예측

공간적 데이터 보간 기법에는 불규칙 삼각망(Triangulated irregular network, TIN), 역거리 가중보간법(Inversed distance weight, IDW), 크리깅(Kriging), 스플라인(Spline) 등이 있으며, 특히. IDW와 크리깅은 기상 관측 자료를 활용한 공간적 추정에서 대표적으로 적용되는 기법이다.[12]

IDW는 관측 지점과 예측 지점 간의 거리가 가까울수록 유사성이 높다는 가정하에 거리에 반비례하는 가중치를 부여하여 미관측 지점의 값을 추정하는 방식이다. 이 방법은 계산 구조가 단순하고 구현이 용이하며, 기상 변수의 공간 분포를 재구성하는 데 널리 활용되는 대표적인 보간 기법으로 보고되고 있다.[13]

반면 크리깅은 관측 자료 간의 공간 자기상관(spatial autocorrelation)을 반영하는 세미베리오그램을 기반으로 미관측 지점의 값을 추정하는 지구통계학적 기법으로, 단순 거리 기반 보간 대비 공간적 구조를 보다 체계적으로 고려할 수 있는 장점이 있다. 특히 정규 크리깅(Ordinary Kriging, OK)은 관측된 공간 자료의 상관 구조를 이용하여 최적 선형 불편 추정(BLUE, Best Linear Unbiased Estimator)를 제공하는 방법으로 설명되며, 기상 변수와 같이 공간적 연속성이 존재하는 자료의 보간에 적합한 것으로 알려져 있다.[14]

정규 크리깅은 관측 자료 간의 공간 자기상관(spatial autocorrelation)을 반영하기 위해 세미베리오그램을 활용하는 지구통계학적 보간 기법이다.세미베리오그램(semi-variogram)은 관측 지점 간 거리 증가에 따라 값의 유사성이 어떻게 감소하는지를 정량화하며, 일반적으로 Nugget, Sill, Range의 세 요소로 요약된다. Nugget은 이론적 거리가 0에 가까울 때에도 존재하는 준 분산(semi-variance)으로, 관측 오차 또는 미세 규모 변동에 의해 발생하는 불연속성을 의미한다. Sill은 거리 증가에 따라 준 분산이 더 이상 증가하지 않고 수렴하는 값(평형 수준)으로, 자료의 전체 변동 규모를 반영한다. Range는 준 분산이 Sill에 도달(또는 실질적으로 근접)하는 거리로, 그 범위 내에서는 관측값들이 유의미한 공간 상관성을 가진다고 해석된다.[15~17]

세미베리오그램 모형의 파라미터(Nugget, Sill, Range)는 관측 자료로부터 산정된 경험적 세미베리오그램(empirical semi-variogram)에 이론적 베리오그램 모형(theoretical variogram model)을 적합함으로써 추정된다. 일반적으로 이 과정은 경험적 세미베리오그램과 이론적 베리오그램 모형 간의 차이를 최소화하는 형태로 정의되며, 비선형 최소 제곱(non-linear least squares) 기반의 최적화 문제로 수행될 수 있다. 본 연구에서는 이러한 최적화 기반 적합 과정을 통해 세미베리오그램 모형 파라미터를 추정하고, 이를 크리깅 기반 공간 보간 과정에 적용하였다.[18,19]

또한 본 연구에서는 정규 크리깅 적용 시 관측 자료에 내재된 공간 자기상관 구조를 충분히 반영하기 위하여 경험적 세미베리오그램을 산정한 후, 다양한 이론적 베리오그램을 적합하여 비교·검증하였다. 구체적으로 Linear, Spherical, Power, Exponential 모형을 적용하였으며, 각 모형에 따른 공간 보간 결과의 정확도를 정량적으로 평가함으로써 최적의 베리오그램 모형을 산정하였다.

Linear 모델은 거리 증가에 따라 세미베리오그램이 선형적으로 증가하는 형태로 공간적 변화 경향을 단순하게 표현할 수 있으나, 특정 거리에서 Sill에 수렴하지 않는 특성을 가질 수 있다.[20] Spherical 모델은 일정 거리(Range)까지 세미베리오그램이 증가한 후 Sill에 도달하여 안정화된 형태로,[21] 유한 범위 내에서 공간 상관성이 존재하는 자료에 적합한 것으로 보고된다. Exponential 모델은 단거리에서 반분산이 빠르게 증가한 뒤 점진적으로 Sill에 접근하는 형태로 단거리 상관 구조를 비교적 잘 반영하며,[22] Power 모델은 거리 증가에 따라 반분산이 지속적으로 증가할 수 있어 비정상(non-stationary)적 변동 또는 장거리에서의 변화 양상을 표현하는데 활용될 수 있다.[23]

본 연구에서는 공간 보간 기법의 성능을 정량적으로 평가하기 위해 일부 관측소를 검증용 지점으로 제외한 뒤 해당 지점을 재추정하는 교차검증 기반 평가를 수행하였으며, 재추정값과 실제 관측값 간 평균제곱오차(MSE)를 산출하여 기상 변수별 및 세미베리오그램 모델별 예측 정확도를 비교하였다.[24] 또한 교차검증을 통해 선정된 보간 기법을 기반으로 전체 관측소 자료를 활용하여 연구 대상 영역의 기상 변수 보간도를 생성하였으며, 이때 보간 지점(격자) 수 변화에 따른 보간 결과의 안정성과 오차 특성을 추가적으로 분석하였다.[25]

Fig. 2Fig. 3은 병렬 처리 기반 크리깅 기법 수행 과정 중, 병렬 크리깅을 적용하기에 앞서 공간 보간 기법의 적합성을 선정하기 위한 사전 분석 결과를 나타낸다. 해당 그래프는 3년간의 시계열 기상 데이터 중 일부 대표 시간대를 대상으로 각 보간 기법의 성능을 정량적으로 평가하는 것으로, MSE를 이용하여 IDW와 정규 크리깅 기반 베리오그램 모델(Linear, Spherical, Exponential, Power)의 보간 정확도를 비교하였다. 또한 전체 3년 시계열 기상 데이터에 대해 동일한 비교를 수행한 결과, 두 기법 중 보간 정확도가 우수한 모델은 Spherical 모델로 확인되었다.

Fig. 2.

MSE variation with respect to the number of sampling points

Fig. 3.

MSE variation with respect to the number of interpolated points

샘플링 관측소 수 증가에 따른 MSE 변화를 나타낸 결과(Fig. 2), 샘플링 관측소를 200개 지점으로 설정하였을 때 IDW의 MSE는 약 8.00으로 나타났으며, Linear 모델, Spherical 모델, Exponential 모델, Power 모델은 각각 약 4.88, 4.82, 5.01, 5.94로 분석되었다. 이때 Spherical 모델의 MSE가 가장 낮아 동일 조건에서 가장 우수한 보간 정확도를 보였다.

반면, 보간 지점 수 증가에 따른 MSE 결과(Fig. 3)에서는 보간 지점이 518개일 때 IDW의MSE를 약 14.44로 나타났으며, Linear 모델, Spherical 모델, Exponential 모델, Power 모델은 각각 11.47, 11.40, 11.97, 14.74로 확인되었다. 해당 결과에서도 Spherical 모델이 가장 낮은 MSE를 나타내어 IDW 대비 우수한 보간 성능을 보였다.

따라서 본 연구에서는 위 결과를 바탕으로 Spherical 모델로 추정된 공간 상관 구조를 기반으로 공분산 행렬을 구성하고, 이를 활용한 정규 크리깅을 수행하였다. 앞서, 서술한 바와 같이, 정규 크리깅은 관측 지점의 값을 선형 결합하여 관심 지점의 값을 추정하는 기법이다. 식 (1)은 정규 크리깅의 기본 추정식을 나타내며, 예측 지점에서의 추정값 α*는 주변 n개의 관측 지점에서 관측된 값 αi를 가중치 λi로 선형 결합하여 산출된다. 여기서 λi는 i번째 관측 지점의 기여도를 의미하는 가중치이며, n은 예측에 활용되는 인근 관측 지점의 개수를 의미한다. 가중치 λi는 관측 지점 간 공간 상관 구조를 기반으로 계산되며,[26] 이를 통해 관심 지점의 α 값을 추정한다.

α*=i=1nλiαi(s.t.i=1nλi=1)(1) 

본 연구에서는 태양광 발전량 예측에 활용할 입력 기상 데이터를 구축하기 위해, Table 1에 제시된 539개 기상 관측탑의 공간 위치 정보와 기상청에서 제공하는 기상 관측 자료를 결합하여 정규 크리깅을 수행하였다. 크리깅 적용을 통해 관측 지점에서 측정된 기상 변수를 공간적으로 보간함으로써, 관측망이 존재하지 않는 예측 대상 지점에서도 연속적인 기상 정보를 추정할 수 있도록 하였다.

Location data for MET tower

또한 장기간(3년) 및 시간 단위(시간별) 데이터를 대상으로 반복적인 공간 보간을 수행해야 하므로, 계산 비용을 줄이고 처리 효율을 높이기 위해 병렬 처리 기반 크리깅을 적용하였다. 그 결과, Table 2에 제시된 예측 대상 지점에 대한 3년간의 시간별 기상 데이터를 산출하였다. 최종적으로는, 크리깅을 통해 생성된 예측 지점의 기상 데이터는 태양광 발전량 예측 모델의 입력 변수로 활용하였다.

Geographical location of solar farm A


3. 태양광 발전량 예측 모델

태양광 발전 예측에 활용되는 각 기상 요소 데이터는 측정 단위와 값의 범위가 상이하므로, 모델 학습 전에 데이터의 스케일을 일치시켜 분포를 균질화할 필요가 있다. 또한 인공신경망 기반의 모델의 효율적인 학습을 위해서는 입력 변수의 크기를 일정 범위로 조정하는 정규화(normalization) 과정이 필요하다. 따라서 본 연구에서는 모든 입력 변수(독립 변수)에 대해 Min-Max 정규화를 적용하여 데이터의 값을 0과 1 사이의 범위로 변환하였다.

d~i=di-min(1:d)max(1:d)-min(1:d)(2) 

di는 각 요소 데이터이며, min(1:d)은 각 요소 중 가장 작은 값 그리고 max(1:d)은 각 요소 중 가장 큰 값을 나타낸다.

3.1 DNN을 이용한 태양광 발전량 예측

DNN은 Fig. 4와 같이 입력층과 출력층 사이에 다수의 은닉층(hidden Layer)들로 이루어진 인공 신경망이다.[27] 각 계층은 뉴런(neuron) 또는 노드(node)로 구성되어 있으며, 이들은 가중치와 활성화 함수(activation function)를 통해 서로 연결되어 있다. DNN은 이미지 인식, 음성 인식, 자연어 처리 등 다양한 분야에서 활용되며,[28] 대규모 데이터로부터 복잡한 패턴(pattern)과 비선형 관계를 학습하여 분류(classification), 예측(prediction), 생성(generation) 등의 작업을 수행할 수 있다. 이러한 DNN 기반 모델을 태양광 발전 예측에 적용할 경우, 기존의 단순 통계적 회귀 모델보다 비선형적 관계와 시계열 패턴을 정교하게 학습할 수 있어 예측 효율성과 정확도 측면에서 향상된 성능을 기대할 수 있다.[29~31]

Fig. 4.

DNN architecture

본 연구에서는 병렬 처리 기반 크리깅 기법을 통해 추정된 기상 변수들을 입력 데이터로 활용하였다. 해당 기상 변수는 앞서 제시한 Min-Max 정규화 과정을 동일하게 적용한 뒤, 총 8개의 기상 입력 변수로 구성하였다. 이후 태양광 발전량을 다중 시점(현재 t, 1시간 후 t+1, 2시간 후 t+2, 24시간 후 t+24)으로 동시에 예측하기 위해 다층 퍼셉트론(MLP) 기반의 DNN 모델을 설계하였다. 데이터는 시계열 순서를 유지하기 위해 shuffle 없이 학습/평가 데이터로 분리하였으며,[32] 예측 성능 평가는 RMSE와 MAE를 이용하였다.[33]

DNN 모델은 총 3개의 은닉층으로 구성되며, 각 은닉층은 32개의 뉴런으로 설정하였다. 은닉층 활성화 함수로 ReLU[34]를 적용하였으며, 출력층은 4차원 벡터를 출력하도록 설계하여 각 차원이 각각 t, t+1, t+2, t+24 예측값에 대응하도록 구성하였다. 손실함수는 MSE를 사용하였고, 최적화 알고리즘으로 Adam[35]을 적용하여 총 15,000 epoch 동안 학습하였다.

비교 검증을 위해 인근 기상 관측소에서 관측된 기상 데이터를 입력으로 사용하는 태양광 발전량 예측용 DNN 모델을 추가로 구성하였다. 비교 모델은 입력 데이터 구성에만 차이가 있으며, 네트워크 구조 및 학습 설정은 앞서 제시한 모델과 동일하게 적용하였다. Table 3은 본 연구에서 사용한 모델의 주요 하이퍼파라미터 설정을 요약하여 제시한다.

Hyperparameter settings of the DNN multi-step forecasting model

3.2 순환신경망을 이용한 태양광 발전량 예측

순환신경망 계열 모델은 시계열 데이터 학습에 우수한 성능을 보이며, 대표적으로 RNN, LSTM, GRU의 세 가지 구조가 있다.

RNN은 하나의 입력과 출력을 가진 DNN 구조를 순차적으로 연결한 형태로, 과거의 학습 결과를 현재 학습에 반영하는 딥러닝 기반 시계열 처리 모델이다.[36] 하나의 tanh 혹은 ReLU 활성화 함수를 사용하며,[37] 체인이 길어질 경우 과거 정보가 소실되는 장기 의존성(long-term dependency) 문제가 발생한다[38](Fig. 5 참조).

Fig. 5.

RNN architecture

LSTM은 이러한 RNN의 한계를 개선하기 위해 제안된 구조로, 내부에 셀 상태(cell state, Ct)를 유지하며 장기 정보를 보존한다.[39] Fig. 6은 LSTM 셀의 구조를 나타낸 것으로, 입력 벡터 xt와 이전 시점의 은닉 상태 ht-1, 셀 상태 Ct-1가 입력으로 사용된다. 첫 번째 단계에서는 망각 게이트(forget gate)가 시그모이드 함수(σ)를 사용하여 이전 셀 상태에서 제거할 정보를 결정하며, 그 결과는 식 (3)으로 표현된다.

ft=σ(Wf[ht-1,xt]+bf)(3) 
Fig. 6.

LSTM architecture

두 번째 단계에서는 입력 게이트(input gate)가 시그모이드 함수를 이용하여 새롭게 저장할 정보를 선택하고, tanh 함수를 통해 후보 셀(C~t)를 생성한다. 이 과정은 식 (4)(5)로 정의된다.

it=σ(Wi[ht-1,xt]+bi)(4) 
C~t=tanh(WC[ht-1,xt]+bC)(5) 

세 번째 단계에서는 이전 셀 상태 Ct-1와 새로운 후보 상태(C~t)를 결합하여 셀 상태를 업데이트 하며, 이는 식 (6)으로 계산된다.

Ct=ftCt-1+itC~t(6) 

마지막으로 출력 게이트(output gate)는 시그모이드 함수를 통해 출력 정보를 결정하고, tanh 함수를 거쳐 최종 은닉 상태 ht를 산출한다. 이는 식 (7)(8)로 표현된다.

ot=σ(Wo[ht-1,xt]+bo)(7) 
ht=ottanh(Ct)(8) 

그림 내의 σ는 시그모이드 활성화 함수, tanh는 쌍곡선탄젠트 활성화 함수, ⊗는 원소별 곱(element-wise multiplication), ⊕는 상태 갱신(state addition)을 나타낸다.

GRU는 LSTM 모델의 복잡한 구조를 단순화하여 학습 효율성을 향상시킨 순환신경망이다.[21] LSTM은 망각 게이트, 입력 게이트, 출력 게이트의 세 개의 게이트로 구성되는 반면, GRU는 리셋 게이트(reset gate, rt)와 업데이트 게이트(update gate, zt)의 두 개의 게이트만을 사용한다. Fig. 7은 GRU의 셀 구조를 나타낸 것으로, 입력 벡터 xt와 이전 시점의 은닉 상태 ht-1가 입력으로 사용된다.

Fig. 7.

GRU architecture

첫 번째 단계에서 리셋 게이트는 시그모이드 함수를 통해 이전 은닉 상태의 정보를 얼마나 잊을지를 결정하며, 이는 식 (9)로 정의된다.

rt=σ(Wr[ht-1,xt]+br)(9) 

두 번째 단계에서 업데이트 게이트가 현재 입력과 과거 정보를 얼마나 반영할지를 결정한다. 업데이트 게이트는 식 (10)으로 계산된다.

zt=σ(Wz[ht-1,xt]+bz)(10) 

세 번째 단계에서 리셋 게이트의 출력을 반영하여 후보 은닉 상태(candidate hidden state, ht~)를 생성한다. 이 과정은 식 (11)로 표현되며, 여기서 ⊙는 원소별 곱(element-wise multiplication)을 의미한다.

ht~=tanh(Wh[rtht-1,xt]+bh)(11) 

마지막으로 업데이트 게이트는 이전 은닉 상태 ht-1와 새로운 후보 은닉 상태 ht~를 가중 합하여 최종 은닉 상태 hi를 계산한다. 이는 식 (12)로 정의된다.

ht=(1-zt)ht-1+ztht~(12) 

본 연구에서는 시계열 데이터의 시간적 의존성을 반영하기 위해 순환신경망(RNN, LSTM, GRU)을 추가로 적용하였다. 입력 데이터는 앞서 구성한 기상 입력 변수에 대해 동일한 전처리 절차를 적용하여 사용하였으며, 태양광 발전량을 다중 시점(현재 t, 1시간 후 t+1, 2시간 후 t+2, 24시간 후 t+24)으로 동시에 예측하도록 모델을 설계하였다. 데이터는 시계열 순서를 유지하기 위해 shuffle 없이 학습/평가 데이터로 분리하였으며, 예측 성능 평가는 RMSE와 MAE를 이용하였다.

RNN, LSTM, GRU 모델은 모두 시퀀스 길이 24(24시간)의 입력을 사용하도록 구성하였으며, 단일 순환층(recurrent layer)에 32개의 은닉 유닛(hidden unit)을 적용하였다. 순환층 활성화 함수로는 tanh를 사용하였고, 출력층은 4차원 벡터를 출력하도록 설계하여 각 차원이 각각 t, t+1, t+2, t+24 예측값에 대응하도록 구성하였다. 손실 함수는 MSE를 적용하였으며, Adam 최적화 알고리즘을 기반으로 최대 5,000 epoch까지 학습을 수행하였다. 또한 과적합 방지를 위해 검증 손실(val_loss)을 기반으로 early stopping을 적용하였고, 성능 검증이 개선되지 않을 경우 학습을 조기에 종료하도록 설정하였다.

또한 비교 검증을 위해 관측소 기반 기상 입력 데이터를 적용한 모델을 동일한 설정으로 구성하여 비교하였다.

Table 4는 본 연구에서 사용한 RNN, LSTM, GRU 모델의 주요 하이퍼파라미터 설정을 요약하여 제시한다.

Hyperparameter settings of recurrent models (RNN/LSTM/GRU)


4. 실험 결과

본 절에서는 태양광 발전량 예측을 위해 구축한 DNN, RNN, LSTM, GRU 기반 모델의 예측 성능을 비교·분석하였다. 입력 기상 데이터 구성에 따른 성능 차이를 확인하기 위해 두 가지 실험 조건을 설정하였다. 첫째, 발전소 인근 기상 관측소(목포)에서 관측된 시간별 기상자료를 입력 변수로 적용하여 발전량을 예측하였으며, 둘째, 병렬 처리 기반 크리깅을 통해 발전소 위치에서 산출한 추정 기상자료를 입력으로 적용하여 동일한 모델 구조를 유지한 상태에서 예측 결과를 비교하였다. 이를 통해 공간 보간 기반 기상 데이터 구축이 태양광 발전량 예측 정확도에 미치는 영향을 정량적으로 평가하고자 하였다.

모델은 2013년 1월부터 2015년 9월까지의 데이터를 학습 구간으로, 2015년 10월부터 12월까지의 데이터를 테스트 구간으로 설정하여 평가하였으며, 데이터는 시간 순서를 유지하여 분할함으로써 데이터 누수(Data Leakage)를 방지하였다.[40] 예측 성능은 RMSE 및 MAE 지표를 이용하여 정량적으로 평가하였다. Fig. 8 ~ Fig. 11은 두 입력 조건에 따른 모델별 예측 결과를 비교한 그래프로, 실측값과 예측값의 시간적 변화 패턴 및 예측 오차 차이를 시각적으로 제시한다.

Fig. 8.

Comparision of DNN-based PV power prediction using nearby station data and kriging-derived site data

Fig. 9.

Comparision of RNN-based PV power prediction using nearby station data and kriging-derived site data

Fig. 10.

Comparision of LSTM-based PV power prediction using nearby station data and kriging-derived site data

Fig. 11.

Comparision of GRU-based PV power prediction using nearby station data and kriging-derived site data

Table 5는 인근 기상관측소(목포)에서 관측된 시간별 기상 데이터를 입력 변수로 적용하여 태양광 발전량을 예측한 결과를 제시한다. 현재 시각 예측에서 DNN의 RMSE와 MAE는 각각 0.1412, 0.0716이며, RNN은 0.1223, 0.0683으로 나타났다. LSTM은 RMSE 0.1085, MAE 0.0618, GRU는 RMSE 0.1088, MAE 0.0585로 분석되었다. 따라서 현재 시각 예측에서는 RMSE 기준 LSTM(0.1085)이 가장 낮고, MAE 기준 GRU(0.0585)가 가장 낮아 가장 우수한 성능을 보였다.

A forecasting result of power genearation from the PV Model (Nearby Weather Station Data)

Table 6은 병렬 처리 기반 크리깅을 통해 산출한 발전소 위치의 추정 시간별 기상 데이터를 입력 변수로 활용하여 태양광 발전량을 예측한 결과이다.

A forecasting result of power genearation from the PV Model (Kriging-Derived PV Plant Site Data)

Table 5와 비교했을 때, DNN의 2시간 후 예측에서 RMSE는 0.2265(Table 5)에서 0.1897(Table 6)로 감소하여 16.25% 개선되었고, MAE 또한 0.1363(Table 5)에서 0.1136(Table 6)으로 감소하여 16.65% 개선되었다. 또한 RNN은 24시간 후 예측에서 RMSE가 0.2303에서 0.2102로 감소하여 8.73% 개선되었고, 1시간 후 예측에서는 MAE가 0.0787에서 0.0695로 감소하여 11.7% 개선되었다. LSTM은 1시간 후 예측에서 RMSE가 0.1202에서 0.1157로 감소하여 3.75% 개선되었고, 현재 시각 예측에서는 MAE가 0.0618에서 0.0597로 감소하여 3.40% 개선되었다. GRU의 경우 2시간 후 예측에서 RMSE가 0.1298에서 0.1276으로 감소하여 약 1.69% 개선되었고, 24시간 후 예측에서는 RMSE가 0.1849에서 0.1836으로 감소하여 0.70% 개선되는 등 전반적으로 예측 오차가 감소하는 경향을 확인하였다.


5. 결 론

본 연구에서는 태양광 발전량 예측을 위해 DNN, RNN, LSTM, GRU 기반의 예측 모델을 구축하고, 입력 기상 데이터 구성에 따른 예측 성능 차이를 비교·분석하였다. 구체적으로 인근 관측소(목포)에서 관측된 시간별 기상 데이터를 입력으로 사용한 경우(Table 5), 현재 시각(t) 예측에서 LSTM은 RMSE 0.1085로 가장 낮은 오차를 보였으며, GRU는 MAE 0.0585로 가장 우수한 성능을 나타냈다.

반면, 병렬 처리 기반 크리깅을 통해 산출한 발전소 위치의 추정 기상 데이터를 입력으로 적용한 경우(Table 6), 대부분의 예측 시점에서 RMSE 및 MAE가 감소하는 경향을 확인하였다. 특히 DNN의 2시간 후 예측에서는 RMSE와 MAE가 각각 16.25%, 16.65% 개선되었으며, RNN의 24시간 후 예측에서도 RMSE가 8.73% 감소하였다. 이러한 결과는 발전소 위치의 기상 정보를 공간적으로 추정하여 활용할 경우 태양광 발전량 예측 정확도 향상에 기여할 수 있음을 시사한다.

이러한 분석 결과는 제안한 크리깅 기반 기상 데이터가 모든 예측 모델과 예측 시점에서 일관된 성능 향상을 제공하지 못한다는 한계를 보여준다. 또한 본 연구에서는 RMSE 및 MAE를 중심으로 성능 개선 여부를 비교하였으나, 관측소 기반 입력과 크리깅 기반 입력 간 성능 차이가 통계적으로 유의미한지에 대한 검증은 포함되지 못하였다. 향후 연구에서는 동일 테스트 구간에서 산출된 예측 오차를 기반으로 paired t-test 또는 Wilcoxon signed-rank test와 같은 통계적 유의성 검정을 수행하고, p-value를 함께 제시함으로써[41,42] 성능 향상 효과를 보다 엄밀하게 입증할 필요가 있다.[43]

본 연구에서는 3년간의 기상 데이터를 효율적으로 추정하기 위해 병렬 크리깅을 적용하였으나, 공간적 상관도만 반영하고 시간적 상관도는 고려하지 못하였기 때문에, 계절성(seasonality)이나 시간 의존성(temporal dependency)과 같은 시계열적 특성이 충분히 반영되지 못한 점은 중요한 제약으로 남는다.[44~46] 또한 본 연구는 단일 태양광 발전소 지점의 발전량을 대상으로 분석이 이루어졌기 때문에, 제안한 기법이 다수의 발전소 위치나 넓은 지역에서 동일한 성능을 보이는지에 대한 검증이 부족하다.[47,48] 향후 연구에서는 복수의 발전소 지점을 대상으로 공간 확장성을 평가하고, 지역 간 기상 패턴 차이에 따른 모델 성능의 안정성을 확인할 필요가 있다.[49]

아울러, 본 연구에서는 기상요소 중심의 입력 변수 구성을 기반으로 예측을 수행하였으나, 태양광 발전량에 영향을 미치는 다양한 물리적·환경적 요인을 포함할 경우 예측 성능을 더욱 향상시킬 가능성이 존재한다. 따라서 향후 연구에서는 추가적인 태양광 시스템 특성 요소 및 환경 변수 확장, 그리고 시공간 기반 데이터 생성 기법(spatio-temporal kriging)[50,51] 또는 복합 예측 모델과의 결합[52]을 통해 예측 모델의 일반화 성능을 보다 강화할 필요가 있다.

Subscript

AWS : automatic weather system
ASOS : automatic synoptic observation system
MAPE : mean absolute percentage error
RMSE : root mean squared error
MAE : mean absolute error
DNN : deep neural network
RNN : recurrent neural network
LSTM : long-short term memory
GRU : gated recurrent unit

Acknowledgments

본 논문은 산업통상자원부(MOTIE)와 한국에너지기술평가원(KETEP)의 지원을 받아 수행한 연구 과제입니다(No. RS-2024-00398166).

This work was supported by the Korea Institute of Energy Technology Evaluation and Planning (KETEP) and the Ministry of Trade, Industry & Energy (MOTIE) of the Republic of Korea (No. RS-2024-00398166).

References

  • Electric Times, “Accuracy improves, but the industry is on edge over the forecast system’s sunset”, 2025.02.25.
  • SK ecoplant NEWSROOM, “Latest Renewable Energy Forecasting Technology : Reading the Wind and Predicting the Sun”, 2025.01.16.
  • Industry News, “KEPCO Acheives 95% Accuracy with Its Self-Developed Deep Learning-Based Solar Power Forecasting Technology”, 2021.08.30.
  • Son, W.B., 2023, “Current Status of Solar Power Generation Forecasting Technology for the Expansion of Renewable Energy Deployment”, Information & Communications Magazine, 40(12), 20-26, https://www.kics.or.kr/html/?pmode=Bpublication&page=3&smode=view&seq=4113&searchValue=&searchTitle=strTitle, .
  • Lee, Y., Choi, D., Jung, Y., and Ko, M., 2022, “Application of Technology to Develop a Framework for Predicting Power Output of a PV System Based on a Spatial Interpolation Technique: A Case Study in South Korea”, Energies, 15(22), 8755. [https://doi.org/10.3390/en15228755]
  • Shim, C.-Y., Baek, G.-M., Park, H.-S., and Park, J.-Y., 2024, “Comparison of Solar Power Generation Forecasting Performance in Daejeon and Busan Based on Preprocessing Methods and Artificial Intelligence Techniques: Using Meteorological Observation and Forecast Data”, Atmosphere, 34(2), 177-185.
  • Burrough, P.A., and McDonnell, R.A., 1998, “Principles of Geographical Information Systems”, Oxford University Press, New York (USA).
  • Nam, S., and Hur, J., 2018, “Probabilistic forecasting model of solar power outputs based on the Naive Bayes classifier and Kriging models”, Energies, 11(11), 2982. [https://doi.org/10.3390/en11112982]
  • Kim, K., and Heo, J., 2019, “A study on the development of a short-term photovoltaic power prediction system based on support vector regression (SVR)”, J. Korean Inst. Illum. Electr. Install. Eng., 33(6), 42-48. [https://doi.org/10.5207/JIEIE.2019.33.6.042]
  • Choi, D.-S., Lee, Y.-J., and Ko, M.-J., 2022, “Utilization and verification of inverse distance weighting interpolation technology for predicting solar radiation of photovoltaic system”, KIEAE J., 22(1), 5-12. [https://doi.org/10.12813/kieae.2022.22.1.005]
  • Joblib Development Team, 2024, “Joblib: running Python functions as pipeline jobs - Joblib 1.5.2 documentation”, Accessed 10 October 2025, https://joblib.readthedocs.io/en/stable/, .
  • He, X., 2024, “In Geographic Data Analysis Using R”, Springer, pp.199-222. [https://doi.org/10.1007/978-981-97-4022-2_11]
  • Duan, P., Liang Y., Wang, F., Wu, H., and Zhao, K., 2025, “Applications of inverse distance weight interpolation taking into accout anisotropy to reconstruct the temperature field”, J. Appl. Meteor. Climatol., 64(11), 1723-1734. [https://doi.org/10.1175/JAMC-D-25-0026.1]
  • Chiles, J.-P, and Delfiner, P., 2012, “Geostatistics : Modeling Spatial Uncertainty”, 2nd ed., Wiley. [https://doi.org/10.1002/9781118136188]
  • Journel, A.G., and Huijbregts, C.J. 1978, “Mining Geostatistics”, Academic Press, London (UK).
  • Webster, R., and Oliver, M.A., 2007, “Geostatistics for Environmental Scientists”, 2nd ed., John Wiley & Sons, Chichester (UK). [https://doi.org/10.1002/9780470517277]
  • McBratney, A.B., and Webster, R., 1986, “Choosing functions for semi-variograms of soil properties and fitting them to sampling estimates”, J. Soil Sci., 37(4), 617-639. [https://doi.org/10.1111/j.1365-2389.1986.tb00392.x]
  • Cressie, N. 1985, “Fitting variogram model by weighted least squares”, J. Int. Assoc. Math. Geol., 17(5), 563-586. [https://doi.org/10.1007/BF01032109]
  • Diggle, P. J., and Ribeiro Jr, P. J., 2007, “Model-based Geostatistics”, Springer Series in Statistics, Springer, New York, https://link.springer.com/book/10.1007/978-0-387-48536-2, . [https://doi.org/10.1007/978-0-387-48536-2]
  • Wackernagel, H., 1994,“Cokriging versus kriging in regionalized multivariate data analysis”, Geoderma, 62(1-3), 83-92. [https://doi.org/10.1016/0016-7061(94)90029-9]
  • Oliver, M.A., and Webster, R., 2013, “A tutorial guide to geostatistics: Computing and modelling variograms and kriging”, Catena, 113, 56-69. [https://doi.org/10.1016/j.catena.2013.09.006]
  • Cressie, N., 1993, “Statistics for Spatial Data”, Wiley. [https://doi.org/10.1002/9781119115151]
  • Chen, W., and Genton, M.G., 2019, “Parametric variogram matrices incorporating both bounded and unbounded functions”, Stoch. Environ. Res. Risk Assess., 33, 1669-1679. [https://doi.org/10.1007/s00477-019-01710-1]
  • Clark, I., 1979, “Practical geostatistics”, Applied Science Publishers Ltd., London.
  • Li, J., and Heap, A.D., 2011, “A review of comparative studies of spatial interpolation methods in environmental sciences: Performance and impact factors”, Eco. Inform., 6(3-4), 228-241. [https://doi.org/10.1016/j.ecoinf.2010.12.003]
  • Cressie, N., 1990, “The origins of Kriging”, Math. Geol., 22(3), 239-252. [https://doi.org/10.1007/BF00889887]
  • Goodfellow, I., Bengio, Y., and Courville, A., 2016, “Deep Learning”, MIT Press, Cambridge (USA).
  • LeCun, Y., Bengio, Y., and Hinton, G., 2015, “Deep learning”, Nature, 521, 436-444. [https://doi.org/10.1038/nature14539]
  • Shin, D.H., and Kim, C.B., 2018, “Short-term forecast model for solar power generation using RNN-LSTM”, J. Adv. Navig. Technol., 22(3), 233-239.
  • Yadav, A.K., and Chandel, S.S., 2014, “Solar radiation prediction using Artificial Neural Network techniques: A review”, Renew. Sustain. Energy Rev., 33, 772-781. [https://doi.org/10.1016/j.rser.2013.08.055]
  • Voyant, C., Notton, G., Kalogirou, S., Nivet, M.L., Paoli, C., Motte, F., and Fouilloy, A., 2017, “Machine learning methods for solar radiation forecasting: A review”, Renew. Energy, 105, 569-582. [https://doi.org/10.1016/j.renene.2016.12.095]
  • Bergmeir, C., Hyndman, R.J., and Koo, B., 2018, “A note on the validity of cross-validation for evaluating autoregressive time series prediction”, Comput. Stat. Data Anal., 120, 70-83. [https://doi.org/10.1016/j.csda.2017.11.003]
  • Hyndman, R.J., and Koehler, A.B., 2006, “Another look at measures of forecast accuracy”, Int. J. Forcast., 22(4), 679-688. [https://doi.org/10.1016/j.ijforecast.2006.03.001]
  • Nair, V., and Hinton, G.E., 2010, “Rectified Linear Units Improve Restricted Boltzmann Machines”, Proc. 27th International Conference on Machine Learning (ICML 2010), 807-814, https://www.cs.toronto.edu/~fritz/absps/reluICML.pdf, .
  • Kingma, D.P. and Ba, J., 2014, “Adam : A Method for Stochastic Optimization”, Proc. 3rd International Conference on Learning Representations (ICLR).
  • Elman, J.L., 1990, “Finding structure in time”, Cogn. Sci., 14(2), 179-211. [https://doi.org/10.1207/s15516709cog1402_1]
  • Schmidhuber, J., 2015, “Deep learning in neural networks: An overview”, Neural Netw., 61, 85-117. [https://doi.org/10.1016/j.neunet.2014.09.003]
  • Bengio, Y., Simard, P., and Frasconi, P., 1994, “Learning long-term dependencies with gradient descent is difficult”, IEEE Trans. Neural Netw, 5(2), 157-166. [https://doi.org/10.1109/72.279181]
  • Hochreiter, S., and Schmidhuber, J., 1997, “Long short-term memory”, Neural Comput., 9(8), 1735-1780. [https://doi.org/10.1162/neco.1997.9.8.1735]
  • Hyndman, R.J., and Athanasopoulos, G., 2021, “Forecasting: Principles and Practice”, 3rd ed., OTexts, Melbourne (Austrailia).
  • Dietterich, T.G., 1998, “Approximate statistical tests for comparing supervised classification learning algorithms. Neural Computation”, Nueral Comput., 10(7), 1895-1923. [https://doi.org/10.1162/089976698300017197]
  • Wilcoxon, F., 1945, “Individual comparisons by ranking methods”, Biometrics Bull., 1(6), 80-83. [https://doi.org/10.2307/3001968]
  • Demsar, J., 2006, “Statistical comparsions of classifiers over multiple data sets”, J. Mach. Learn. Res., 7, 1-30.
  • Cressie, N., and Wikle, C.K., 2011, “Statistics for Spatio-Temporal Data”, Wiley, Hoboken (USA).
  • Gneiting, T., Genton, M.G., and Guttorp, P., 2007, “Geostatistical space-time models, stationarity, separability, and full symmetry”, Monogr. Am. Stat. Assoc., 159, 151-175. [https://doi.org/10.1201/9781420011050.ch4]
  • Li, J., and Heap, A.D., 2014, “Spatial interpolation methods applied in the environmental sciences: A review”, Environ. Model. Softw., 53, 173-189. [https://doi.org/10.1016/j.envsoft.2013.12.008]
  • Antonanzas, J., Osorio, N., Escobar, R., Urraca, R., Martinez-de-Pison, F.J., and Antonanzas-Torres, F., 2016, “Review of photovoltaic power forecasting”, Sol. Energy, 136, 78-111. [https://doi.org/10.1016/j.solener.2016.06.069]
  • Pedro, H.T.C., and Coimbra, C.F.M., 2012, “Assessment of forecasting techniques for solar power production with no exogenous inputs”, Sol. Energy, 86(7), 2017-2028. [https://doi.org/10.1016/j.solener.2012.04.004]
  • Sima, Q., Zhang, X., Yang, S., Shen, L., and Bao, Y., 2025, “Multi-scale fused Graph Convolutional Network for multi-site photovoltaic power prediction”, Energy Convers. Manag., 333, 119773 [https://doi.org/10.1016/j.enconman.2025.119773]
  • Jamaly, M., and Kleissl, J., 2017, “Spatiotemporal interpolation and forecast of irradiance data using Kriging”, Sol. Energy, 158, 407-423. [https://doi.org/10.1016/j.solener.2017.09.057]
  • Martín, J.G., Frejo, J.R.D., Maestre, J.M., and Camacho, E.F., 2024, “Spatio-temporal Kriging for spatial irradiance estimation with short-term forecasting in a thermosolar power plant”, Heliyon, 10(20), e39247. [https://doi.org/10.1016/j.heliyon.2024.e39247]
  • Salman, D., Direkoglu, C., Kusaf, M., and Fahrioglu, M., 2024, “Hybrid deep learning models for time series forecasting for solar power”, Neural Comput. Appl., 36, 9095-9112. [https://doi.org/10.1007/s00521-024-09558-5]

Fig. 1.

Fig. 1.
Parallelized framework for kriging-based extraction of solar power plant data

Fig. 2.

Fig. 2.
MSE variation with respect to the number of sampling points

Fig. 3.

Fig. 3.
MSE variation with respect to the number of interpolated points

Fig. 4.

Fig. 4.
DNN architecture

Fig. 5.

Fig. 5.
RNN architecture

Fig. 6.

Fig. 6.
LSTM architecture

Fig. 7.

Fig. 7.
GRU architecture

Fig. 8.

Fig. 8.
Comparision of DNN-based PV power prediction using nearby station data and kriging-derived site data

Fig. 9.

Fig. 9.
Comparision of RNN-based PV power prediction using nearby station data and kriging-derived site data

Fig. 10.

Fig. 10.
Comparision of LSTM-based PV power prediction using nearby station data and kriging-derived site data

Fig. 11.

Fig. 11.
Comparision of GRU-based PV power prediction using nearby station data and kriging-derived site data

Table 1.

Location data for MET tower

MET Longitude Latitude
MET 1 126.9658 37.5714
MET 2 126.4778 35.2837
MET 3 127.119 35.8408
MET 538 128.1456 36.9043
MET 539 128.0253 37.1444

Table 2.

Geographical location of solar farm A

Prediction Point Longitude Latitude
Solar farm A 34.8177 126.7668

Table 3.

Hyperparameter settings of the DNN multi-step forecasting model

Category Hyperparameter Setting
Data split Train/Test 75%/ 25%
Architecture Model type DNN(MLP)
hidden layers 3
Hidden Units 32-32-32
Activation ReLU
Output dimension 4
Training Loss function MSE
Optimizer Adam
Learing rate 1×10-3
Batch size Full-batch
Epochs 15,000

Table 4.

Hyperparameter settings of recurrent models (RNN/LSTM/GRU)

Category Hyperparameter RNN LSTM GRU
Input Sequence length 24
Output Output dimension 4
Model recurrent layers 1
Hidden units 32
Activation tanh
Training Loss function MSE
Optimizer Adam
Learning rate 1×10-3
Batch size 32
Max epochs 5,000

Table 5.

A forecasting result of power genearation from the PV Model (Nearby Weather Station Data)

Time DNN RNN LSTM GRU
Current
Time
RMSE 0.1412 0.1223 0.1085 0.1088
MAE 0.0716 0.0683 0.0618 0.0585
After
1hour
RMSE 0.1888 0.1376 0.1202 0.1210
MAE 0.1022 0.0787 0.0637 0.0648
After
2hours
RMSE 0.2265 0.1489 0.1280 0.1298
MAE 0.1363 0.0842 0.0678 0.0722
After
24hours
RMSE 0.2083 0.2303 0.1832 0.1849
MAE 0.1140 0.1273 0.1060 0.1036

Table 6.

A forecasting result of power genearation from the PV Model (Kriging-Derived PV Plant Site Data)

Time DNN RNN LSTM GRU
Current
Time
RMSE 0.1312 0.1147 0.1092 0.1120
MAE 0.0678 0.0642 0.0597 0.0637
After
1hour
RMSE 0.1582 0.1271 0.1157 0.1187
MAE 0.0853 0.0695 0.0635 0.0660
After
2hours
RMSE 0.1897 0.1428 0.1285 0.1276
MAE 0.1136 0.0811 0.0714 0.0721
After
24hours
RMSE 0.1943 0.2102 0.1844 0.1836
MAE 0.1071 0.1150 0.1026 0.1026