基于改进的极限学习机光伏出力短期预测

成燕, 庄飞鸯, 徐万万, 魏婷

成燕, 庄飞鸯, 徐万万, 等. 基于改进的极限学习机光伏出力短期预测[J]. 现代电力, 2023, 40(5): 679-686. DOI: 10.19725/j.cnki.1007-2322.2022.0080
引用本文: 成燕, 庄飞鸯, 徐万万, 等. 基于改进的极限学习机光伏出力短期预测[J]. 现代电力, 2023, 40(5): 679-686. DOI: 10.19725/j.cnki.1007-2322.2022.0080
CHENG Yan, ZHUANG Feiyang, XU Wanwan, et al. Short-term Prediction of Photovoltaic Output Based on Improved Extreme Learning Machines[J]. Modern Electric Power, 2023, 40(5): 679-686. DOI: 10.19725/j.cnki.1007-2322.2022.0080
Citation: CHENG Yan, ZHUANG Feiyang, XU Wanwan, et al. Short-term Prediction of Photovoltaic Output Based on Improved Extreme Learning Machines[J]. Modern Electric Power, 2023, 40(5): 679-686. DOI: 10.19725/j.cnki.1007-2322.2022.0080

基于改进的极限学习机光伏出力短期预测

详细信息
    作者简介:

    成燕(1972),女,博士,副教授,研究方向为微电网运行与控制,E-mail:chengyan100@163.com

    庄飞鸯(1996),女,硕士研究生,通信作者,研究方向为微电网运行与控制,E-mail:1209035682@qq.com

    徐万万(1989),女,博士研究生,研究方向为新能源、分布式发电和微电网运行与控制,E-mail:rosywan0114@163.com

    魏婷(1996),女,硕士研究生,研究方向为用户用电行为分析,E-mail:1987048448@qq.com

  • 中图分类号: TM615

Short-term Prediction of Photovoltaic Output Based on Improved Extreme Learning Machines

  • 摘要: 针对传统极限学习机易陷入局部最优解的缺点以及环境变化导致光伏出力波动的特点,构建了一种基于自适应噪声完全集成经验模态分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)算法,结合黑猩猩优化算法优化极限学习机神经网络的光伏出力短期预测模型。首先利用CEEMDAN算法将影响光伏输出功率的关键环境因素序列进行分解,得到数据信号在不同时间尺度的局部特征,降低环境因素序列的非平稳性,然后将各分解子序列和光伏历史数据序列作为黑猩猩算法优化的极限学习机预测模型输入进行预测。最后,选用DKASC Solar Centre光伏电站数据集对不同预测模型进行验证对比。实例仿真结果表明,构建的改进光伏出力预测组合模型的各项指标预测效果更好,且适用不同环境的光伏发电预测。
    Abstract: In allusion to the defect of traditional extreme learning machine easily falling into local optimal solutions and the characteristic of environment variation leading to the fluctuation of photovoltaic (abbr. PV) output, based on complete ensemble empirical mode decomposition with adaptive noise (abbr. CEEMDAN) algorithm and combining with extreme learning machine neural network optimized by chimp optimization algorithm a short-term PV output prediction model was constructed. Firstly, by use of CEEMDAN algorithm the key environment factor series impacting PV output was decomposed to obtain the local feature of data signals in different time-scales to reduce the non-stationary of environment factor series. Secondly, taking each decomposed subseries and PV historical data series as the input of extreme learning machine prediction model optimized by the chimp algorithm the prediction was performed. Finally, the data set of DKASC Solar Centre PV station was chosen to conduct the contrast and verifying for different prediction models. Results of simulation example show that the prediction effect of each index of the constructed improved PV output prediction combined model is better and suitable to the prediction of PV generation in different environments.
  • 由于化石能源的短缺和环境污染问题,以及国家节能减排的压力,太阳能光伏作为可再生能源的一种,在中国得到快速发展[1-2]。然而受太阳辐照度、温度等环境因素的影响,光伏的输出功率本质上具有间歇性、波动性等特点,并且在大规模光伏电源接入发电系统后,影响其稳定运行以及能量管理环节中的光伏消纳率[3-6]。因此,要有效地利用影响光伏出力的关键环境因素,提高光伏功率的预测精确度。

    光伏出力预测的研究方法主要可以分为物理方法、统计方法和神经网络[7]。物理预报方法不需要历史数据,需要精确的地理、气象等实测信息和完整的光伏电池信息[8],但计算时间较长、实用性有待提高。统计预测方法是基于历史数据和目标预测数据之间的映射关系对未来光伏输出功率的预测[9],其处理动态非周期性的时间序列数据效果不佳。人工神经网络技术对非线性处理的能力符合光伏电源的变化规律,提高了光伏输出功率的预测精度[10-11]。与传统神经网络相比,极限学习机(extreme learning machines,ELM)神经网络计算速度快,对数据样本适应能力强。近年来,光伏出力预测研究取得了一些成果。文献[12]利用小波变换将光伏历史信号分解为多个频率序列,然后用深度卷积神经网络提取每个频率中的非线性特征进行预测;文献[13]加入注意力机制增强提取光伏出力数据时间特征,然后构建了长短期网络和卷积神经网络组合预测模型。上述方法仅依据光伏历史数据建立模型,没有考虑影响光伏出力的环境变量因素。文献[14]提出以综合指标选取相似日,采用列文伯格-马夸尔特(Levenberg-Marquardt,L-M)算法改进ELM神经网络的参数,获得最优模型;文献[15]采用主因子分析法筛选光伏发电的主要影响因子,并作为预测模型输入量,提高预测精度。然而由于天气条件的复杂性,上述预测模型可能无法完全提取相应的环境因素非线性特征和时间序列特征。

    因此,本文充分考虑影响光伏出力的环境因素,针对光伏出力依赖环境变化造成出力波动的特点,构建了一种基于改进的ELM的光伏输出功率短期组合预测模型。采用CEEMDAN算法对关键环境因素进行分解,降低数据的非平稳性,增加局部特征多样性,针对ELM神经网络易陷入局部最优解的缺陷,利用ChOA算法优化ELM神经网络的输入层权重和隐含层偏置。最后采用实测数据与不同预测方法进行对比分析,实现在不同天气下的光伏功率预测,验证本文提出的组合预测方法的有效性。

    本文采用DKASC Solar Centre光伏电站中的数据集,以及光伏阵区对应的环境监测仪获取得到的太阳辐照度、环境温度、环境相对湿度、风速、降雨量5种环境因素数据。

    皮尔逊相关系数通常用于2个变量之间衡量其线性相关的程度,相关性的存在为相关变量作为输入变量引入模型提供了基础[16]。因此利用皮尔逊相关系数法分析得到各环境因素信息和光伏输出功率之间的相关关系,筛选出影响光伏输出功率的关键环境因素,如公式(1)所示

    $$ \lambda = \frac{{\sum\limits_{i = 1}^n {\left( {{X_i} - \bar X} \right)\left( {{Y_i} - \bar Y} \right)} }}{{\sqrt {\sum\limits_{i = 1}^n {{{\left( {{X_i} - \bar X} \right)}^2}} \sum\limits_{i = 1}^n {{{\left( {{Y_i} - \bar Y} \right)}^2}} } }} $$ (1)

    式中:λ为变量之间的相关性系数,在[−1,1]之间;XiYi为第i个数据点的2个因素的值。

    表1为该数据集中各环境因素和光伏输出功率的相关性分析。从表1可以看出,太阳辐照度、环境温度、环境相对湿度、风速与光伏出力均具有较高的相关性,而降雨量表现为极弱相关性。综上,文中选择太阳辐照度、环境温度、环境相对湿度与风速作为关键环境因素。

    表  1  光伏功率与环境因素相关性
    Table  1.  Correlation between photovoltaic power and environmental factors
    环境因素太阳辐照度环境
    温度
    环境相关湿度风速降雨量
    相关性系数0.930.48−0.380.320.07
    下载: 导出CSV 
    | 显示表格

    由于天气变化会造成光伏出力波动较大。在天气突变时,仅仅依靠光伏功率的历史数据进行预测精度不高。因此先采用CEEMDAN算法对环境因素进行分解,对非平稳数据进行平稳化处理,得到数据在不同时间尺度上的局部特征,并作为预测模型的输入值。然后采用黑猩猩算法优化ELM输入层的连接权重与隐含层神经元的偏置,并建立预测模型,优化方法改进了ELM神经网络在训练过程中,由于训练样本过多易陷入局部最优解的缺点,提高了模型预测精度。

    CEEMDAN算法是在经验模态分解(empirical mode decomposition, EMD)算法的基础上改进的方法,适合分析波动性较大的非平稳信号。传统EMD算法[17]根据数据信号本身具有的时间尺度特性将原始的复杂信号分解为有限个本征模态函数(intrinsic mode function,IMF)。每一个IMF应满足以下条件:

    1)在整个时间范围内,局部极点和过零点的数量必须大于等于1个;

    2)在任意时刻,极值构成的上下包络线平均值必须为0。

    CEEMDAN算法通过在每一阶段IMF分解中自适应地加入白噪声,求均值并逐次迭代。克服了EMD算法容易造成模态混叠、重构误差的缺点,在非平稳环境因素信号上更具自适应性[18]

    定义Ei(·)为经过EMD算法分解后第i个IMF,$ {e_i} $为符合标准正态分布的高斯白噪声,待分解的原始环境因素数据Xt)经过CEEMDAN的第i个本征模态分量为$ \overline {{C_i}\left( t \right)} $。其分解步骤如下:

    1)在待分解环境信号Xt)中添加高斯白噪声$ X\left( t \right) + {\zeta _0}{e_i}\left( t \right) $(ζ0为白噪声系数)。新信号通过EMD进行N次分解得到N个本征模态函数Cn1,对产生的N个本征模态函数Cn1进行集成求均值得到CEEMDAN分解的第1个IMF分量,即

    $$ \overline {{C_1}\left( t \right)} = \frac{1}{N}\sum\limits_{i = 1}^N {{C_{i1}}\left( t \right)} $$ (2)

    2)计算分解第一个IMF分量后的残差序列

    $$ {R_1}\left( t \right) = X\left( t \right) - \overline {{C_1}\left( t \right)} $$ (3)

    3)在R1t)继续加入高斯白噪声$ {R_1}\left( t \right) + {\zeta _1}{E_1} \left( {{e_i}\left( t \right)} \right) $,对新信号进行N次EMD分解,得到第2个IMF分量以及剩余信号序列:

    $$ \overline {{C_2}\left( t \right)} = \frac{1}{N}\sum\limits_{i = 1}^N {{E_1}\left( {{R_1}\left( t \right) + {\zeta _1}{E_1}\left( {{e_i}\left( t \right)} \right)} \right)} $$ (4)

    4)对于k阶迭代,按照步骤2)—3)的计算方式得到k+1模态分量

    $$ {R_k}\left( t \right) = {R_{k - 1}}\left( t \right) - \overline {{C_k}\left( t \right)} $$ (5)
    $$ \overline {{C_{k + 1}}\left( t \right)} = \frac{1}{N}\sum\limits_{k = 1}^N {{E_k}\left( {{R_k}\left( t \right) + {\zeta _k}{E_k}\left( {{e_k}\left( t \right)} \right)} \right)} $$ (6)

    5)重复步骤4)直到剩余信号序列为单调函数不能继续分解,算法结束。

    $$ R\left( t \right) = X\left( t \right) - \sum\limits_{k = 1}^K {\overline {{C_k}\left( t \right)} } $$ (7)

    则原始环境因素信号Xt)可以表示为:

    $$ X\left( t \right) = R\left( t \right) + \sum\limits_{k = 1}^K {\overline {{C_k}\left( t \right)} } $$ (8)

    黑猩猩优化算法(chimp optimization algorithm, ChOA)是2020年由Khishe等人通过黑猩猩种群的社会行为启发而提出的一种较新的优化算法[19]。ChOA主要模仿黑猩猩攻击、驱动、阻挡和追逐4种行为捕获猎物来进行求解。其优点在于操作简单,调整参数少以及稳定性强。黑猩猩优化算法的数学模型描述如下。

    在黑猩猩驱动、追逐猎物的过程中,假设第一个攻击者、驱赶者、拦截者和追逐者发现猎物的位置,其他黑猩猩根据猎物的位置随机改变自身的位置,数学描述为

    $$ {\boldsymbol{s}} = \left| {{\boldsymbol{c}}{{\boldsymbol{X}}_{\text{p}}}\left( t \right) - {\boldsymbol{h}}{{\boldsymbol{X}}_{\text{c}}}\left( t \right)} \right| $$ (9)
    $$ {{\boldsymbol{X}}_{\text{c}}}\left( {t + 1} \right) = {{\boldsymbol{X}}_{\text{p}}}\left( t \right) - {\boldsymbol{as}} $$ (10)

    式中:s为猎物与黑猩猩间的距离向量;t为迭代次数;Xpt)为猎物位置向量;Xct)为黑猩猩位置向量;h为混沌映射产生的混沌向量(Chaotic_value);ac为系数向量,用下式表示

    $$ {\boldsymbol{a}} = 2f{{\boldsymbol{r}}_1} - f \text{,} {\boldsymbol{c}} = 2{{\boldsymbol{r}}_2} $$ (11)

    式中:f在优化过程中呈现线性变化,由2衰减到0;r1r2为[0,1]内的随机向量。

    在攻击过程中,由攻击黑猩猩完成狩猎过程,另3种黑猩猩通过驱动、阻拦和追逐探查猎物位置包围猎物参与狩猎行为。4种黑猩猩通过下式分别更新自己的位置,猎物位置由4个最佳个体位置估计,其他黑猩猩随机更新在4个最佳个体附近。数学模型为

    $$ \left\{ \begin{gathered} {s_{\text{a}}} = \left| {{{\boldsymbol{c}}_1}{{\boldsymbol{X}}_{\text{a}}} - {{\boldsymbol{h}}_1}{\boldsymbol{X}}} \right| \\ {s_{\text{b}}} = \left| {{{\boldsymbol{c}}_2}{{\boldsymbol{X}}_{\text{b}}} - {{\boldsymbol{h}}_2}{\boldsymbol{X}}} \right| \\ {s_{\text{c}}} = \left| {{{\boldsymbol{c}}_3}{{\boldsymbol{X}}_{\text{c}}} - {{\boldsymbol{h}}_3}{\boldsymbol{X}}} \right| \\ {s_{\text{d}}} = \left| {{{\boldsymbol{c}}_4}{{\boldsymbol{X}}_{\text{d}}} - {{\boldsymbol{h}}_4}{\boldsymbol{X}}} \right| \\ \end{gathered} \right. $$ (12)
    $$ \left\{ \begin{gathered} {{\boldsymbol{X}}_1} = {{\boldsymbol{X}}_{\text{a}}} - {{\boldsymbol{a}}_1}{s_{\text{a}}} \\ {{\boldsymbol{X}}_2} = {{\boldsymbol{X}}_{\text{b}}} - {{\boldsymbol{a}}_2}{s_{\text{b}}} \\ {{\boldsymbol{X}}_3} = {{\boldsymbol{X}}_{\text{c}}} - {{\boldsymbol{a}}_3}{s_{\text{c}}} \\ {{\boldsymbol{X}}_4} = {{\boldsymbol{X}}_{\text{d}}} - {{\boldsymbol{a}}_4}{s_{\text{d}}} \\ \end{gathered} \right. $$ (13)
    $$ {\boldsymbol{X}}\left( {t + 1} \right) = \frac{{{{\boldsymbol{X}}_1} + {{\boldsymbol{X}}_2} + {{\boldsymbol{X}}_3} + {{\boldsymbol{X}}_4}}}{4} $$ (14)

    式中:sasbscsd分别为当前4类最佳黑猩猩与猎物的间距;XaXbXcXd分别为当前4类黑猩猩相对于猎物的位置向量;ala4h1h4clc4分别为4类黑猩猩的系数向量;X1X2X3X4分别为更新后的黑猩猩位置向量;X为其他黑猩猩位置向量。

    种群在狩猎的最后阶段,随后的社会动机(性动机)会使黑猩猩不顾个人职责而陷入混乱的抢食状态。这一混乱行为有助于ChOA在迭代后期避免陷入局部最优问题。在迭代过程中,假设黑猩猩以同等概率选择黑猩猩正常位置或通过混沌模型生成位置。数学模型表示为

    $$ {{\boldsymbol{X}}}_{\text{c}}\left(t+1\right)=\begin{cases}\begin{array}{l}{{\boldsymbol{X}}}_{\text{p}}\left(t\right)-{\boldsymbol{as}}\text{,}\mu \le 0.5\\ Chaotic\_value\text{,}\mu > 0.5\end{array}\end{cases} $$ (15)

    式中:μ为[0,1]内随机值。

    ELM神经网络随机生成网络的输入权值与隐含层偏置,在训练中只需要设置隐含层神经元的个数便得到唯一的全局最优解,克服了传统单隐层前馈神经网络训练速度慢、易陷入局部极值等缺陷[20-21]。ELM的网络结构如图1所示。

    图  1  ELM结构图
    Figure  1.  Structure chart of ELM

    图1可以看出,假设有N个样本$ \left( {{X_i},{T_i}} \right) $,其中$ {X_i} = {\left[ {{X_{i1}},{X_{i2}}, \cdots ,{X_{im}}} \right]^{\rm{T}}} $,$ {T_i} = {\left[ {{T_{i1}},{T_{i2}}, \cdots ,{T_{im}}} \right]^{\rm{T}}} $。则对于一个含有i个隐含层的ELM神经网络的输出为

    $$ {Y_j} = \sum\limits_{i = 1}^n {{\beta _i}G\left( {{\omega _i}{X_j} + {v_i}} \right)} ,\;\;j = 1,2, \cdots ,n $$ (16)

    式中:ωiβj分别为输入层、输出层与隐含层间的权重;vi为隐含层偏置;Gx)为激活函数。

    $$ {{\boldsymbol{H}}_{\omega ,v,{{X}}}}\beta = {\boldsymbol{T}} $$ (17)

    式中:T为期望输出向量;$ {H_{\omega ,v,x}} $为隐含层的输出矩阵,可表示为

    $$ {{\boldsymbol{H}}_{\omega ,v,X}} = \left[ {\begin{array}{*{20}{c}} {G\left( {{\omega _1}{X_1} + {v_1}} \right)}& \cdots &{G\left( {{\omega _i}{X_1} + {v_i}} \right)} \\ \vdots & \ddots & \vdots \\ {G\left( {{\omega _1}{X_n} + {v_1}} \right)}& \cdots &{G\left( {{\omega _i}{X_n} + {v_i}} \right)} \end{array}} \right] $$ (18)

    应用下式求解输出权重β*

    $$ {\beta ^ * } = {{\boldsymbol{H}}^ + }{\boldsymbol{T}} $$ (19)

    式中:H+是矩阵H的广义摩尔逆(Moore-Penrose)。

    由于环境因素,比如:辐照度、温度等对光伏出力有很大的影响,因此本文首先使用CEEMDAN算法对原始环境序列数据进行分解得到局部特征,然后用由ChOA优化后的ELM神经网络进行预测,具体步骤如下:

    1)对光伏功率和环境因素数据进行数据清洗,以天为单位剔除由于故障等原因而导致数据为0的“坏数据”;

    2)通过CEEMDAN算法对原始环境序列数据进行分解,得到每种环境因素的IMF分量,以此来突显原始环境序列中不同时间尺度特征;

    3)使用ChOA优化ELM神经网络的输入层连接权重和隐含层偏置参数,构造预测模型;

    4)将CEEMDAN分解后的环境数据以及光伏功率数据进行归一化,转化成适用于改进后的ELM神经网络数据集,并分别进行预测;

    5)叠加子序列的预测结果并验证预测模型的准确性。组合预测方法流程如图2所示。

    图  2  预测方法流程图
    Figure  2.  The flowchart of prediction idea

    CEEMDAN参数设置及分解结果:白噪声系数ζ0和每次迭代EMD分解次数N是非常重要的参数,根据试验验证,当ζ0=0.2,N=500时,预测模型效果最佳。图3是环境因素中选取部分太阳辐照度样本数据的分解结果,可以看出该分解算法能有效地获得信号的频率分量。

    图  3  部分太阳辐照度样本分解结果
    Figure  3.  Decomposition results of partial solar irradiance samples

    表2中数据为经CEEMDAN算法对4种环境数据分解后,得到的每种环境因素的IMF分量,共计61个和4个剩余分量R,共计65维特征序列作为新的输入序列集合。

    表  2  分解环境数据得到的IMF分量及剩余分量数量
    Table  2.  The number of IMF components and remaining components obtained by decomposing environmental data
    环境因素数据IMF分量剩余分量R
    太阳辐照度151
    环境温度161
    环境相对湿度161
    风速141
    下载: 导出CSV 
    | 显示表格

    ChOA参数设定:黑猩猩初始种群规模为30,最大迭代次数为100。

    ELM网络结构:ELM随机初始化输入层与隐含层连接权重,范围为(−1,1)和隐含层偏置,范围为(0,1)。经过迭代,最佳隐含层为29。

    本文以光伏电站实际功率和环境数据作为预测模型的原始数据,其中选取太阳辐照度、环境温度、环境相对湿度、风速作为环境因素。为了保证数据量纲一致,处理方便,使程序运行收敛加快,在环境数据输入预测模型前,采用min-max标准化方法通过式(20)将数据归一化处理。

    $$ {X_i}^\prime = \frac{{{X_i} - {X_{\min }}}}{{{X_{\max }} - {X_{\min }}}} $$ (20)

    式中:Xi′为标准化后的数据;XminXmax分别为原始数据的最小值和最大值。

    本文选取3个指标用于评估预测模型的预测性能和数据特征,包括平均绝对值误差(EMAE),均方根误差(ERMSE)和拟合优度(R2)。其中EMAEE RMSE越小,表明预测结果的精确度越高,R2的值越接近于1,预测结果越准确。其定义如下:

    $$ {E_{{\text{MAE}}}} = \frac{1}{m}\sum\limits_{i = 1}^m {\left| {{y_i} - {{\hat y}_i}} \right|} $$ (21)
    $$ {E_{{\text{RMSE}}}} = \sqrt {\frac{1}{m}\sum\limits_{i = 1}^m {{{\left( {{y_i} - {{\hat y}_i}} \right)}^2}} } $$ (22)
    $$ {R^2} = 1 - \frac{{\sum\limits_{i = 1}^m {{{\left( {{y_i} - {{\hat y}_i}} \right)}^2}} }}{{\sum\limits_{i = 1}^m {{{\left( {{{{y_i} - \sum\limits_{i = 1}^m {{y_i}} } \mathord{\left/ {\vphantom {{{y_i} - \sum\limits_{i = 1}^m {{y_i}} } m}} \right. } m}} \right)}^2}} }} \times 100\% $$ (23)

    式中:yi为真实光伏功率值;$ {\hat y_i} $为预测值;m为测试样本集的数量。

    文中选取DKASC Solar Centre中某光伏电站2020年1月1日至2020年10月30日每天7:00—18:00光伏历史输出功率和对映的环境信息作为本研究的数据集,时间间隔为5 min,并把后20%的数据集作为测试集。

    为了验证文中提出的CEEMDAN-ChOA-ELM组合预测模型方法的优越性以及CEEMDAN算法的有效性,进而说明所构建模型对光伏出力预测精度有提升作用,分别与CEEMDAN-ELM神经网络预测模型、ChOA-ELM神经网络预测模型进行预测对比。同时,采用传统反向传播(back propagation,BP)神经网络预测模型与单一ELM神经网络预测模型进行对比分析。

    表3为上述各模型在测试样本数据集中的预测效果对比,由于ELM神经网络自适应输入层的权重与隐含层的偏置参数,对样本的适应能力强,在输入变量一致的情况下,与传统BP神经网络和单一ELM神经网络预测模型相比,采用ChOA优化的ELM神经网络预测模型各项指标均好于单一ELM神经网络和BP神经网络预测模型。CEEMDAN-ELM预测模型随着测试样本的增多,特征过多,ELM容易产生过拟合,预测效果下降,但是当采用CEEMDAN-ChOA-ELM组合预测模型后,EMAEERMSE与单一ELM神经网络预测模型相比分别降低了3.14%和2.74%。与BP神经网络预测模型相比降低了5.12%和4.84%。与ChOA-ELM神经网络预测模型相比降低了2.15%和1.88%。R2则分别增加了0.59%、1.08%、0.36%。由此可以看出,本文选用的CEEMDAN-ChOA-ELM神经网络组合预测模型有较好的预测效果。

    表  3  各模型测试集预测指标对比
    Table  3.  Comparison of predictive indicators of each model in test set
    预测模型EMAE/%ERMSE/%R2/%
    BP23.6131.3696.21
    ELM21.6329.2696.70
    ChOA-ELM20.6428.4096.93
    CEEMDAN-ELM53.2675.8277.82
    CEEMDAN-ChOA-ELM18.4926.5297.29
    下载: 导出CSV 
    | 显示表格

    为了更清楚地展示文章中选用的预测模型的预测效果,从测试数据中抽取2020年10月1号(晴天)和2020年9月21号(多云)的数据进行预测展示,分别采用上文提出的4种预测模型与本文提出的CEEMDAN-ChOA-ELM预测模型验证在晴天和多云天气下的预测精度。图4( a)与(b)分别为晴天和多云天气下的5个模型预测对比图。表4表5分别为晴天和多云天气下的各项指标对比。由图4可以看出,在晴天天气下,由于环境波动不大,光伏出力较为稳定,5个预测模型预测效果都较好,但是本文采用的CEEMDAN-ChOA-ELM神经网络预测模型EMAEERMSE为6.55%和7.91%,拟合优度达到99.72%,预测精度和各项指标更好。在多云天气下,由于太阳受到云层遮挡,太阳辐照度有较大变化,5个预测模型各项指标均有所下降,但是由于本文采用的预测模型,对环境因素进行特征分解提取,预测精度和各项预测指标较其他4种预测模型更好,适合环境多变的光伏出力预测。

    图  4  晴天和多云天气下各种预测模型结果对比
    Figure  4.  Comparison of results from various prediction models under sunny and cloudy weather conditions
    表  4  晴天天气下各模型预测指标对比
    Table  4.  Comparison of predictive indicators of various models in sunny weather
    预测模型EMAE/%ERMSE/%R2/%
    BP19.3622.5297.73
    ELM16.4217.5198.63
    ChOA-ELM15.4216.6499.01
    CEEMDAN-ELM28.5934.2894.74
    CEEMDAN-ChOA-ELM6.557.9199.72
    下载: 导出CSV 
    | 显示表格
    表  5  多云天气下各模型预测指标对比
    Table  5.  Comparison of predictive indicators of various models in cloudy weather
    预测模型EMAE/%ERMSE/%R2/%
    BP31.435.1693.37
    ELM21.7625.5896.49
    ChOA-ELM19.3422.7597.23
    CEEMDAN-ELM45.654.8783.86
    CEEMDAN-ChOA-ELM12.6315.5398.71
    下载: 导出CSV 
    | 显示表格

    1)本文利用CEEMDAN算法将4种关键环境因素序列进行分解,克服了传统EMD算法重构误差的缺陷,将原始环境序列分解为不同特征的模态分量和剩余分量,得到环境序列数据中不同时间尺度特征。

    2)CEEMDAN-ChOA-ELN神经网络预测模型在测试数据集中的预测精度最高,预测效果最好。并且在晴天天气下拟合优度达到99.72%,在环境波动大的多云天气下各预测模型中预测效果最好。该组合预测模型适合环境多变的天气。

    致 谢

    本文得到了冶金自动化检测技术教育部工程研究中心开放基金的资助,在此表示感谢。

  • 图  1   ELM结构图

    Figure  1.   Structure chart of ELM

    图  2   预测方法流程图

    Figure  2.   The flowchart of prediction idea

    图  3   部分太阳辐照度样本分解结果

    Figure  3.   Decomposition results of partial solar irradiance samples

    图  4   晴天和多云天气下各种预测模型结果对比

    Figure  4.   Comparison of results from various prediction models under sunny and cloudy weather conditions

    表  1   光伏功率与环境因素相关性

    Table  1   Correlation between photovoltaic power and environmental factors

    环境因素太阳辐照度环境
    温度
    环境相关湿度风速降雨量
    相关性系数0.930.48−0.380.320.07
    下载: 导出CSV

    表  2   分解环境数据得到的IMF分量及剩余分量数量

    Table  2   The number of IMF components and remaining components obtained by decomposing environmental data

    环境因素数据IMF分量剩余分量R
    太阳辐照度151
    环境温度161
    环境相对湿度161
    风速141
    下载: 导出CSV

    表  3   各模型测试集预测指标对比

    Table  3   Comparison of predictive indicators of each model in test set

    预测模型EMAE/%ERMSE/%R2/%
    BP23.6131.3696.21
    ELM21.6329.2696.70
    ChOA-ELM20.6428.4096.93
    CEEMDAN-ELM53.2675.8277.82
    CEEMDAN-ChOA-ELM18.4926.5297.29
    下载: 导出CSV

    表  4   晴天天气下各模型预测指标对比

    Table  4   Comparison of predictive indicators of various models in sunny weather

    预测模型EMAE/%ERMSE/%R2/%
    BP19.3622.5297.73
    ELM16.4217.5198.63
    ChOA-ELM15.4216.6499.01
    CEEMDAN-ELM28.5934.2894.74
    CEEMDAN-ChOA-ELM6.557.9199.72
    下载: 导出CSV

    表  5   多云天气下各模型预测指标对比

    Table  5   Comparison of predictive indicators of various models in cloudy weather

    预测模型EMAE/%ERMSE/%R2/%
    BP31.435.1693.37
    ELM21.7625.5896.49
    ChOA-ELM19.3422.7597.23
    CEEMDAN-ELM45.654.8783.86
    CEEMDAN-ChOA-ELM12.6315.5398.71
    下载: 导出CSV
  • LIU Hongfei, GAO Qian, MA Pengcheng. Photovoltaic generation power prediction research based on high quality context ontology and gated recurrent neural network[J]. Sustainable Energy Technologies and Assessments, 2021, 45(16): 2213−1388.

    龚莺飞, 鲁宗相, 乔颖, 等. 光伏功率预测技术[J]. 电力系统自动化, 2016, 40(4): 140−151. doi: 10.7500/AEPS20150711003

    GONG Yinfei, LU Zongxiang, QIAO Ying, et al. Photovoltaic power prediction technology[J]. Automation of Electric Power Systems, 2016, 40(4): 140−151(in Chinese). doi: 10.7500/AEPS20150711003

    BERMUDEZ-GARCIA A, VOARINO P, RACCURT O et al. Environments, needs and opportunities for future space photovoltaic power generation: A review[J]. Applied Energy, 2021, 290(15): 2906−2916.

    管霖, 赵琦, 周保荣, 等. 基于多尺度聚类分析的光伏功率特性建模及预测应用[J]. 电力系统自动化, 2018, 42(15): 24−30. doi: 10.7500/AEPS20171027003

    GUAN Lin, ZHAO Qi, ZHOU Baorong, et al. Multi-scale clustering analysis based modeling of photovoltaic power characteristics and its application in prediction[J]. Automation of Electric Power Systems, 2018, 42(15): 24−30(in Chinese). doi: 10.7500/AEPS20171027003

    BRI-MATHIAS H, MARTINEZ-ANIDO B, CARLO, et al. The combined value of wind and solar power forecasting improvements and electricity storage[J]. Applied Energy, 2018, 214(15): 1−15.

    黄予春, 曹成涛, 顾海. 基于IKFCM与多模态SSO优化SVR的光伏发电短期预测[J]. 电力系统保护与控制, 2018, 46(24): 102−109. doi: 10.7667/PSPC171782

    HUANG Yuchun, CAO Chengtao, GU Hai. Short-term photovoltaic power generation prediction based on IKFCM and multi-modes SSO optimization SVR[J]. Power System Protection and Control, 2018, 46(24): 102−109(in Chinese). doi: 10.7667/PSPC171782

    WANG Kejun, QI Xiaoxia, LIU Hongda. A comparison of day-ahead photovoltaic power forecasting models based on deep learning neural network[J]. Applied Energy, 2019, 251(1): 1−14.

    GU Wenbo, MA Tao, SONG Aotian, et al. Mathematical modelling and performance evaluation of a hybrid photovoltaic-thermoelectric system[J]. Energy Conversion and Management, 2019, 198(15): 1−13.

    SHARADGA H, HAJIMIRZA S, BALOG R S. Time series forecasting of solar power generation for large-scale photovoltaic plants[J]. Renewable Energy, 2020, 150(12): 797−807.

    CERVONE G, HARDING L C, ALESSANDRINI S, et al. Short-term photovoltaic power forecasting using artificial neural networks and an analog ensemble[J]. Renewable Energy, 2017, 108(1): 274−286.

    王新普, 周想凌, 邢杰, 等. 一种基于改进灰色BP神经网络组合的光伏发电预测方法[J]. 电力系统保护与控制, 2016, 44(18): 81−87. doi: 10.7667/PSPC151675

    WANG Xinpu, ZHOU Xiangling, XING Jie, et al. A prediction method of PV output power based on the combination of improved grey back propagation neural network[J]. Power System Protection and Control, 2016, 44(18): 81−87(in Chinese). doi: 10.7667/PSPC151675

    WANG Huaizhi, YI Haiyan, PENG Jianchun, et al. Deterministic and probabilistic forecasting of photovoltaic power based on deep convolutional neural network[J]. Energy Conversion and Management, 2017, 153(1): 409−422.

    崔佳豪, 毕利. 基于混合神经网络的光伏电量预测模型的研究[J]. 电力系统保护与控制, 2021, 49(13): 142−149. doi: 10.19783/j.cnki.pspc.201117

    CUI Jiahao, BI Li. Research on photovoltaic power forecasting model based on hybrid neural network[J]. Power System Protection and Control, 2021, 49(13): 142−149(in Chinese). doi: 10.19783/j.cnki.pspc.201117

    王琦, 季顺祥, 钱子伟, 等. 基于熵理论和改进ELM的光伏发电功率预测[J]. 太阳能学报, 2020, 41(10): 151−158.

    WANG Qi, JI Shunxiang, QIAN Ziwei, et al. Photovoltaic power prediction based on entropy theory and improved ELM[J]. Acta Energiae Solaris Sinica, 2020, 41(10): 151−158(in Chinese).

    左远龙, 黄玉水, 杨晓辉, 等. 基于PFA-MBAS-BP神经网络模型的光伏发电短期预测[J]. 电力系统保护与控制, 2020, 48(15): 84−91.

    ZUO Yuanlong, HUANG Yushui, YANG Xiaohui, et al. Short-term prediction of photovoltaic power generation based on a PFA-MBAS-BP neural network model[J]. Power System Protection and Control, 2020, 48(15): 84−91(in Chinese).

    张雲钦, 程起泽, 蒋文杰, 等. 基于EMD-PCA-LSTM的光伏功率预测模型[J]. 太阳能学报, 2021, 42(9): 62−69.

    ZHANG Yunqin, CHENG Qize, JIANG Wenjie, et al. Photovoltaic power prediction model based on EMD-PCA-LSTM[J]. Acta Energiae Solaris Sinica, 2021, 42(9): 62−69(in Chinese).

    HUANG N E, SHEN Zheng, LONG S R, et al. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J]. Proceedings Mathematical Physical & Engineering Sciences, 1998, 454(1971): 903−995.

    COLOMINAS M A, SCHLOTTHAUER G, TORRES M E, et al. Noise-assisted EMD methods in action[J]. Advances in Adaptive Data Analysis, 2012, 4(4): 1−11.

    KHISHE M, MOSAVI M R. Chimp optimization algorithm[J]. Expert Systems with Applications, 2020, 149(1): 1−14.

    HUANG, Guangbin, ZHU Qinyu, SIEW C K. Extreme learning machine: Theory and applications[J]. Neurocomputing, 2006, 70(1-3): 489−501. doi: 10.1016/j.neucom.2005.12.126

    田宏伟, 李志鹏, 王煜伟, 等. CEEMDAN-WOA-ELM模型风机振动趋势预测[J]. 中国测试, 2020, 46(7): 146-152.

    TIAN Hongwei, LI Zhipeng, WANG Yuwei, et al. Fan vibration trend prediction based on CEEMDAN-WOA-ELM model[J]. China Measurement &Testing Technology, 2020, 46(7): 146-152(in Chinese).

  • 期刊类型引用(3)

    1. 席磊,董璐,程琛,田习龙,李宗泽. 基于混合黑猩猩优化极限学习机的电力信息物理系统虚假数据注入攻击定位检测. 电力系统保护与控制. 2024(14): 46-58 . 百度学术
    2. 张赟宁,魏广军. 考虑特征选择的短期光伏功率组合预测模型. 电力系统及其自动化学报. 2024(08): 122-132 . 百度学术
    3. 邓序之,刘淇,叶傲霜,许佳时,杨王旺,王玺,应文韬,邵佳佳,李芝娟,陈小毅. 基于气象耦合特征分析及改进XGBoost算法的用户分布式光伏短期出力预测模型. 南方电网技术. 2023(12): 80-89 . 百度学术

    其他类型引用(2)

图(4)  /  表(5)
计量
  • 文章访问数:  201
  • HTML全文浏览量:  31
  • PDF下载量:  104
  • 被引次数: 5
出版历程
  • 收稿日期:  2022-03-15
  • 录用日期:  2022-06-29
  • 网络出版日期:  2023-04-19
  • 发布日期:  2023-10-09

目录

/

返回文章
返回