留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于主成分分析和谱聚类的短期风功率预测

梅睿 吕志勇 顾文 杨宏宇 肖鹏

梅睿, 吕志勇, 顾文, 等. 基于主成分分析和谱聚类的短期风功率预测[J]. 现代电力, 2023, 40(1): 35-41. doi: 10.19725/j.cnki.1007-2322.2021.0269
引用本文: 梅睿, 吕志勇, 顾文, 等. 基于主成分分析和谱聚类的短期风功率预测[J]. 现代电力, 2023, 40(1): 35-41. doi: 10.19725/j.cnki.1007-2322.2021.0269
MEI Rui, LÜ Zhiyong, GU Wen, etc. Short-term Wind Power Prediction Based on Principal Component Analysis and Spectral Clustering[J]. Modern Electric Power, 2023, 40(1): 35-41. doi: 10.19725/j.cnki.1007-2322.2021.0269
Citation: MEI Rui, LÜ Zhiyong, GU Wen, etc. Short-term Wind Power Prediction Based on Principal Component Analysis and Spectral Clustering[J]. Modern Electric Power, 2023, 40(1): 35-41. doi: 10.19725/j.cnki.1007-2322.2021.0269

基于主成分分析和谱聚类的短期风功率预测

doi: 10.19725/j.cnki.1007-2322.2021.0269
详细信息
    作者简介:

    梅睿(1993),女,硕士,工程师,从事新能源涉网试验相关研究,E-mail:merrymr@163.com

    吕志勇(1998),男,硕士,研究方向为风电并网相关技术,E-mail:845905287@qq.com

    顾文(1969),男,高级工程师,研究方向为电能质量及新能源网源协调技术,E-mail:wengu@sina.com

  • 中图分类号: TM614

Short-term Wind Power Prediction Based on Principal Component Analysis and Spectral Clustering

图(10) / 表 (1)
计量
  • 文章访问数:  118
  • HTML全文浏览量:  21
  • PDF下载量:  26
  • 被引次数: 0
出版历程
  • 收稿日期:  2021-10-07
  • 录用日期:  2022-02-22
  • 刊出日期:  2023-01-16

基于主成分分析和谱聚类的短期风功率预测

doi: 10.19725/j.cnki.1007-2322.2021.0269
    作者简介:

    梅睿(1993),女,硕士,工程师,从事新能源涉网试验相关研究,E-mail:merrymr@163.com

    吕志勇(1998),男,硕士,研究方向为风电并网相关技术,E-mail:845905287@qq.com

    顾文(1969),男,高级工程师,研究方向为电能质量及新能源网源协调技术,E-mail:wengu@sina.com

  • 中图分类号: TM614

摘要: 风电场的大规模建设使得风电渗透率大大提高,为保证系统的安全稳定运行及风电消纳,需要对风电功率进行预测。为解决传统预测方法中数据维度过高的问题,提出一种基于主成分分析和谱聚类进行数据降维的预测方法。首先,基于主成分分析提取风电场各机组功率序列的主成分,实现对功率样本信息和预测对象的降维;其次,考虑风速波动特性和各机组的空间分布特征,对风速信息进行谱聚类,以实现样本数据的进一步降维;然后,基于风功率主成分信息与风速聚类结果,建立基于Elman神经网络的风电功率主成分预测模型,并通过逆变换最终得到风电场各机组功率的预测结果。利用江苏南通某海上风电场实际数据验证该方法,结果表明,预测结果的均方根误差明显降低,所提方法可以提高风电功率预测精度。

English Abstract

梅睿, 吕志勇, 顾文, 等. 基于主成分分析和谱聚类的短期风功率预测[J]. 现代电力, 2023, 40(1): 35-41. doi: 10.19725/j.cnki.1007-2322.2021.0269
引用本文: 梅睿, 吕志勇, 顾文, 等. 基于主成分分析和谱聚类的短期风功率预测[J]. 现代电力, 2023, 40(1): 35-41. doi: 10.19725/j.cnki.1007-2322.2021.0269
MEI Rui, LÜ Zhiyong, GU Wen, etc. Short-term Wind Power Prediction Based on Principal Component Analysis and Spectral Clustering[J]. Modern Electric Power, 2023, 40(1): 35-41. doi: 10.19725/j.cnki.1007-2322.2021.0269
Citation: MEI Rui, LÜ Zhiyong, GU Wen, etc. Short-term Wind Power Prediction Based on Principal Component Analysis and Spectral Clustering[J]. Modern Electric Power, 2023, 40(1): 35-41. doi: 10.19725/j.cnki.1007-2322.2021.0269
    • 随着“碳达峰”和“碳中和”目标的提出,电力行业成为了构建清洁低碳能源体系和推动绿色低碳发展的主力军。在目前众多可再生能源开发中,风力发电因其具有清洁安全、储量大、成本低廉等优势,受到了各国的普遍重视。截至2021年7月底,我国非化石能源发电装机容量10.3亿kW,其中风电装机容量2.9亿kW[1-2]。伴随着风电大规模并入电网,其随机性和波动性会给电网带来一定的冲击,威胁电网安全。因此,精准的风电功率预测对于保持电网的安全稳定具有十分重要的作用[3]

      目前,风电功率预测方法主要分为基于数值天气预报(numerical weather prediction,NWP)的物理方法和统计方法两大类。物理方法对大气运动的热力和物理过程进行建模来预报未来的天气变化,从而预测风速或风电功率[4-6]。物理模型大多较为复杂,求解起来比较困难,因此,一系列统计方法被学者提出。统计方法基于历史数据构建预测模型,从而进行预测,比较常见的有时间序列法、卡尔曼滤波法[7]、支持向量机和人工神经网络。统计方法对于大气环境的物理特性关注较少,主要挖掘历史数据与未来数据之间的映射关系来预测风电功率。其中,泛化能力较强的神经网络被广泛应用于预测随机性和波动性较强的风电功率。文献[8]对历史风速数据进行小波包分解,基于Elman神经网络分别预测不同频段的风速相加到合成风速,最后通过功率和风速转换曲线得到预测功率。文献[9]将神经网络和时间序列模型进行线性组合,改变权重使得预测误差最小,从而获得风速,并通过风电功率曲线得到预测功率。上述两种方法均应用了间接方法对风电功率进行了预测,但由于曲线本身存在着一定误差,因此导致预测精度不高,具有一定的局限性。文献[10]提出了一种基于神经扩展分析的时间序列预测模型用于风电功率预测,该方法是一种深度神经网络方法,可以显著减小预测误差。文献[11]针对风电场集群利用卷积神经网络(convolutional neural networks,CNN)提取其关键特征,并通过长短期记忆(long short-term memory,LSTM)神经网络建立特征与风电功率的映射关系,从而对风电场集群进行功率预测。文献[12]首先利用变分模式分解(variational mode decomposition,VMD)将功率序列分解,然后选择特征,基于极限学习机(extreme learning machine,ELM)对所选特征进行训练,将所有模式的预测值相加来获得风电场功率,该方法在预测精度和计算效率上具有一定的优越性。文献[13]利用VMD对时间序列分解后,基于核正则化伪逆神经网络对风电功率进行了预测,并提出了该方法的简化模型,在保证预测精度的前提下,可以显著减少计算时间。

      预测精度除了受模型本身影响之外,还与数据的预处理有关,数据的维度过高会增加模型的计算负担,导致预测效果不理想。常用的数据处理方法有小波分解、聚类、主成分分析等。文献[14]利用经验正交函数(empirical orthogonal function,EOF)分解对风电功率序列进行分析,基于分析结果进行层次聚类从而划分区域,在每个区域中选取代表风电场进行升尺度预测。该方法中,划分的区域越多,预测精度越高,但存在饱和效应。文献[15]对风电功率进行EOF分解后,根据累计方差贡献率将机组分为两类,基于神经网络分别建立预测模型。文献[16]利用小波变换和主成分分析对风速进行处理,采用谱聚类进行分类,最后基于ELM进行预测。文献[17]同时考虑电动公交车负荷曲线距离和形态的相似性,利用谱聚类对负荷进行分类,并基于LSTM神经网络分别建立预测模型。文献[18]通过挖掘时间序列中的相似性,利用谱聚类选取代表风机,最后基于最小二乘支持向量机进行升尺度预测。

      针对风电机组较多的大规模风电场,目前的风电功率预测方法所使用的数据具有很高的维度,给拟合带来了一定困难,为解决该问题,本文提出一种利用主成分分析和谱聚类进行数据降维的风电功率预测方法。

    • 主成分分析(principal component analysis, PCA)可以在保留原数据大部分信息的前提下,将高维数据映射到少数几个维度,达到降维的目的,从而减小计算的负担。利用历史功率序列进行预测时,数据具有较高的维度,而且变量之间存在着耦合关系,给计算带来了困难,主成分分析可以突出对结果影响最大的因素,减小数据的维度,降低模型的复杂度。

      主成分分析与应用背景无关,是一种单纯的数学方法,可用于处理风电功率序列。假设风电场有$a$台机组,每台机组有$b$个时间点的历史功率数据,该风电场的功率序列可以写成如下的矩阵形式:

      $$ {\boldsymbol{X}} = [{{\boldsymbol{x}}_1},{{\boldsymbol{x}}_2}, \cdots ,{{\boldsymbol{x}}_b}] = {\left[ {\begin{array}{*{20}{c}} {{x_{11}}}& \cdots &{{x_{1b}}} \\ \vdots & \ddots & \vdots \\ {{x_{a1}}}& \ldots &{{x_{ab}}} \end{array}} \right]_{a \times b}} $$ (1)

      式中:${{\boldsymbol{x}}_1},{{\boldsymbol{x}}_2}, \cdots ,{{\boldsymbol{x}}_b}$为每个时间点所有机组功率构成的列向量,维数为$a$,主成分分析是将${\boldsymbol{X }}$分解为主成分矩阵${\boldsymbol{T}}$和空间特征${\boldsymbol{V}}$

      $$ {\boldsymbol{X }}= {\boldsymbol{V}}{\boldsymbol{T}} $$ (2)

      具体步骤如下。

      1)首先对风电功率时间序列${\boldsymbol{X}}$进行距平化处理生成矩阵${\boldsymbol{Y}}$,矩阵${\boldsymbol{Y}}$中的第$i$行第$j$列元素为:

      $$ {y_{ij}} = {x_{ij}} - {\bar x_i},{\text{ }}i = 1,2, \cdots ,a;{\text{ }}j = 1,2, \cdots ,b $$ (3)

      式中:${x_{ij}}$为原矩阵第$i$行第$j$列元素;${\bar x_i}$为原矩阵第$i$行数据的平均值;$a$为机组数量;$b$为时间序列长度。

      2)计算${\boldsymbol{Y}}$的协方差矩阵

      $$ {\boldsymbol{R }}= {\boldsymbol{Y}}{{\boldsymbol{Y}}^{\rm{T}}} $$ (4)

      3)计算矩阵${\boldsymbol{R}}$的特征值和特征向量,特征值按大小排列,使${\lambda _1} \geqslant {\lambda _2} \geqslant \cdots \geqslant {\lambda _a} \geqslant 0$,对应的特征向量做相应的变动$ {{\boldsymbol{v}}_1},{{\boldsymbol{v}}_2}, \cdots ,{{\boldsymbol{v}}_a}$,其中$ {{\boldsymbol{v}}_1},{{\boldsymbol{v}}_2}, \cdots ,{{\boldsymbol{v}}_a}$即为原始矩阵的空间特征。

      4)计算方差贡献率,确定选取主成分数量,计算时采用特征值表示方差大小

      $$ {\delta _i} = \frac{{{\lambda _i}}}{{\sum\limits_{i = 1}^a {{\lambda _i}} }} \times 100\% $$ (5)

      方差贡献率的大小代表了对原始矩阵的描述能力,值越大则包含原始矩阵的信息越多,其还原能力越强。前$k$个方差贡献率之和为前$k$个主成分的累计贡献率,值越大则利用前$k$个主成分还原的矩阵与原矩阵越接近。

      因此,可以通过设置阈值选取累计贡献率达到阈值的前$k$个特征向量$ {{\boldsymbol{v}}_1},{{\boldsymbol{v}}_2}, \cdots ,{{\boldsymbol{v}}_k}$构成空间特征$\boldsymbol V $,前$k$个主成分$ {{\boldsymbol{t}}_1},{{\boldsymbol{t}}_2}, \cdots ,{{\boldsymbol{t}}_k}$形成$\boldsymbol T $

      $$ {\boldsymbol{V}} = [{{\boldsymbol{v}}_1}, \cdots ,{{\boldsymbol{v}}_k}] = {\left[ {\begin{array}{*{20}{c}} {{v_{11}}}& \cdots &{{v_{1k}}} \\ \vdots & \ddots & \vdots \\ {{v_{a1}}}& \ldots &{{v_{ak}}} \end{array}} \right]_{a \times k}} $$ (6)
      $$ {\boldsymbol{T}} = \left[ {\begin{array}{*{20}{c}} {{{\boldsymbol{t}}_1}} \\ \vdots \\ {{{\boldsymbol{t}}_k}} \end{array}} \right] = {\left[ {\begin{array}{*{20}{c}} {{t_{11}}}& \cdots &{{t_{1b}}} \\ \vdots & \ddots & \vdots \\ {{t_{k1}}}& \ldots &{{t_{kb}}} \end{array}} \right]_{k \times b}} = [{{\boldsymbol{y}}_1}, \cdots ,{{\boldsymbol{y}}_b}] $$ (7)

      式中:$ {\boldsymbol{y}_1}, \cdots ,{\boldsymbol{y}_b} $均为$k$维向量;$ {{\boldsymbol{v}}_1},\cdots ,{{\boldsymbol{v}}_k}$均为$a$维向量。

      将主成分作为预测对象,预测下一时间点的$y$

      $$ {\boldsymbol{y}_t} = f[{\boldsymbol{y}_{t - 1}},{\boldsymbol{y}_{t - 2}}, \cdot \cdot \cdot ,{\boldsymbol{y}_{t - n}}] $$ (8)

      式中:$n$为延迟数。

      预测后的结果${y_t}$经过逆变换即可得到风电功率预测值

      $$ {\boldsymbol{p}}_t^* = {\boldsymbol{V}}{{\boldsymbol{y}}_t} $$ (9)
      $$ {\boldsymbol{p}_t} = \boldsymbol{p}_t^* + \bar x$$ (10)

      式中$\bar x$为原矩阵每一行的平均值${[{\bar x_1},{\bar x_2}, \cdots ,{\bar x_a}]^{\rm{T}}}$

      进行风电功率预测时仅使用功率数据可能会造成信息缺失,导致预测精度不高,将风速数据同样进行主成分分析,提取前$l$个主成分形成主成分矩阵${\boldsymbol{Z}}$

      $$ {\boldsymbol{Z}} = {\left[ {\begin{array}{*{20}{c}} {{z_{11}}}& \cdots &{{z_{1b}}} \\ \vdots & \ddots & \vdots \\ {{z_{l1}}}& \cdots &{{z_{lb}}} \end{array}} \right]_{l \times b}} = [{\boldsymbol{z}_1}, \cdots ,{\boldsymbol{z}_b}] $$ (11)

      利用预测时刻的风速信息进行预测

      $$ {{\boldsymbol{y}}_t} = f[{\boldsymbol{y}_{t - 1}},{\boldsymbol{y}_{t - 2}}, \cdot \cdot \cdot ,{\boldsymbol{y}_{t - n}},{\boldsymbol{z}_t}] $$ (12)
    • 考虑到风速在空间分布中的连续性特征,基于风速时序数据的相关性和风机的空间分布特征对风速进行谱聚类,以实现风速样本信息的降维。每一台风机都对应着一组风速时序数据,利用PCA对风机的风速数据进行处理时,仅考虑了风速自身的波动特性,忽视了风机在地理位置上的空间相关性,会造成风速降维效果不理想从而影响预测精度。因此,本文同时考虑风速自身波动特性和风机的空间分布特征使用谱聚类对风速数据进行处理。

      谱聚类(spectral clustering,SC)相比于传统的K-means聚类对数据的适应性更强,聚类效果更理想,且实现简单,得到了广泛的应用。SC是从图论中演化而出的,其核心思想是将数据中的变量看作空间中的点,点与点之间可以用边连接,通过量化变量之间的相似性赋予边权值,相似性越高则权值越大,变量之间的距离也就越近。对于一个图$G$,用点的集合$C$和边的集合$E$来描述,即$G(C,E)$,如图1所示。

      图  1  谱聚类

      Figure 1.  Spectral clustering

      SC的目标是通过图的切割使子图内部权重和最大,子图之间的权重和最小。

      为量化风速数据相似性,设有向量${\boldsymbol{Q}}$${\boldsymbol{ O}}$${\boldsymbol{Q}} = [{q_1},{q_2}, \cdots ,{q_n}]$${\boldsymbol{O }}= [{o_1},{o_2}, \cdots ,{o_n}]$,两者之间的皮尔森相关系数为:

      $$ {p_{QO}} = \frac{{\sum\limits_{i = 1}^n {({q_i} - \bar q)({o_i} - \bar o)} }}{{\sqrt {\sum\limits_{i = 1}^n {{{({q_i} - \bar q)}^2}} } \sqrt {\sum\limits_{i = 1}^n {{{({o_i} - \bar o)}^2}} } }} $$ (13)

      式中:$\bar q$为向量${\boldsymbol{Q}}$的平均值;$\bar o$${\boldsymbol{O }}$的平均值。

      计算风速数据的皮尔森相关系数,形成皮尔森矩阵${\boldsymbol{P}}$,为对称矩阵。然后计算风机之间的空间距离$d$,形成距离矩阵${\boldsymbol{D}}$,将两矩阵线性加权作为数据的相似性度量矩阵${\boldsymbol{W}}$

      $$ {\boldsymbol{W}} = \alpha {\boldsymbol{D}} + \beta {\boldsymbol{P}} $$ (14)

      式中:$ \alpha 、\beta $为权值,两者之和为1,通过调整权值获得不同的聚类结果。

      谱聚类步骤如下:

      1)确定聚类数目$m$,输入$a \times b$维的风速数据,构建相似性矩阵${\boldsymbol{W}}$

      $$ {\boldsymbol{W}} = {\left[ {\begin{array}{*{20}{c}} {{w_{11}}}& \cdots &{{w_{1a}}} \\ \vdots & \ddots & \vdots \\ {{w_{a1}}}& \cdots &{{w_{aa}}} \end{array}} \right]_{a \times a}} $$ (15)

      2)计算度矩阵${\boldsymbol{H}}$

      $$ {\boldsymbol{H}} = {\left[ {\begin{array}{*{20}{c}} {{h_1}}&0& \cdots &0 \\ 0&{{h_2}}&{}& \vdots \\ \vdots &{}& \ddots &0 \\ 0& \cdots &0&{{h_a}} \end{array}} \right]_{a \times a}} $$ (16)

      该矩阵为对角阵,元素${h_i}$为矩阵${\boldsymbol{W}}$中第$i$行元素之和。

      3)构建拉普拉斯矩阵${\boldsymbol{L}}$,并对其进行标准化处理。

      $$ {\boldsymbol{L }}= {\boldsymbol{H}} - {\boldsymbol{W}} $$ (17)
      $$ {\boldsymbol{L}}' = {{\boldsymbol{H}}^{ - 0.5}}{\boldsymbol{L}}{{\boldsymbol{H}}^{ - 0.5}} $$ (18)

      4)求取${\boldsymbol{L}}'$的前$m$个最小特征值和对应的特征向量,将特征向量归一化后构建新矩阵${\boldsymbol{U}}$

      5)对矩阵$ {\boldsymbol{U}} $的行向量使用K-means聚类,对应到原始数据,得到$m$个簇的划分${C_1},{C_2}, \cdots ,{C_m}$

      风速数据聚类后,每一类的风速数据求取平均值形成新矩阵${\boldsymbol{S}}$,从而降低数据的维度:

      $$ {\boldsymbol{S}} = {\left[ {\begin{array}{*{20}{c}} {{s_{11}}}& \cdots &{{s_{1b}}} \\ \vdots & \ddots & \vdots \\ {{s_{m1}}}& \cdots &{{s_{mb}}} \end{array}} \right]_{m \times b}} = [{\boldsymbol{s}_1},{\boldsymbol{s}_2}, \cdots ,{\boldsymbol{s}_b}] $$ (19)

      将聚类处理后的风速数据用于预测:

      $$ {{\boldsymbol{y}}_t} = f[{\boldsymbol{y}_{t - 1}},{\boldsymbol{y}_{t - 2}}, \cdot \cdot \cdot ,{\boldsymbol{y}_{t - n}},{\boldsymbol{s}_t}] $$ (20)

      调整聚类数目和相似矩阵的权值,将不同的聚类结果用于预测,通过反复测试得到最理想的结果。

    • 神经网络有前馈式和反馈式两种。前馈网络的输出仅取决于输入和网络结构,是一种静态网络。反馈式网络在前馈网络的基础上增加了反馈环节,使其对历史数据的敏感度提高,抗干扰能力也大大增强。Elman神经网络(Elman neural network,ENN)是一种典型的反馈网络,一般分为四层,网络结构如图2所示。除承接层之外,其他三层与前馈网络并无区别。承接层可以记忆上一时刻隐含层单元的输出,并在下一时刻重新输入到隐含层,起反馈作用。

      图  2  Elman神经网络结构

      Figure 2.  Structure of Elman neural network

      ENN数学模型如下:

      $$ \left\{ \begin{split} &{\boldsymbol{y}}(k) = g({\omega _3}{\boldsymbol{x}}(k)) \\ &{\boldsymbol{x}}(k) = f({\omega _1}{{\boldsymbol{x}}_c}(k) + {\omega _2}{\boldsymbol{u}}(k - 1)) \\ &{{\boldsymbol{x}}_c}(k) = {\boldsymbol{x}}(k - 1) \end{split} \right. $$ (21)

      式中:$\boldsymbol y $为输出向量;$ \boldsymbol x $为隐含层节点单元向量;$ \boldsymbol u $为输入向量;$ {\boldsymbol{x}_c} $为反馈状态向量;${\omega _3}$为隐含层到输出层连接权值;${\omega _2}$为输入层到隐含层的连接权值;${\omega _1}$为承接层到隐含层的连接权值;$g( \cdot )$为输出神经元的传递函数;$f( \cdot )$为隐含层神经元的传递函数。

      基于ENN即可建立预测模型,步骤如下:

      1)对功率序列进行主成分分析,提取主成分作为预测对象;

      2)使用谱聚类对风速数据进行聚类处理,求取平均值以降低维度;

      3)将功率主成分和降维后的风速数据归一化,输入ENN中进行预测;

      4)预测结果经过式(9)和(10)的逆变换得到功率预测值。

      本文所采用的预测评价指标为均方根误差,具体计算如下:

      $$ {E_{{\rm{RMSE}}}} = \sqrt {\frac{1}{N}\sum\limits_{i = 1}^N {{{({{\hat y}_i} - {y_i})}^2}} } $$ (22)

      式中:$N$为样本的数量;${\hat y_i}$为功率预测值;${y_i}$为实际值。

    • 本文采用的数据来源于江苏省南通市某海上风电场,共有105台机组,额定功率为1500 kW。采集24 h内的功率和风速,分辨率为5 min,将前23 h的数据用于训练,最后1h的数据用于验证。

      首先,将功率的累计贡献率阈值设置为95%,提取功率的主成分,计算累计贡献率,结果如图3所示。

      图  3  功率累计贡献率

      Figure 3.  Cumulative contribution of power

      根据计算结果,在累计贡献率为95%的情况下需选取功率的前38个主成分用于预测。

      其次,基于本文提出的方法,对风速进行谱聚类,选择聚类数目m为12,权重α为0.75,β为0.25,聚类结果如图4所示。

      图  4  谱聚类结果

      Figure 4.  Results of spectral clustering

      最后,为了进行模型对比,对风速也预先进行主成分分析,累计贡献率阈值设置为90%,提取风速的主成分,累计贡献率结果如图5所示。

      图  5  风速累计贡献率

      Figure 5.  Cumulative contribution of wind speed

      根据计算结果,累计贡献率阈值为90%的情况下风速需保留前30个主成分,相比于谱聚类方法,用于对比的主成分分析方法所保留的风速信息维度更高。

    • 为验证所提方法有效性,对风电场功率进行预测,将以下几种方法进行对比。

      方法1:将风速数据作为输入,利用BP神经网络预测风电功率;

      方法2:将功率序列作为输入,利用Elman神经网络进行预测;

      方法3:对功率序列使用主成分分析,将功率主成分作为预测对象,利用Elman神经网络进行预测;

      方法4:提取功率和风速的主成分作为输入,利用Elman神经网络预测功率;

      方法5:功率序列进行主成分分析,风速数据进行谱聚类,将处理后的功率和风速作为输入信息基于Elman神经网络进行预测。

      以上5种方法的预测结果如图610所示,误差对比如表1所示。

      图  6  方法1结果

      Figure 6.  Results of method 1

      图  7  方法2结果

      Figure 7.  Results of method 2

      图  8  方法3结果

      Figure 8.  Results of method 3

      图  9  方法4结果

      Figure 9.  Results of method 4

      图  10  方法5结果

      Figure 10.  Results of method 5

      表 1  误差对比

      Table 1.  Error comparison

      方法输入RMSE/kW
      1风速508.96
      2功率662.51
      3功率(PCA)567.43
      4功率(PCA)、风速(PCA)346.41
      5功率(PCA)、风速(SC)312.98

      方法1和方法2属于传统方法,由预测结果和误差对比可知,方法1预测的功率变化趋势与实际几乎一致,方法2的预测功率变化趋势与实际存在一定差别,但两种方法误差都较高。

      方法3相比于方法2虽然预测功率的变化趋势与实际还是存在差别,但误差得到了降低,说明利用主成分分析降低数据维度可以提升预测精度。

      方法4在方法3的基础上加入了风速信息用于预测,由表1可知误差明显减小,表明利用多种数据可以提供更多信息从而改善预测效果。

      方法5即为本文提出的方法,由图9图10可知,相比于方法4,方法5的预测功率更加符合实际功率变化趋势,且预测功率相对于实际功率的上下波动更小。由表1可知方法5的均方根误差相较于方法4有进一步下降,说明考虑风速波动特性和风机空间分布特征进行聚类的降维效果比主成分分析更好,更加适合风电功率预测。

    • 1)利用功率和风速数据进行预测比利用单一种类数据效果更好,同时对数据进行降维处理可降低预测模型的复杂度,避免了因输入数据维度过高造成的预测精度不理想问题。

      2)考虑风速时序数据自身波动特性和风机空间分布特征对风速进行谱聚类的降维效果比利用主成分分析更好,所得预测结果精度更高。

      3)本文提出的基于主成分分析和谱聚类的预测模型与其他4种方法进行了比较,基于江苏南通某海上风电场实际数据进行算例分析,结果表明,本文所提模型的均方根误差最低,验证了该模型的有效性。

      致 谢

      本文得到了江苏方天电力技术有限公司科技项目(基于海缆线损实时计算的海上风电并网功率可调容量修正技术研究与应用(KJXM-0287))的支持,在此表示感谢。

参考文献 (18)

目录

    /

    返回文章
    返回