留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于自适应噪声完备经验模态分解−样本熵−长短期记忆神经网络和核密度估计的短期电力负荷区间预测

赵会茹 张士营 赵一航 刘红雨 邱宝红

赵会茹, 张士营, 赵一航, 刘红雨, 邱宝红. 基于自适应噪声完备经验模态分解−样本熵−长短期记忆神经网络和核密度估计的短期电力负荷区间预测[J]. 现代电力, 2021, 38(2): 138-146. doi: 10.19725/j.cnki.1007-2322.2020.0329
引用本文: 赵会茹, 张士营, 赵一航, 刘红雨, 邱宝红. 基于自适应噪声完备经验模态分解−样本熵−长短期记忆神经网络和核密度估计的短期电力负荷区间预测[J]. 现代电力, 2021, 38(2): 138-146. doi: 10.19725/j.cnki.1007-2322.2020.0329
Huiru ZHAO, Shiying ZHANG, Yihang ZHAO, Hongyu LIU, Baohong QIU. Short-term Power Load Interval Prediction Based on CEEMDAN-SE-LSTM and KDE[J]. Modern Electric Power, 2021, 38(2): 138-146. doi: 10.19725/j.cnki.1007-2322.2020.0329
Citation: Huiru ZHAO, Shiying ZHANG, Yihang ZHAO, Hongyu LIU, Baohong QIU. Short-term Power Load Interval Prediction Based on CEEMDAN-SE-LSTM and KDE[J]. Modern Electric Power, 2021, 38(2): 138-146. doi: 10.19725/j.cnki.1007-2322.2020.0329

基于自适应噪声完备经验模态分解−样本熵−长短期记忆神经网络和核密度估计的短期电力负荷区间预测

doi: 10.19725/j.cnki.1007-2322.2020.0329
基金项目: 国家自然科学基金资助项目(71973043)
详细信息
    作者简介:

    赵会茹(1963),女,教授,博士生导师,研究方向:电力市场理论及应用技术等,E-mail:huiruzhao@163.com

    张士营(1995),男,硕士,通信作者,研究方向:电力市场理论及应用技术等,E-mail:zhangshiying1995@163.com

    赵一航(1997),男,博士,研究方向:电力市场理论及应用技术等,E-mail:1182206105@ncepu.edu.cn

    刘红雨(1995),女,硕士,研究方向:电力市场理论及应用技术等,E-mail:liuhongyu@ncepu.edu.cn

    邱宝红(1996),女,硕士,研究方向:电力市场理论及应用技术等,E-mail:baohong151@163.com

  • 中图分类号: TM73

Short-term Power Load Interval Prediction Based on CEEMDAN-SE-LSTM and KDE

Funds: Project Supported by National Natural Science Foundation of China(NSFC)(71973043)
  • 摘要: 短期电力负荷具有较强的随机性和波动性,其预测的准确性对于提升供电可靠性、电力系统运行经济性至关重要。针对传统确定性预测不能反映未来负荷波动的弊端,基于“点预测+区间估计”的思路提出了一种短期负荷区间预测方法。首先基于自适应噪声完备经验模态分解方法将负荷序列分解为多个模态分量,并根据不同序列样本熵的计算结果将序列进行重构以降低运算量。在此基础上,针对每一个分量分别构建长短期记忆神经网络预测模型,得到未来负荷点预测值。基于此利用核密度估计方法对预测误差的分布进行估计,进而结合点预测结果实现未来短期负荷的区间预测。通过将此模型与其他模型进行对比,结果表明此模型能够实现更低的点预测误差,同时在区间预测中也表现出更好的综合性能。
  • 图  1  长短期记忆神经网络结构

    Figure  1.  Structure of long- and short-term memory network

    图  2  预测模型结构及计算流程图

    Figure  2.  Architecture and computation flowchart of the prediction model of the model

    图  3  非工作日CEEMDAN分解结果

    Figure  3.  Decomposition result of CEEMDAN in nonworkdays

    图  4  各子序列样本熵

    Figure  4.  Sample entropy of each sequence

    图  5  工作日点预测结果对比

    Figure  5.  Comparison of point prediction results of workdays

    图  6  非工作日点预测结果对比

    Figure  6.  Comparison of point prediction results of nonworkdays

    图  7  工作日区间预测结果

    Figure  7.  Interval prediction results of workdays

    图  8  非工作日区间预测结果

    Figure  8.  Interval prediction results of nonworkdays

    表  1  各模型实验误差

    Table  1.   Mean absolute percentage error of different models

    模型MAPE/%
    工作日非工作日
    CEEMDAN-SE-LSTM1.381.47
    EEMD-SE-LSTM1.421.50
    LSTM1.531.70
    ARIMA1.862.38
    ANFIS2.475.36
    下载: 导出CSV

    表  2  各模型区间预测效果(90%置信水平)

    Table  2.   Interval prediction effects of different models (90% confidence level)

    指标日类型Bootstrap估计正态分布估计核密度估计
    PICP工作日0.89550.85820.9104
    非工作日0.92650.88240.9118
    PINAW工作日0.17720.15120.1710
    非工作日0.19880.17810.1819
    CWC工作日0.35360.29620.1710
    非工作日0.19880.35310.1819
    下载: 导出CSV

    表  3  各模型区间预测效果(95%置信水平)

    Table  3.   Intervalprediction effects of different models interval (95% confidence level)

    指标日类型Bootstrap估计正态分布估计核密度估计
    PICP工作日0.94030.88060.9701
    非工作日0.95590.94120.9853
    PINAW工作日0.19240.17450.2016
    非工作日0.27240.26730.2396
    CWC工作日0.38290.33730.2016
    非工作日0.27240.53230.2396
    下载: 导出CSV
  • [1] 曾楠, 许元斌, 罗义旺, 等. 基于分布式聚类模型的电力负荷特性分析[J]. 现代电力, 2018, 35(1): 71−77. doi:  10.3969/j.issn.1007-2322.2018.01.012

    ZENG Nan, XU Yuanbin, LUO Yiwang, et al. Analysis of Power Load Characteristics Based on Distributed Clustering Model[J]. Modern Electric Power, 2018, 35(1): 71−77(in Chinese). doi:  10.3969/j.issn.1007-2322.2018.01.012
    [2] 鲁宗相, 黄瀚, 单葆国, 等. 高比例可再生能源电力系统结构形态演化及电力预测展望[J]. 电力系统自动化, 2017, 41(09): 12−18.

    LU Zongxiang, HUANG Han, SHAN Baoguo, et al. Structural evolution of high-proportion renewable energy power system and power forecast prospects[J]. Automation of Electric Power Systems, 2017, 41(09): 12−18(in Chinese).
    [3] 李晨熙. 基于ARIMA模型的短期电力负荷预测[J]. 吉林电力, 2015, 43(06): 22−24. doi:  10.3969/j.issn.1009-5306.2015.06.007

    LI Chenxi. Short-term power load forecasting based on ARIMA model[J]. Jilin Electric Power, 2015, 43(06): 22−24(in Chinese). doi:  10.3969/j.issn.1009-5306.2015.06.007
    [4] 辜信梅, 李福兴. 基于广义自回归条件异方差遗传算法下短期电力负荷预测[J]. 电子制作, 2017(09): 54−55+61.

    GU Xinmei, LI Fuxing. Short-term power load forecasting based on generalized autoregressive conditional heteroscedastic genetic algorithm[J]. Electronic Manufacturing, 2017(09): 54−55+61(in Chinese).
    [5] LU P Z, XU Z J, CHEN Y R, et al. Prediction method of bridge static load test results based on Kriging model[J]. Engineering Structures, 2020: 214.
    [6] 吴润泽, 包正睿, 宋雪莹, 等. 基于深度学习的电网短期负荷预测方法研究[J]. 现代电力, 2018, 35(2): 43−48. doi:  10.3969/j.issn.1007-2322.2018.02.007

    WU Runze, BAO Zhengrui, SONG Xueying, et al. Research on Short-term Load Forecasting Method of Power Grid Based on Deep Learning[J]. Modern Electric Power, 2018, 35(2): 43−48(in Chinese). doi:  10.3969/j.issn.1007-2322.2018.02.007
    [7] 李正明, 高赵亮, 梁彩霞. 基于FCM和CG-DBN的光伏功率短期预测[J]. 现代电力, 2019, 36(5): 62−67. doi:  10.3969/j.issn.1007-2322.2019.05.009

    LI Zhengming, GAO Zhaoliang, LIANG Caixia. Short-term Prediction of Photovoltaic Power based on Combination of FCM and CG-DBN[J]. Modern Electric Power, 2019, 36(5): 62−67(in Chinese). doi:  10.3969/j.issn.1007-2322.2019.05.009
    [8] QUAN H, SRINIVASAN D, KHOSRAVI A, et al. Uncertainty handling using neural network-based prediction intervals for electrical load forecasting[J]. Energy, 2014: 916−925.
    [9] 任利强, 张立民, 王海鹏, 等. 基于IPSO-GPR的短期负荷区间预测[J]. 计算机工程与设计, 2019, 40(10): 3002−3008.

    REN Liqiang, ZHANG Limin, WANG Haipeng, et al. Short-term load interval prediction based on IPSO-GPR[J]. Computer Engineering and Design, 2019, 40(10): 3002−3008(in Chinese).
    [10] He Y, Xu Q, Wan J, et al. Short-term power load probability density forecasting based on quantile regression neural network and triangle kernel function[J]. Energy, 2016, 114(114): 498−512.
    [11] 于佳弘, 包哲静, 李志杰. 基于LSTM的用户负荷区间预测方法[J]. 工业控制计算机, 2018, 31(04): 100−102. doi:  10.3969/j.issn.1001-182X.2018.04.041

    YU Jiahong, BAO Zhejing, LI Zhijie. Interval prediction method of user load based on LSTM[J]. Industrial Control Computer, 2018, 31(04): 100−102(in Chinese). doi:  10.3969/j.issn.1001-182X.2018.04.041
    [12] 黄圣权. 基于深度学习的短期电力负荷预测[D]. 广东: 广东工业大学, 2019.

    HUANG Shengquan. Short-term power load forecasting based on deep learning[D]. Guangdong: Guangdong University of Technology, 2019. (in Chinese).
    [13] 刘雨薇. 基于VMD和改进LSTM的短期电力负荷预测研究[D]. 湖北: 湖北工业大学, 2020.

    LIU Yuwei. Research on short-term power load forecasting based on VMD and improved LSTM[D]. Hubei: Hubei University of Technology, 2020. (in Chinese).
    [14] 王新, 孟玲玲. 基于EEMD-LSSVM的超短期负荷预测[J]. 电力系统保护与控制, 2015, 43(01): 61−66.

    WANG Xin, MENG Lingling. Ultra-short-term load forecasting based on EEMD-LSSVM[J]. Power System Protection and Control, 2015, 43(01): 61−66(in Chinese).
    [15] 赵会茹, 赵一航, 郭森. 基于互补集合经验模态分解和长短期记忆神经网络的短期电力负荷预测[J]. 中国电力, 2020, 53(06): 48−55.

    ZHAO Huiru, ZHAO Yihang, GUO Sen. Short-term power load forecasting based on complementary ensemble empirical mode decomposition and long short-term memory neural network[J]. China Electric Power, 2020, 53(06): 48−55(in Chinese).
    [16] 陈璐. 基于LSTM模型的金融时间序列预测算法研究[D]. 黑龙江: 哈尔滨工业大学, 2019.

    CHEN Lu. Research on Financial Time Series Forecasting Algorithm Based on LSTM Model[D]. Heilongjiang: Harbin Institute of Technology, 2019. (in Chinese).
    [17] 杨斌, 杨世海, 曹晓冬, 等. 基于EMD-QRF的用户负荷概率密度预测[J]. 电力系统保护与控制, 2019, 47(16): 1−7.

    YANG Bin, YANG Shihai, CAO Xiaodong, et al. User load probability density prediction based on EMD-QRF[J]. Power System Protection and Control, 2019, 47(16): 1−7(in Chinese).
    [18] FAWAZ H I, FORETIER G, WEBER J, et al. Deep learning for time series classification: a review[J]. Data Mining and Knowledge Discovery, 2019, 33(4): 917−963. doi:  10.1007/s10618-019-00619-1
    [19] 谢明磊. 基于LSTM网络的住宅负荷短期预测[J]. 广东电力, 2019, 32(06): 108−114.

    XIE Minglei. Short-term residential load forecast based on LSTM network[J]. Guangdong Electric Power, 2019, 32(06): 108−114(in Chinese).
    [20] 吴振威, 蒋小平, 马会萌, 等. 基于非参数核密度估计法的光伏出力随机分布模型[J]. 中国电力, 2013, 46(09): 126−130. doi:  10.3969/j.issn.1004-9649.2013.09.027

    WU Zhenwei, JIANG Xiaoping, MA Huimeng, et al. Random distribution model of photovoltaic output based on non-parametric kernel density estimation method[J]. China Electric Power, 2013, 46(09): 126−130(in Chinese). doi:  10.3969/j.issn.1004-9649.2013.09.027
    [21] 李娜, 王磊, 张文月, 等. 基于高维数据优化聚类的长周期峰谷时段划分模型研究[J]. 现代电力, 2016, 33(04): 67−71. doi:  10.3969/j.issn.1007-2322.2016.04.010

    LI Na, WANG Lei, ZHANG Wenyue, et al. Study on the long-period peak-valley time division model based on high-dimensional data optimized clustering[J]. Modern Electric Power, 2016, 33(04): 67−71(in Chinese). doi:  10.3969/j.issn.1007-2322.2016.04.010
    [22] 彭毳鑫, 殷珍妮, 赵志文. 自回归模型参数和的置信区间估计[J]. 统计与决策, 2018, 34(15): 11−14.

    PENG Yanxin, YIN Zhenni, ZHAO Zhiwen. Confidence interval estimation of the autoregressive model parameter sum[J]. Statistics and Decision, 2018, 34(15): 11−14(in Chinese).
    [23] 韩冬, 马进, 贺仁睦. 基于Bootstrap的负荷模型的小样本不确定性分析[J]. 电力系统保护与控制, 2012, 40(18): 95−100. doi:  10.7667/j.issn.1674-3415.2012.18.018

    HAN Dong, MA Jin, HE Renmu. Small sample uncertainty analysis of load model based on Bootstrap[J]. Power System Protection and Control, 2012, 40(18): 95−100(in Chinese). doi:  10.7667/j.issn.1674-3415.2012.18.018
  • [1] 李春平, 张沛, 彭春华, 尹瑞, 时珉.  基于随差遗忘长短期记忆的风电功率实时预测 . 现代电力, 2021, 38(1): 110-118. doi: 10.19725/j.cnki.1007-2322.2020.0200
    [2] 魏明奎, 叶葳, 沈靖, 周泓, 蔡绍荣, 王渝红, 沈力.  基于自组织特征神经网络和最小二乘支持向量机的短期电力负荷预测方法 . 现代电力, 2021, 38(1): 17-23. doi: 10.19725/j.cnki.1007-2322.2020.0201
    [3] 赵冬梅, 马泰屹, 王闯.  基于相空间重构和长短期记忆算法的电力系统无功负荷预测模型 . 现代电力, 2020, 37(5): 470-477. doi: 10.19725/j.cnki.1007-2322.2020.0235
    [4] 田剑刚, 张沛, 彭春华, 时珉, 王铁强, 尹瑞, 王一峰.  基于分时长短期记忆神经网络的光伏发电超短期功率预测 . 现代电力, 2020, 37(6): 629-637. doi: 10.19725/j.cnki.1007-2322.2019.1026
    [5] 王卉, 王增平, 刘席洋.  基于深度循环神经网络的换相失败边界检测 . 现代电力, 2019, 36(6): 88-94.
    [6] 李正明, 高赵亮, 梁彩霞.  基于FCM和CG-DBN的光伏功率短期预测 . 现代电力, 2019, 36(5): 62-67.
    [7] 苏运, 卜凡鹏, 郭乃网, 田世明, 田英杰, 张琪祁, 瞿海妮, 柳劲松.  基于低秩表示的多任务短期电力负荷预测的研究 . 现代电力, 2019, 36(3): 58-65.
    [8] 殷红旭, 刘春秀, 赵金勇, 耿洪彬, 李仟成.  基于自适应模型预测控制的区域能源互联网两阶段协同调度 . 现代电力, 2018, 35(4): 35-44.
    [9] 吴润泽, 包正睿, 宋雪莹, 邓 伟.  基于深度学习的电网短期负荷预测方法研究 . 现代电力, 2018, 35(2): 43-48.
    [10] 卢 伟, 林建泉, 刘柏林.  一种鲁棒预测辅助电力系统状态估计算法 . 现代电力, 2017, 34(4): 33-39.
    [11] 徐敏姣, 徐青山, 袁晓冬.  基于改进EMD及Elman算法的短期光伏功率预测研究 . 现代电力, 2016, 33(3): 8-13.
    [12] 张华彬, 杨明玉.  基于最小二乘支持向量机的光伏出力超短期预测 . 现代电力, 2015, 32(1): 70-75.
    [13] 杜翠, 徐晓波, 刘宗歧, 刘文霞.  气象数据弱相关的光伏出力短期预测 . 现代电力, 2015, 32(6): 1-6.
    [14] 杨再鹤, 向铁元, 郑丹.  基于小波变换和SVM算法的微电网短期负荷预测研究 . 现代电力, 2014, 31(3): 74-79.
    [15] 邓 喆, 李庚生, 安连锁, 沈国清, 张世平.  基于声学测温与人工神经网络的炉膛结渣在线监测方法 . 现代电力, 2011, 28(4): 70-72.
    [16] 刘永前, 朴金姬, 韩 爽.  风电场输出功率预测中两种神经网络算法的研究 . 现代电力, 2011, 28(2): 49-52.
    [17] 殷红旭, 张建华.  20kV中压配电在城市高负荷密度新区中的应用 . 现代电力, 2010, 27(2): 35-38.
    [18] 黄文杰, 傅 砾, 肖 盛, 郭世繁.  基于模糊层次分析法的风速短期预测组合模型 . 现代电力, 2010, 27(3): 49-53.
    [19] 潘章达, 张 铖.  利用经验模态分解方法消除白噪声及谐波 . 现代电力, 2010, 27(5): 53-56.
    [20] 王林川, 白 波, 于奉振, 袁明哲.  基于QPSO参数优化的WLSSVM短期负荷预测 . 现代电力, 2010, 27(5): 49-52.
  • 加载中
图(8) / 表 (3)
计量
  • 文章访问数:  56
  • HTML全文浏览量:  4
  • PDF下载量:  28
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-09-22
  • 网络出版日期:  2021-04-09
  • 刊出日期:  2021-04-10

基于自适应噪声完备经验模态分解−样本熵−长短期记忆神经网络和核密度估计的短期电力负荷区间预测

doi: 10.19725/j.cnki.1007-2322.2020.0329
    基金项目:  国家自然科学基金资助项目(71973043)
    作者简介:

    赵会茹(1963),女,教授,博士生导师,研究方向:电力市场理论及应用技术等,E-mail:huiruzhao@163.com

    张士营(1995),男,硕士,通信作者,研究方向:电力市场理论及应用技术等,E-mail:zhangshiying1995@163.com

    赵一航(1997),男,博士,研究方向:电力市场理论及应用技术等,E-mail:1182206105@ncepu.edu.cn

    刘红雨(1995),女,硕士,研究方向:电力市场理论及应用技术等,E-mail:liuhongyu@ncepu.edu.cn

    邱宝红(1996),女,硕士,研究方向:电力市场理论及应用技术等,E-mail:baohong151@163.com

  • 中图分类号: TM73

摘要: 短期电力负荷具有较强的随机性和波动性,其预测的准确性对于提升供电可靠性、电力系统运行经济性至关重要。针对传统确定性预测不能反映未来负荷波动的弊端,基于“点预测+区间估计”的思路提出了一种短期负荷区间预测方法。首先基于自适应噪声完备经验模态分解方法将负荷序列分解为多个模态分量,并根据不同序列样本熵的计算结果将序列进行重构以降低运算量。在此基础上,针对每一个分量分别构建长短期记忆神经网络预测模型,得到未来负荷点预测值。基于此利用核密度估计方法对预测误差的分布进行估计,进而结合点预测结果实现未来短期负荷的区间预测。通过将此模型与其他模型进行对比,结果表明此模型能够实现更低的点预测误差,同时在区间预测中也表现出更好的综合性能。

English Abstract

赵会茹, 张士营, 赵一航, 刘红雨, 邱宝红. 基于自适应噪声完备经验模态分解−样本熵−长短期记忆神经网络和核密度估计的短期电力负荷区间预测[J]. 现代电力, 2021, 38(2): 138-146. doi: 10.19725/j.cnki.1007-2322.2020.0329
引用本文: 赵会茹, 张士营, 赵一航, 刘红雨, 邱宝红. 基于自适应噪声完备经验模态分解−样本熵−长短期记忆神经网络和核密度估计的短期电力负荷区间预测[J]. 现代电力, 2021, 38(2): 138-146. doi: 10.19725/j.cnki.1007-2322.2020.0329
Huiru ZHAO, Shiying ZHANG, Yihang ZHAO, Hongyu LIU, Baohong QIU. Short-term Power Load Interval Prediction Based on CEEMDAN-SE-LSTM and KDE[J]. Modern Electric Power, 2021, 38(2): 138-146. doi: 10.19725/j.cnki.1007-2322.2020.0329
Citation: Huiru ZHAO, Shiying ZHANG, Yihang ZHAO, Hongyu LIU, Baohong QIU. Short-term Power Load Interval Prediction Based on CEEMDAN-SE-LSTM and KDE[J]. Modern Electric Power, 2021, 38(2): 138-146. doi: 10.19725/j.cnki.1007-2322.2020.0329
    • 准确的短期负荷预测对于保证电力系统安全和可靠运行至关重要。随着我国居民生活质量的提高和用电方式的多样化,电力负荷近年来增长明显,同时由于温湿度等气象因素的影响,电力负荷特性也呈现出新的特征和趋势[1]。此外,新能源装机容量的提高以及分布式电源的发展,给短期负荷预测带来了新的挑战。因此,如何进一步降低预测误差,进而确保电力系统的安全可靠性是目前的重要研究方向之一[2]

      以往的短期负荷预测大多数都是确定性预测,其中根据预测原理不同可以分为基于统计学的预测方法以及基于机器学习的智能预测方法[3-5]。统计学预测方法包括自回归差分移动平均模型、自回归条件异方差模型以及动态回归模型等,通常是在分析数据的时间序列本身规律的基础上进行建模和预测,模型结构较为简单,对于非线性序列的适用性较差;智能预测方法包括神经网络、支持向量机等,这类方法能够较好地对非线性数据序列进行拟合,很大程度上提高预测模型的预测效果和泛化能力[6-7]

      近年来电力市场日趋成熟,负荷影响因素更加多元化,负荷特性趋于复杂,其不确定性更为明显,相比之下确定性的负荷预测能够提供的信息具有很大局限性,无法提供未来短期负荷可能的波动范围。因此许多学者已经将负荷预测扩展到区间预测,其预测结果能够提供负荷在给定置信水平下的置信区间,因此能够提供更多的不确定信息。文献[8]使用两个节点的输出层前馈神经网络直接获得预测区间的上下界,同时结合粒子群优化进一步提高预测区间质量;文献[9]构建了基于改进粒子群优化和高斯过程回归的短期负荷区间预测模型;文献[10]提出了一种基于分位数回归神经网络和三角核函数的负荷概率密度预测模型,基于加拿大和中国实际电力负荷样本的实证结果表明该模型能提高预测效果。深度学习技术的发展改善了以往浅层学习中不能适应大量样本的情形,文献[11]首先基于长短期记忆神经网络实现负荷的点预测,进而利用启发式区间预测算法得到区间系数;文献[12]构建了基于卷积–长短期基于网络分位数回归的区间预测模型,并引入核密度估计方法对负荷的波动性进行了分析。

      考虑到负荷序列本身的周期性、随机性等特征,亦有学者采用混合模型的思路对负荷序列进行建模。文献[13]基于变分模态分解和长短期记忆网络进行了短期负荷预测建模,同时利用改进粒子群算法对参数进行了寻优;文献[14]构建了基于集合经验模态分解和最小二乘支持向量机的混合预测模型,并验证了混合模型相对于单一模型能够提高预测效果;文献[15]利用长短期记忆神经网络和互补集合经验模态分解方法构建了短期负荷预测模型,仿真结果验证了组合方法能够提升预测效果。

      本文在前人研究的基础上,构建短期负荷区间预测混合模型。通过对比不同预测模型,进一步验证本文模型的有效性和实用性。

    • 针对模态混叠问题,自适应噪声完备经验模态分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)算法被提出,CEEMDAN算法的基本原理是在固有模态函数分量(intrinsic mode function,IMF)分解的过程中自适应地添加白噪声,通过最后的余量信号计算出各个IMF分量,能够达到几乎为零的重构误差,具有很好的完备性,并减少了集成次数,解决了模态混叠的问题[16],其分解过程如下。

      1)在原始序列$x(t)$中添加一系列自适应的白噪声:

      $${x^i}(t) = x(t) + {\omega _0}{\varepsilon ^i}(t),{\rm{ }}i \in \{ 1, \cdots ,I\} $$ (1)

      式中:${x^i}(t)$为第$i$次添加白噪声的时间序列;${\omega _0}$为噪声系数;${\varepsilon ^i}(t)$为第$i$次添加的白噪声;$I$为集成次数。

      2)利用经验模态分解(empirical mode decomposition,EMD)对${x^i}(t)$进行分解,并对第1个IMF分量$c_1^i$取均值:

      $${c_1}(t) = \frac{1}{I}\sum\limits_{i = 1}^I {c_1^i} $$ (2)

      从原始序列$x(t)$中移除${c_1}(t)$可得第1个余量序列

      $${r_1}(t) = x(t) - {c_1}(t)$$ (3)

      3)对${r_1}(t) + {\omega _1}{E_1}[{\varepsilon ^i}(t)]$继续进行EMD分解,得到第2个IMF分量。

      $${c_2}(t) = \frac{1}{I} \displaystyle \sum\limits_{i = 1}^I {{E_1}\{ {r_1}(t) + {\omega _1}{E_1}[{\varepsilon ^i}(t)]\} } $$ (4)

      式中:${E_j}( \cdot )$为EMD分解得到的第$j$个IMF分量。

      4)重复以下过程,计算其余的IMF分量:

      $${r_k}(t) = {r_{k - 1}}(t) - {c_k}(t),{\rm{ }}k{\rm{ = 2,3,}} \cdots {\rm{,}}K$$ (5)
      $${c_{k + 1}}(t) = \frac{1}{I} \displaystyle \sum\limits_{i = 1}^I {{E_1}\{ {r_k}(t) + {\omega _k}{E_k}[{\varepsilon ^i}(t)]\} } $$ (6)

      式中:$K$为模态总个数。

      当余量序列不能继续分解时,算法结束。最终的余量表示为:

      $$R(t) = x(t) - \displaystyle \sum\limits_{k = 1}^K {{c_k}(t)} $$ (7)
    • 样本熵SE是一种对非稳定时间序列的复杂性的度量方法[17]。与一般方法相比,其优势主要体现在具有不依赖数据长度、一致性更好两个方面。样本熵的值与序列自我相似程度成正相关性。对于样本容量为N的时间序列

      $$ {x(n)}=x(1),x(2),\cdots,x(N) $$

      该算法的计算步骤如下:

      1)按序列号组成一组维数为m的向量序列${X_m}(1), \cdots ,{X_m}(N - m + 1)$,其中:

      $$ {X_m}(i) = \{ x(i),x(i + 1), \cdots ,x(i + m - 1)\} ,1 \leqslant i \leqslant N - m + 1 $$ (8)

      这些向量序列表示从第i个点开始的m个连续的x的值。

      2)定义向量${X_m}(i)$${X_m}(j)$之间的距离

      $$d[{X_m}(i),{X_m}(j)] = \mathop {\max }\limits_{0 \leqslant k \leqslant m - 1} \left| {x(i + k) - x(j + k)} \right|$$ (9)

      3)对于某一${X_m}(i)$,统计${X_m}(i)$${X_m}(j)$之间的距离小于等于$r$$j(1 \leqslant j \leqslant N - m,j \ne i)$数量,记为${B_i}$。对于$1 \leqslant i \leqslant N - m$,定义:

      $$B_i^m(r) = \frac{1}{{N - m - 1}}{B_i}$$ (10)

      在此基础上,定义

      $${B^m}(r) = \frac{1}{{N - m}}\sum\limits_{i = 1}^{N - m} {B_i^m(r)} $$ (11)

      4)将维数增加到$m + 1$,统计${X_{m + 1}}(i)$${X_{m + 1}}(j)$距离小于等于$r$的数量,记为${A_i}$,并定义

      $$A_i^m(r) = \frac{1}{{N - m - 1}}{A_i}$$ (12)

      在此基础上,定义

      $${A^m}(r) = \frac{1}{{N - m}}\sum\limits_{i = 1}^{N - m} {A_i^m(r)} $$ (13)

      ${B^m}(r)$是两个序列在相似容限r下匹配m个点的概率;${A^m}(r)$是两个序列匹配m+1个点的概率。样本熵

      $${S_E}(m,r) = \mathop {\lim }\limits_{N \to \infty } \left\{ - \ln [\frac{{{A^m}(r)}}{{{B^m}(r)}}]\right\} $$ (14)

      N有限时,样本熵估计为

      $${S_E}(m,r,N) = - \ln \left[\frac{{{A^m}(r)}}{{{B^m}(r)}}\right]$$ (15)
    • 长短期记忆神经网络(long and short-term memory,LSTM),是在循环神经网络的基础上延伸而来,其重点是为了解决循环神经网络(recurrent neural network,RNN)在处理长时间的序列中产生的梯度消失和梯度爆炸的缺陷。该方法通过特殊处理的不同门的机制的设计,避免了RNN结构对历史长期数据序列的依赖问题,不仅能够提高大量时间序列的处理能力,也能够更充分地利用现有信息,适应能力更强[18],其单元结构示意图如图1所示。

      图  1  长短期记忆神经网络结构

      Figure 1.  Structure of long- and short-term memory network

      图1所示,LSTM结构的重点是在于其特有的单元的状态及其贯穿各单元之间的水平线。在数据传输过程中,大部分信息直接传送到下一单元,少量信息进行线性交互。在这一过程中,基于一种门的控制单元实现数据的添加和删除,LSTM结构中共包含3种门机制,分别叫作输入门、遗忘门和输出门,基于此实现了时间序列的数据处理,并避免了所需信息的流失。

      输入门的信息由两部分构成,包括$t$时刻输入值${x_t}$以及$t - 1$时刻隐藏层输出值${h_{t - 1}}$${\hat C_t}$通过$t$时刻输入${x_t}$$t - 1$时刻隐藏层输出${h_{t - 1}}$计算得到。输入门${i_t}$和记忆单元的候选状态${\hat C_t}$通过以下公式计算:

      $${i_t} = \sigma ({{{\mathit{\boldsymbol{w}}}}_i}[{h_{t - 1}},{x_t}] + {b_i})$$ (16)
      $${\hat C_t} = \tan h({{{\mathit{\boldsymbol{w}}}}_c}[{h_{t - 1}},{x_t}] + {b_c})$$ (17)

      式中:${{{\mathit{\boldsymbol{w}}}}_i}$为输入门在$t$时刻的权值矩阵;${{{\mathit{\boldsymbol{w}}}}_c}$为候选状态${\hat C_t}$$t$时刻的权值矩阵;${b_i}$${b_c}$表示偏置值;$\sigma $表示Sigmoid激活函数;$\tan h$表示$\tan h$激活函数。

      遗忘门由$t$时刻输入值${x_t}$$t - 1$时刻隐藏层输出${h_{t - 1}}$共同决定:

      $${f_t} = \sigma ({{{\mathit{\boldsymbol{w}}}}_f}[{h_{t - 1}},{x_t}] + {b_f})$$ (18)

      式中:${{{\mathit{\boldsymbol{w}}}}_f}$为遗忘门在$t$时刻的权值矩阵;${b_f}$表示偏置值。

      基于输入门和遗忘门的作用,记忆单元${C_t}$完成自身状态的更新:

      $${C_t} = {f_t}{C_{t - 1}} + {i_t}{\hat C_t}$$ (19)

      式中:${C_{t - 1}}$表示记忆单元上一时刻状态。

      输出门由$t$时刻输入值${x_t}$$t - 1$时刻隐藏层输出${h_{t - 1}}$共同决定:

      $${o_t} = \sigma ({{{\mathit{\boldsymbol{w}}}}_o}[{h_{t - 1}},{x_t}] + {b_o})$$ (20)

      式中:${{{\mathit{\boldsymbol{w}}}}_o}$为输出门${o_t}$$t$时刻的权值矩阵;${b_o}$表示偏置值。

      隐藏层的输出值通过$t$时刻输出值以及记忆单元状态值计算得到:

      $${h_t} = {o_t}\tan h({C_t})$$ (21)

      通过以上3种门机制的复合运算,LSTM确定最终的单元状态,并确定最终的输出值。

      由于LSTM网络中采用的是梯度下降算法进行网络权值和偏置值的更新,容易陷入局部最优从而降低模型的泛化能力,因此在模型训练过程中通过Adam算法为不同参数设定独立的学习率,从而提高运算效率和精度[19]

    • 在确定性预测的基础上,对其相对误差分布进行统计分析,得到各时段的误差分布,然后估计误差的分布特征[20]。与参数估计相比,非参数估计方法不需要提前假设误差分布,因此估计结果更接近实际值。其中,直方图密度估计和核密度估计(kernel density estimation,KDE)是最常用的两类估计方法,其中KDE在实际应用中更为简单有效。因此,本文基于KDE方法来确定误差的密度函数的估计以及置信区间的计算。

      KDE是基于样本本身估计的。如果随机变量$X$的密度函数为$f(x)$,经验分布函数为$F(x)$,则$f(x)$的简单估计为:

      $$f(x) = \frac{{F(x + h) - F(x - h)}}{{2h}}$$ (22)

      式中:$h$是非负常数。当$h \to 0$时,我们可以得到的近似估计为:

      $$\hat f(x) = \frac{1}{{Nh}}\sum\limits_{i = 1}^N {k\left(\frac{{x - {x_i}}}{h}\right)} $$ (23)

      式中:$N$为样本个数;$h$为窗宽;$k(x)$为核函数。本文采用高斯核函数,其表达式为:

      $$k(x) = \frac{1}{{\sqrt {2\pi } }}\exp \left( - \frac{{{x^2}}}{2}\right)$$ (24)

      在此基础上,可以计算一定置信水平下的置信区间。也就是说,在给定的置信水平为$1 - \alpha $的情况下,如果负荷值满足:

      $$P({\hat L_{{\rm{down}}}} < L < {\hat L_{{\rm{up}}}}) = 1 - \alpha $$ (25)

      则区间$[{\hat L_{{\rm{down}}}},{\hat L_{{\rm{up}}}}]$称为负荷值的置信区间,其中${\hat L_{{\rm{down}}}}$${\hat L_{{\rm{up}}}}$分别表示区间的下限和上限。

    • 本文采用“点预测+误差区间估计”的思路,构建短期负荷区间预测模型,模型中考虑温度、湿度、降水量、风速对负荷的影响,同时考虑工作日和非工作日负荷曲线存在较大差异性,将日类型因素考虑到模型中。在此基础上,考虑用电特性在相近的时间段具有一定的相似性,在模型的输入因素中加入待预测日前两天同一时刻的负荷值。图2为本文模型流程图。

      图  2  预测模型结构及计算流程图

      Figure 2.  Architecture and computation flowchart of the prediction model of the model

      模型具体预测流程如下:

      1)数据收集和预处理。搜集负荷及影响因素数据,各数据均采用下述公式实现标准化:

      $$x_{ij}' = \frac{{{x_{ij}} - {x_{\min j}}}}{{{x_{\max j}} - {x_{\min j}}}}$$ (26)

      式中:$x_{ij}'$为标准化后的数据;${x_{\max j}}$${x_{\min j}}$分别为第$i$个指标的最大值和最小值。

      2)负荷数据分解和重构。首先采用CEEMDAN方法得到原始负荷序列的若干本征模态分量。在此基础上,计算每个分量的样本熵,基于计算结果将所有本征模态分量进行重构。

      3)确定性负荷预测。采用LSTM模型分别对以上不同分量进行建模,得到各预测序列,将所有序列预测结果汇总得到确定性负荷预测结果。在此过程中,引入Adam优化器来提升LSTM结构的处理和预测性能。

      4)误差区间估计。对上一步预测误差进行统计,基于核密度估计方法对给定置信度下的误差置信区间进行估计。

      5)叠加前2步的预测和统计结果,得到最终的负荷预测区间。

    • 为了评估本文模型的点预测结果的优劣,引入平均绝对百分误差(MAPE),其公式如下。

      $${M_{APE}} = \frac{1}{N}\displaystyle \sum\limits_{i = 1}^N {\frac{{\left| {{y_i} - {{\hat y}_i}} \right|}}{{{y_i}}} \times 100\text{%} } $$ (27)

      式中:$N$为预测样本数量;${y_i}$为负荷实际值;${\hat y_i}$为负荷点预测值。

    • 为了评估区间预测结果,引入区间覆盖率(PICP)和区间平均宽度(PINAW)指标。其中,在同一置信水平下,PICP值越高,PINAW值越小,表明模型的性能更好,其公式如下:

      $$ {P_{ICP}} = \frac{1}{N}\sum\limits_{i = 1}^N {{\varepsilon _i}{\rm{ }}} {\varepsilon _i} = \left\{ {\begin{array}{*{20}{c}} {1,\;\;\;\;{\rm{ }}{y_i} \in [\hat P - \Delta {P_{Li}},\hat P + \Delta {P_{Ui}}]{\rm{ }}} \\ {0,\;\;\;\;{\rm{ }}{y_i} \notin [\hat P - \Delta {P_{Li}},\hat P + \Delta {P_{Ui}}]} \end{array}} \right. $$ (28)
      $${P_{INAW}} = \frac{1}{{NR}}\sum\limits_{i = 1}^N {(\Delta {P_L} + \Delta {P_U})} $$ (29)

      式中:${\varepsilon _i}$为布尔变量,点预测值在区间内时值为1,否则为0;$R$表示测试集的范围,用于对评价指标进行规范化。

      由于PICPPINAW只反映了单方面的评价标准,不能体现出预测结果的综合表现。因此,引入基于PICPPINAW的综合指标CWC作为综合评价指标,其计算公式如下:

      $${C_{WC}} = {P_{INAW}}(1 + \gamma {e^{ - \eta (PICP - \mu )}}),\eta > 0$$ (30)
      $$\gamma = \left\{ {\begin{array}{*{20}{c}} {0,PICP \geqslant \mu } \\ {1,PICP < \mu } \end{array}} \right.$$

      式中:$\eta $为大于零的参数,本文中取1;$\mu $为给定的置信水平。当覆盖率低于给定置信度时,给予指数级惩罚,当覆盖率达到给定置信度时,PICP将是唯一考虑的因素。

    • 本文采用中国北方某城市2018年9月1日至2018年11月24日共85天、2040个数据进行实证分析,考虑到工作日和非工作日负荷规律的差异性,本文分别对工作日和非工作日进行建模。同时,考虑到不同时间维度的负荷之间存在一定的相似性,在模型的输入中加入了待预测日前两天同一时刻的负荷值。对于不同日类型,均按照6:3:1的比例将样本集分为3个子集。子集1作为训练样本,用于LSTM结构和参数的训练;子集2用于统计预测误差以及对误差进行区间估计;子集3是待预测集,用于对点预测结果以及区间预测结果进行验证。建模过程中所用计算机配置为i5-8300H处理器,8 GB的内存,训练环境为GPU,所有过程在Matlab2016b中进行。

    • 本文利用CEEMDAN方法对不同类型日负荷分别进行分解,得到分解后的若干模态分量。以非工作日为例,分解结果见图3。其中,IMF1至IMF5波动性较大,IMF6至IMF8以及残差序列相对较为平滑。

      图  3  非工作日CEEMDAN分解结果

      Figure 3.  Decomposition result of CEEMDAN in nonworkdays

      考虑到将分解后的序列直接作为样本进行模型训练和预测,工作量较大,数据处理更为繁琐。因此只计算各个子序列的样本熵,其中,取$m = 2$$r = 0.2 \times {\rm{std}}({\rm{IMF}}i)$。计算结果见图4

      图  4  各子序列样本熵

      Figure 4.  Sample entropy of each sequence

      由以上计算结果可以发现,IMF4、IMF5、IMF6、IMF74个分量的样本熵相近,IMF8、IMF92个分量的样本熵相近,因此将其整合成新的IMF分量。以重构后的分量序列作为新的样本。

    • 为了验证本文模型点预测结果精度,选取了一些对比模型,包括集合经验模态分解−样本熵−长短期记忆神经网络(ensemble empirical mode decomposition-sample entropy-long and short-term memory,EEMD-SE-LSTM)、LSTM、自回归移动平均(autoregressive integrated moving average mode,ARIMA)、自适应模糊神经网络(adaptive network-based fuzzy inference system,ANFIS)模型。将子集1和2用作模型训练,子集3用作模型测试,利用上述模型分别进行预测。通过公式(27)计算模型预测的MAPE,将预测效果与本文模型进行对比。表1是对比结果,工作日和非工作日的预测结果见图5图6

      表 1  各模型实验误差

      Table 1.  Mean absolute percentage error of different models

      模型MAPE/%
      工作日非工作日
      CEEMDAN-SE-LSTM1.381.47
      EEMD-SE-LSTM1.421.50
      LSTM1.531.70
      ARIMA1.862.38
      ANFIS2.475.36

      图  5  工作日点预测结果对比

      Figure 5.  Comparison of point prediction results of workdays

      图  6  非工作日点预测结果对比

      Figure 6.  Comparison of point prediction results of nonworkdays

      结果显示,LSTM能够实现比ARIMA模型和ANFIS模型更高的预测精度,3种模型中ANFIS的预测精度最低,LSTM预测精度最高,且工作日和非工作日的预测结果表明LSTM具有较好的稳定性。此外,从分解组合预测的结果来看,在原有LSTM模型的基础上,CEEMDAN和EEMD的数据处理过程均能够进一步提高预测精度,并且本文中的分解方法的实用性更好。

    • 本文基于“点预测+区间估计”的思路,通过统计点预测模型预测误差,基于KDE方法估计一定置信水平下误差的置信区间。其中,具体思路为以子集1作为训练集,对子集2中的各时刻负荷进行预测。通过统计子集2预测的误差,得到工作日和非工作日的误差统计结果。此外,考虑到一天之内各时刻负荷具有较强的波动性,不同时段的负荷预测误差存在一定的差异性,因此在区间估计的时候,首先将24 h划分为不同时间段,在此基础上对每一时间段内的预测误差进行重复抽样,进而得到不同时间段中的预测误差置信区间。具体的时间段划分参见文献[21]。

      为了验证KDE估计方法在区间估计中的有效性,同时,由于本文中的区间估计方法是一种非参数估计,设置了不同对比模型,包括参数估计方法,假设误差分布服从正态分布[22],以及Bootstrap抽样方法[23]。采用上述方法分别对各时段误差分布进行统计和区间估计,将估计结果叠加到工作日和非工作日的点预测结果中,进而得到各时刻负荷的预测区间,通过公式(28)和(29)计算各模型的PICPPINAW,进而计算各模型的CWC值。详细对比结果见表2表3图7图8给出了不同置信水平下工作日和非工作日本文模型的区间预测结果。

      表 2  各模型区间预测效果(90%置信水平)

      Table 2.  Interval prediction effects of different models (90% confidence level)

      指标日类型Bootstrap估计正态分布估计核密度估计
      PICP工作日0.89550.85820.9104
      非工作日0.92650.88240.9118
      PINAW工作日0.17720.15120.1710
      非工作日0.19880.17810.1819
      CWC工作日0.35360.29620.1710
      非工作日0.19880.35310.1819

      表 3  各模型区间预测效果(95%置信水平)

      Table 3.  Intervalprediction effects of different models interval (95% confidence level)

      指标日类型Bootstrap估计正态分布估计核密度估计
      PICP工作日0.94030.88060.9701
      非工作日0.95590.94120.9853
      PINAW工作日0.19240.17450.2016
      非工作日0.27240.26730.2396
      CWC工作日0.38290.33730.2016
      非工作日0.27240.53230.2396

      图  7  工作日区间预测结果

      Figure 7.  Interval prediction results of workdays

      图  8  非工作日区间预测结果

      Figure 8.  Interval prediction results of nonworkdays

      相对于其他方法,相同的置信水平下,核密度估计的结果中,PICP指标更大,表明能够覆盖更多的负荷实际值,但PINAW指标不能保证小于Bootstrap估计核正态分布估计的结果,表明其区间宽度并不能达到最小。但综合指标CWC值显示,核密度估计的结果最小,反映出本文中所使用的核密度估计方法能够表现出更好的综合性能。

    • 本文基于CEEMDAN分解的负荷点预测能够有效提高预测精度,其预测效果略高于EEMD分解方法,同时,也验证了组合预测方法能够明显地提高预测效果,降低点预测误差。

      基于KDE的区间估计方法,可以进一步提高预测区间覆盖率,并降低区间平均宽度,其估计结果在CWC指标上表现出较好的性能。

      本文的预测是基于“点预测+区间估计”的思路,因此整体预测包含两个重要环节,一是要保证点预测的精度,二是在区间估计时要提高估计的准确性。本文采用的区间预测方法能够有效地提升预测效果,未来可考虑结合深度学习技术,在更多的大样本环境下,进一步提高模型的预测精度,同时也可以将预测拓展到可再生能源的出力预测等领域。

参考文献 (23)

目录

    /

    返回文章
    返回