留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于传感器网络与高斯过程回归的楼宇负荷预测

黄银燕 于超 黄文新 覃智君 毕乐明 杨琳

黄银燕, 于超, 黄文新, 等. 基于传感器网络与高斯过程回归的楼宇负荷预测[J]. 现代电力, 2021, 38(6): 664-673. doi: 10.19725/j.cnki.1007-2322.2020.0416
引用本文: 黄银燕, 于超, 黄文新, 等. 基于传感器网络与高斯过程回归的楼宇负荷预测[J]. 现代电力, 2021, 38(6): 664-673. doi: 10.19725/j.cnki.1007-2322.2020.0416
HUANG Yinyan, YU Chao, HUANG Wenxin, etc. Building Load Forecasting Based on Sensor Network and Gaussian Process Regression[J]. Modern Electric Power, 2021, 38(6): 664-673. doi: 10.19725/j.cnki.1007-2322.2020.0416
Citation: HUANG Yinyan, YU Chao, HUANG Wenxin, etc. Building Load Forecasting Based on Sensor Network and Gaussian Process Regression[J]. Modern Electric Power, 2021, 38(6): 664-673. doi: 10.19725/j.cnki.1007-2322.2020.0416

基于传感器网络与高斯过程回归的楼宇负荷预测

doi: 10.19725/j.cnki.1007-2322.2020.0416
基金项目: 国家自然科学基金项目(51767001)
详细信息
    作者简介:

    黄银燕(1994),女,硕士研究生,研究方向为电力负荷预测,E-mail:1812391017@st.gxu.edu.cn

    于超(1989),男,硕士研究生,研究方向为非侵入式电力负荷分解与机器学习,E-mail: 1812391076@st.gxu.edu.cn

    黄文新(1992),男,学士,助理工程师,主要从事人工智能应用于图像识别,数字信号处理工作,E-mail: wilsonHuang@wirush.ai

    覃智君(1977),男,博士,副教授,通信作者,研究方向为电力系统优化、高性能数值计算以及信息技术在电力系统中的应用,E-mail: zjqin@gxu.edu.cn

    毕乐明(1987),男,硕士,主要从事非接触式动作识别和生命特征检测工作,E-mail: billionbi@wirush.ai

    杨琳(1981),男,学士,主要从事数字信号处理和数据分析工作,E-mail: linkyang@wirush.ai

  • 中图分类号: TM715

Building Load Forecasting Based on Sensor Network and Gaussian Process Regression

Funds: National Natural Science Foundation of China (51767001)
  • 摘要: 建筑电力能耗的准确预测不仅对配电网运行的经济性和安全性具有重要作用,而且对建筑节能方案的制定也有参考意义。由于楼宇负荷受多种因素的影响,预测精度难以大幅提高。为了提高楼宇负荷预测的准确度,提出了基于传感器网络与高斯过程回归的楼宇负荷预测方法。首先,通过基于超宽频雷达的人员存在检测传感器网络对室内的建筑占有率进行检测,并将建筑占有率作为负荷预测模型的特征之一。其次,构建高斯过程回归模型,利用其拟合出负荷与相关影响因素的非线性函数,并基于采样的近似推断算法推断出模型的超参数最大后验估计值,进而提高短期负荷预测准确度。最后,通过对比不同协方差函数的高斯过程回归模型的预测效果,甄别出最优协方差函数,进一步提高预测精度。通过算例分析可知:采用所提方法比未考虑建筑占有率的传统高斯过程回归方法的平均绝对百分比误差降低了9.68%,验证了所提方法的有效性和准确性。
  • 图  1  雷达传感器网络

    Figure  1.  Radar sensor network

    图  2  传感器检测结果

    Figure  2.  Sensor detection results

    图  3  负荷预测曲线

    Figure  3.  Load forecasting curve

    图  4  参数采样图

    Figure  4.  Diagram of parameter sampling

    表  1  训练集与测试集的划分

    Table  1.   Division of train ing set and test ing set

    组别训练集时间段测试集时间段
    12017-4-18 00:00
    2017-5-18 23:00
    2017-5-19 00:00
    2017-5-20 23:00
    22017-04-20 00:00
    2017-05-20 23:00
    2017-05-21 00:00
    2017-05-22 23:00
    32017-04-22 00:00
    2017-05-22 23:00
    2017-05-23 00:00
    2017-05-24 23:00
    42017-04-24 00:00
    2017-05-24 23:00
    2017-05-25 00:00
    2017-05-26 23:00
    下载: 导出CSV

    表  2  测试集的划分

    Table  2.   Division of test ing set

    测试集组别测试集时间段样本数量
    12014-04-01 00:00
    2014-04-02 23:00
    48
    22014-04-03 00:00
    2014-04-04 23:00
    48
    32014-04-05 00:00
    2014-04-06 23:00
    48
    42014-04-07 00:00
    2014-04-08 23:00
    48
    下载: 导出CSV

    表  3  2种参数求取方法的预测结果(Matern32)

    Table  3.   Prediction results of two parameter calculation methods (Matern32)

    测试集最大后验估计极大似然估计
    R2RMSEMAPE/%R2RMSEMAPE/%
    测试集10.7248.6620.070.4468.1925.19
    测试集20.9239.6415.67 0.943.3416.08
    测试集30.9541.75 9.570.8865.4619.03
    测试集40.8271.7617.19 0.792.3527.06
    下载: 导出CSV

    表  4  最大后验估计下不同协方差函数的预测结果

    Table  4.   The prediction results of different covariance functions under the maximum posterior estimation

    测试集Matern32Matern52EQRQ
    R2RMSEMAPE/%R2RMSEMAPE/%R2RMSEMAPE/%R2RMSEMAPE/%
    测试集10.9813.644.450.9814.544.830.9716.925.270.9522.16.57
    测试集20.9812.283.770.98611.163.600.9811.734.030.9521.716.54
    测试集30.8125.389.800.7628.4211.420.6832.3713.560.4642.0817.29
    测试集40.9616.354.220.9617.414.420.9519.455.300.9519.996.40
    下载: 导出CSV

    表  5  极大似然估计下不同协方差函数的预测结果

    Table  5.   The prediction results of different covariance functions under maximum likelihood estimation

    测试集Matern32Matern52EQRQ
    R2RMSEMAPE/%R2RMSEMAPE/%R2RMSEMAPE/%R2RMSEMAPE/%
    测试集10.9521.355.880.9423.947.370.8537.0611.880.9522.186.52
    测试集20.9422.36.950.9423.327.390.9325.779.620.9522.096.84
    测试集30.4642.1517.540.4137.6818.350.2151.220.100.540.6616.50
    测试集40.9420.16.270.9422.327.130.8731.7910.290.9520.156.41
    下载: 导出CSV

    表  6  最大后验估计法的预测结果

    Table  6.   Prediction results of the maximum a posteriori estimate method

    测试集有建筑占有率无建筑占有率
    R2RMSEMAPE/%R2RMSEMAPE/%
    测试集10.9813.644.450.9813.885.33
    测试集20.9812.283.770.9813.084.70
    测试集30.8125.389.800.7429.5611.66
    测试集40.9616.354.220.9519.094.79
    下载: 导出CSV

    表  7  极大似然估计法的预测结果

    Table  7.   Prediction results of maximum likelihood estimation method

    测试集有建筑占有率无建筑占有率
    R2RMSEMAPE/%R2RMSEMAPE/%
    测试集10.9521.355.880.9522.45.98
    测试集20.9422.36.950.9423.187.12
    测试集30.4642.1517.540.3745.7919.48
    测试集40.9420.16.270.9421.496.38
    下载: 导出CSV

    表  8  参数采样结果可视化表

    Table  8.   Visual table of parameter sampling results

    参数均值标准差置信区间为3%置信区间为97%$\hat R$
    l16.1790.2735.6996.7271.0
    l22.9620.2612.4943.4521.0
    l316.0871.44413.40818.8181.0
    l44.7790.7233.5536.2671.0
    l50.8340.1470.5901.1121.0
    l613.7041.19211.42515.8601.0
    η66.4173.13960.87772.4931.0
    σ0.8740.5510.0051.7991.0
    下载: 导出CSV
  • [1] 侯博文, 谭泽汉, 陈焕新, 等. 基于支持向量机的建筑能耗预测研究[J]. 制冷技术, 2019, 39(2): 1−6. doi:  10.3969/j.issn.2095-4468.2019.02.101

    HOU Bowen, TAN Zehan, CHEN Huanxin, et al. Research on building energy consumption prediction based on support vector machine[J]. Chinese Journal of Refrigeration Technology, 2019, 39(2): 1−6(in Chinese). doi:  10.3969/j.issn.2095-4468.2019.02.101
    [2] 李嘉玲, 蒋艳. 基于BP神经网络的公共建筑用电能耗预测研究[J]. 软件导刊, 2019, 39(2): 1−6.

    LI Jialing, JIANG Yan. Research on prediction of electricity consumption of public buildings based on BP neural network[J]. Software Guide, 2019, 39(2): 1−6(in Chinese).
    [3] 苏运, 田英杰, 郭乃网, 等. 基于移动人流数据的商业楼宇负荷用电预测[J]. 计算机应用与软件, 2019, 36(5): 21−24, 90. doi:  10.3969/j.issn.1000-386x.2019.05.004

    SU Yun, TIAN Yingjie, GUO Naiwang, et al. Commercial building load prediction based on mobile people data[J]. Computer Applications and Software, 2019, 36(5): 21−24, 90(in Chinese). doi:  10.3969/j.issn.1000-386x.2019.05.004
    [4] 杨秀, 陈斌超, 朱兰, 等. 基于相关性分析和长短期记忆网络分位数回归的短期公共楼宇负荷概率密度预测[J]. 电网技术, 2019, 43(9): 3061−3071.

    YANG Xiu, CHEN Binchao, ZHU Lan, et al. Short-term public building load probability density prediction based on correlation analysis and long-and short-term memory network quantile regression[J]. Power System Technology, 2019, 43(9): 3061−3071(in Chinese).
    [5] BARBOUR E, DAVILA C C, GUPTA S, et al. Planning for sustainable cities by estimating building occupancy with mobile phones[J]. Nature Communications, 2019, 3736: 1−10.
    [6] 吴润泽, 包正睿, 宋雪莹, 等. 基于深度学习的电网短期负荷预测方法研究[J]. 现代电力, 2018, 35(2): 43−48. doi:  10.3969/j.issn.1007-2322.2018.02.007

    WU Runze, BAO Zhengrui, SONG Xueying, et al. Research on short-term load forecasting method of power grid based on deep learning[J]. Modern Electric Power, 2018, 35(2): 43−48(in Chinese). doi:  10.3969/j.issn.1007-2322.2018.02.007
    [7] 廖旎焕, 胡智宏, 马莹莹, 等. 电力系统短期负荷预测方法综述[J]. 电力系统保护与控制, 2011, 39(1): 147−152. doi:  10.3969/j.issn.1674-3415.2011.01.028

    LIAO Nihuan, HU Zhihong, MA Yingying, et al. Review of the short-term load forecasting methods of electric power system[J]. Power System Protection and Control, 2011, 39(1): 147−152(in Chinese). doi:  10.3969/j.issn.1674-3415.2011.01.028
    [8] 夏博, 杨超, 李冲. 电力系统短期负荷预测方法研究综述[J]. 电力大数据, 2018, 21(7): 22−28.

    XIA Bo, YANG Chao, LI Chong. Review of the short-term load forecasting methods of electric power system[J]. Power Systems and Big Data, 2018, 21(7): 22−28(in Chinese).
    [9] 李正浩, 李孟凡. 基于深度学习的智能型负荷预测方法的研究[J]. 智慧电力, 2020, 48(10): 78−85, 112. doi:  10.3969/j.issn.1673-7598.2020.10.013

    LI Zhenghao, LI Mengfan. Smart load forecasting method based on deep learning[J]. Smart Power, 2020, 48(10): 78−85, 112(in Chinese). doi:  10.3969/j.issn.1673-7598.2020.10.013
    [10] 王飞, 李东珺, 闫冬, 等. 基于高斯过程回归的建筑物震陷量预测模型[J]. 科学技术与工程, 2020, 20(16): 6666−6671. doi:  10.3969/j.issn.1671-1815.2020.16.055

    WANG Fei, LI Dongjun, YAN Dong, et al. Prediction of building settlements due to earthquake based on Gauss process regression model[J]. Science Technology and Engineering, 2020, 20(16): 6666−6671(in Chinese). doi:  10.3969/j.issn.1671-1815.2020.16.055
    [11] RASMUSSEN C E, WILLIAMS C K I. Gaussian processes for machine learning[M]. Boston: The MIT Press, 2006: 7−32.
    [12] 何志昆, 刘光斌, 赵曦晶, 等. 高斯过程回归方法综述[J]. 控制与决策, 2013, 28(8): 1121−1129, 1137.

    HE Zhikun, LIU Guangbin, ZHAO Xijing, et al. Overview of Gaussian process regression[J]. Control and Decision, 2013, 28(8): 1121−1129, 1137(in Chinese).
    [13] 崔佳旭, 杨博. 贝叶斯优化方法和应用综述[J]. 软件学报, 2018, 29(10): 3068−3090.

    CUI Jiaxu, YANG Bo. Survey on Bayesian optimization methodology and applications[J]. Journal of Software, 2018, 29(10): 3068−3090(in Chinese).
    [14] 朱泓钰. 高斯过程模型对股票价格的预测研究[D]. 昆明: 云南大学, 2017.
    [15] CAMERON DAVIDSON-PILON. 贝叶斯方法: 概率编程与贝叶斯推断[M]. 辛愿, 钟黎, 欧阳婷, 译. 北京: 人民邮电出版社, 2017: 12-61.
    [16] 王巍. 基于稀疏高斯过程回归的锂电池剩余寿命预测[D]. 北京: 北京交通大学, 2018.
    [17] 许永秀, 田雨波, 胡晓朋, 等. 基于一种新形核函数高斯过程的双频微带天线设计[J]. 计算机应用研究, 2018(8): 2477−2479. doi:  10.3969/j.issn.1001-3695.2018.08.060

    XU Yongxiu, TIAN Yubo, HU Xiaopeng, et al. Design of dual band microstrip antenna based on Gauss process with new kernel function[J]. Application Research of Computers, 2018(8): 2477−2479(in Chinese). doi:  10.3969/j.issn.1001-3695.2018.08.060
    [18] 宗文婷, 卫志农, 孙国强, 等. 基于改进高斯过程回归模型的短期负荷区间预测[J]. 电力系统及其自动化学报, 2017, 29(8): 22−28. doi:  10.3969/j.issn.1003-8930.2017.08.004

    ZONG Wenting, WEI Zhinong, SUN Guoqiang, et al. Short-term load interval prediction based on improved Gaussian process regression model[J]. Proceedings of the CSU-EPSA, 2017, 29(8): 22−28(in Chinese). doi:  10.3969/j.issn.1003-8930.2017.08.004
    [19] 李香云, 任帅, 张卫钢, 等. 基于高斯过程回归的公交到站预测方法[J]. 计算机技术与发展, 2019, 29(10): 21−25. doi:  10.3969/j.issn.1673-629X.2019.10.005

    LI Xiangyun, REN Shuai, ZHANG Weigang, et al. A bus-to-station prediction method based on Gaussian process regression[J]. Computer Technology and Development, 2019, 29(10): 21−25(in Chinese). doi:  10.3969/j.issn.1673-629X.2019.10.005
    [20] 梁智, 孙国强, 卫志农, 等. 基于变量选择与高斯过程回归的短期负荷预测[J]. 电力建设, 2017, 38(2): 122−128. doi:  10.3969/j.issn.1000-7229.2017.02.017

    LIANG Zhi, SUN Guoqiang, WEI Zhinong, et al. Short-term load forecasting based on variable selection and Gaussian process regression[J]. Electric Power Construction, 2017, 38(2): 122−128(in Chinese). doi:  10.3969/j.issn.1000-7229.2017.02.017
    [21] 苏国韶, 张研, 张小飞. 高斯过程机器学习方法在地下水位预测中的应用[J]. 中国农村水利水电, 2008(12): 48−50, 54.

    SU Guoshao, ZHANG Yan, ZHANG Xiaofei. Application of Gaussian process machine learning to the prediction of groundwater level[J]. China Rural Water and Hydropower, 2008(12): 48−50, 54(in Chinese).
    [22] 韩春颖, 周亚同, 常和玲, 等. 基于稀疏高斯过程混合模型的短时交通流预测[J]. 交通信息与安全, 2019, 37(1): 121−127. doi:  10.3963/j.issn.1674-4861.2019.01.016

    HAN Chunying, ZHOUYatong, CHANG Heling, et al. A short-term forecasting of traffic flow based on a mixture model of sparse Gaussian process[J]. Journal of Transport Information and Safety, 2019, 37(1): 121−127(in Chinese). doi:  10.3963/j.issn.1674-4861.2019.01.016
    [23] 唐云辉. 基于高斯过程回归的电力负荷预测算法[J]. 电子器件, 2018, 41(6): 1436−1440. doi:  10.3969/j.issn.1005-9490.2018.06.017

    TANG Yunhui. Load forecasting algorithm based on Gauss process regression[J]. Chinese Journal of Electron Devices, 2018, 41(6): 1436−1440(in Chinese). doi:  10.3969/j.issn.1005-9490.2018.06.017
    [24] 顾熹, 廖志伟. 基于相空间重构和高斯过程回归的短期负荷预测[J]. 电力系统保护与控制, 2017, 45(5): 73−79. doi:  10.7667/PSPC160389

    GU Xi, LIAO Zhiwei. Short-term load forecasting based on phase space reconstruction and Gaussian process regression[J]. Power System Protection and Control, 2017, 45(5): 73−79(in Chinese). doi:  10.7667/PSPC160389
    [25] 高凯, 闫春生, 李正文, 等. 基于广域量测和高斯过程分类器的暂态稳定评估[J]. 现代电力, 2017, 34(2): 56−61. doi:  10.3969/j.issn.1007-2322.2017.02.009

    GAO Kai, YAN Chunsheng, LI Zhengwen, et al. Transient stability assessment based on WAMS and Gaussian process classifier[J]. Model Electric Power, 2017, 34(2): 56−61(in Chinese). doi:  10.3969/j.issn.1007-2322.2017.02.009
    [26] 奥斯瓦尔多·马丁. Python贝叶斯分析[M]. 北京: 人民邮电出版社, 2018: 27−51.
    [27] 何立杰, 何洪林, 任小丽, 等. 基于贝叶斯机器学习的生态模型参数优化方法研究[J]. 地球信息科学学报, 2017, 19(10): 1270−1278.

    HE Lijie, HE Honglin, REN Xiaoli, et al. Parameters optimization method of ecosystem model based on Bayesian. machine learning[J]. Journal of Geo-Information Science, 2017, 19(10): 1270−1278(in Chinese).
    [28] 李军, 杜雪. 稀疏高斯过程在短期风电功率概率预测中的应用[J]. 电机与控制学报, 2019, 23(8): 67−77.

    LI Jun, DU Xue. Application of sparse Gaussian process in short-term wind power probability prediction[J]. Electric Machines and Control, 2019, 23(8): 67−77(in Chinese).
    [29] 樊煜. 基于高斯过程混合模型的时间序列多模态回归预测[D]. 天津: 河北工业大学, 2016.
    [30] 包学志. 基于贝叶斯原理的4D-CT图像肝脏呼吸运动预测方法研究[D]. 深圳: 中国科学院大学(中国科学院深圳先进技术研究院), 2020.
    [31] GRADITI G, CIAVARELLA R, VALENTI M, et al. Advanced forecasting method to the optimal management of a DC microgrid in presence of uncertain generation[C]//Palermo: 2015 International Conference aon Renewable Energy Research and Applications(ICRERA), IEEE, 2015: 1586−1590.
    [32] https://github.com/sl-chen/Energy_forecasting [DB/OL].
    [33] YAN Bin, LI Xiwang, SHI Wenbo, et al. Forecasting building energy demand under uncertainty using Gaussian process regression: feature selection, baseline prediction, parametric analysis and a web-based tool[C]//Proceedings of the 15th IBPSA Conference, San Francisco, 2017: 545−554.
    [34] 卜凡鹏, 田世明, 蒲天骄, 等. 基于气象与移动数据的楼宇短期负荷预测[J]. 测绘地理信息, 2019, 44(4): 73−76.

    BU Fanpeng, TIAN Shiming, PU Tianjiao, et al. Short-term load forecasting of buildings based on meteorological and mobile data[J]. Journal of Geomatics, 2019, 44(4): 73−76.
    [35] 林琳, 鞠森, 于立杰. 居民用电负荷超短期预测研究[J]. 电子测量技术, 2019, 42(9): 98−101.

    LIN Lin, JU Sen, YU Lijie. Research on ultra-short-term prediction of residential electricity consumption[J]. Electronic Measurement Technology, 2019, 42(9): 98−101(in Chinese).
    [36] 韦琦, 杨明. 改进神经网络算法的智能电网短期负荷预测[J]. 哈尔滨理工大学学报, 2017, 22(4): 65−69.

    WEI Qi, YANG Ming. Short term load forecasting based on improved neural network algorithm[J]. Journal of Harbin University of Science and Technology, 2017, 22(4): 65−69(in Chinese).
    [37] YAN Bin. A Bayesian approach for predicting building cooling and heating consumption and applications in fault detection[D]. Philadelphia: University of Pennsylvania, 2013.
    [38] 苗英杰, 崔琛, 易仁杰. 基于BFGS拟牛顿法的观测矩阵优化算法[J]. 电子信息对抗技术, 2019, 34(6): 32−37, 55. doi:  10.3969/j.issn.1674-2230.2019.06.008

    MIAO Yingjie, CUI Chen, YI Renjie. An optimization algorithm of measurement matrix based on BFGS quasi-newton method[J]. Electronic Information Warfare Technology, 2019, 34(6): 32−37, 55(in Chinese). doi:  10.3969/j.issn.1674-2230.2019.06.008
  • [1] 黄飞虎, 赵红磊, 弋沛玉, 李沛东, 彭舰.  一种改进Transformer的电力负荷预测方法 . 现代电力, 2023, 40(1): 50-58. doi: 10.19725/j.cnki.1007-2322.2021.0209
    [2] 张东东, 江成洲, 黄宵宁, 杨成顺, 余佶成, 岳长喜, 李磊.  直流配电网隧道磁电阻传感器外磁场干扰模型及其抑制方法研究 . 现代电力, 2022, 39(1): 113-120. doi: 10.19725/j.cnki.1007-2322.2021.0061
    [3] 陈忠华, 朱军, 王育飞, 凌晨.  基于一致性K均值聚类的电动汽车充电负荷建模方法 . 现代电力, 2022, 39(3): 338-346. doi: 10.19725/j.cnki.1007-2322.2021.0107
    [4] 张美霞, 吴子敬, 杨秀.  基于动态能耗模型与用户心理的电动汽车充电负荷预测 . 现代电力, 2022, 39(6): 710-719. doi: 10.19725/j.cnki.1007-2322.2021.0196
    [5] 方娜, 李俊晓, 陈浩, 李新新.  基于变分模态分解的卷积神经网络−双向门控循环单元−多元线性回归多频组合短期电力负荷预测 . 现代电力, 2022, 39(4): 441-448. doi: 10.19725/j.cnki.1007-2322.2021.0130
    [6] 龙虹毓, 周游, 陈芳幸, 胡晓锐, 徐婷婷, 龙羿.  基于山地城市电动汽车负荷特性的充电设施规划 . 现代电力, 2021, 38(): 1-9. doi: 10.19725/j.cnki.1007-2322.2022.0195
    [7] 魏明奎, 叶葳, 沈靖, 周泓, 蔡绍荣, 王渝红, 沈力.  基于自组织特征神经网络和最小二乘支持向量机的短期电力负荷预测方法 . 现代电力, 2021, 38(1): 17-23. doi: 10.19725/j.cnki.1007-2322.2020.0201
    [8] 李君卫, 汤亚芳, 郝正航, 冒国龙, 姜有泉.  聚类分析及其在电力系统中的应用综述 . 现代电力, 2019, 36(3): 1-10.
    [9] 龚钢军, 安晓楠, 陈志敏, 张帅, 文亚凤, 吴秋新, 苏畅.  基于SAE-ELM的电动汽车充电站负荷预测模型 . 现代电力, 2019, 36(6): 9-15.
    [10] 苏运, 卜凡鹏, 郭乃网, 田世明, 田英杰, 张琪祁, 瞿海妮, 柳劲松.  基于低秩表示的多任务短期电力负荷预测的研究 . 现代电力, 2019, 36(3): 58-65.
    [11] 梁海峰, 刘博, 郑灿, 曹大卫, 高亚静.  智能电网下基于负荷识别的居民电动汽车需求响应特性建模方法研究 . 现代电力, 2018, 35(5): 1-9.
    [12] 周凌锋, 王杰.  基于时空分布负荷预测的电动汽车充电优化 . 现代电力, 2018, 35(5): 10-16.
    [13] 戚任远.  上海用电负荷预测中气温累积效应分析 . 现代电力, 2018, 35(2): 38-42.
    [14] 吴润泽, 包正睿, 宋雪莹, 邓 伟.  基于深度学习的电网短期负荷预测方法研究 . 现代电力, 2018, 35(2): 43-48.
    [15] 高 凯, 闫春生, 李正文, 韩子娇, 田博文, 李 扬, 李国庆.  基于广域量测和高斯过程分类器的暂态稳定评估 . 现代电力, 2017, 34(2): 56-61.
    [16] 张春燕, 张映月, 滕 俊, 盛 吉, 商 超, 王 伟.  基于光纤超声传感器的油纸绝缘局部放电超声波信号特性试验研究 . 现代电力, 2016, 33(6): 56-63.
    [17] 刘青, 戚中译.  考虑空间运动特性的规模化电动汽车接入电网负荷预测模型 . 现代电力, 2015, 32(1): 76-82.
    [18] 徐海瑞, 李成榕, 张 博, 许 军, 孙则来.  宽频带窗口式VFTO测量传感器研究 . 现代电力, 2011, 28(2): 1-6.
    [19] 崔 勇, 王 川, 陈小龙, 范名贵.  基于灰色马尔科夫预测模型的中长期电力负荷预测 . 现代电力, 2011, 28(3): 38-41.
    [20] 刘家军, 王明军, 姚李孝, 张小庆, 薛美娟.  基于Theil不等系数的IOWHA算子组合模型年用电量预测新方法 . 现代电力, 2010, 27(5): 44-48.
  • 加载中
图(4) / 表 (8)
计量
  • 文章访问数:  404
  • HTML全文浏览量:  79
  • PDF下载量:  28
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-12-02
  • 网络出版日期:  2021-12-07
  • 刊出日期:  2021-12-10

基于传感器网络与高斯过程回归的楼宇负荷预测

doi: 10.19725/j.cnki.1007-2322.2020.0416
    基金项目:  国家自然科学基金项目(51767001)
    作者简介:

    黄银燕(1994),女,硕士研究生,研究方向为电力负荷预测,E-mail:1812391017@st.gxu.edu.cn

    于超(1989),男,硕士研究生,研究方向为非侵入式电力负荷分解与机器学习,E-mail: 1812391076@st.gxu.edu.cn

    黄文新(1992),男,学士,助理工程师,主要从事人工智能应用于图像识别,数字信号处理工作,E-mail: wilsonHuang@wirush.ai

    覃智君(1977),男,博士,副教授,通信作者,研究方向为电力系统优化、高性能数值计算以及信息技术在电力系统中的应用,E-mail: zjqin@gxu.edu.cn

    毕乐明(1987),男,硕士,主要从事非接触式动作识别和生命特征检测工作,E-mail: billionbi@wirush.ai

    杨琳(1981),男,学士,主要从事数字信号处理和数据分析工作,E-mail: linkyang@wirush.ai

  • 中图分类号: TM715

摘要: 建筑电力能耗的准确预测不仅对配电网运行的经济性和安全性具有重要作用,而且对建筑节能方案的制定也有参考意义。由于楼宇负荷受多种因素的影响,预测精度难以大幅提高。为了提高楼宇负荷预测的准确度,提出了基于传感器网络与高斯过程回归的楼宇负荷预测方法。首先,通过基于超宽频雷达的人员存在检测传感器网络对室内的建筑占有率进行检测,并将建筑占有率作为负荷预测模型的特征之一。其次,构建高斯过程回归模型,利用其拟合出负荷与相关影响因素的非线性函数,并基于采样的近似推断算法推断出模型的超参数最大后验估计值,进而提高短期负荷预测准确度。最后,通过对比不同协方差函数的高斯过程回归模型的预测效果,甄别出最优协方差函数,进一步提高预测精度。通过算例分析可知:采用所提方法比未考虑建筑占有率的传统高斯过程回归方法的平均绝对百分比误差降低了9.68%,验证了所提方法的有效性和准确性。

English Abstract

黄银燕, 于超, 黄文新, 等. 基于传感器网络与高斯过程回归的楼宇负荷预测[J]. 现代电力, 2021, 38(6): 664-673. doi: 10.19725/j.cnki.1007-2322.2020.0416
引用本文: 黄银燕, 于超, 黄文新, 等. 基于传感器网络与高斯过程回归的楼宇负荷预测[J]. 现代电力, 2021, 38(6): 664-673. doi: 10.19725/j.cnki.1007-2322.2020.0416
HUANG Yinyan, YU Chao, HUANG Wenxin, etc. Building Load Forecasting Based on Sensor Network and Gaussian Process Regression[J]. Modern Electric Power, 2021, 38(6): 664-673. doi: 10.19725/j.cnki.1007-2322.2020.0416
Citation: HUANG Yinyan, YU Chao, HUANG Wenxin, etc. Building Load Forecasting Based on Sensor Network and Gaussian Process Regression[J]. Modern Electric Power, 2021, 38(6): 664-673. doi: 10.19725/j.cnki.1007-2322.2020.0416
    • 我国建筑能耗快速上升,目前已占到总能耗的29%[1],因而楼宇节能问题已经引起工业界和学术界的广泛关注。针对该问题的主要解决思路是利用楼宇负荷预测促进楼宇节能方案的制定,实现建筑能耗的降低[2]。例如:通过楼宇负荷预测可以了解楼宇用电的高低峰,合理分配设备在用电峰谷时段的用电需求[3]

      楼宇负荷受多方面因素影响,预测精度难以大幅提高。因此,本文将进一步挖掘影响负荷波动的因素,提升楼宇负荷预测模型的准确度。在建筑研究领域中,一般采用建筑占有率表示人员在建筑中的存在情况[4]。2019年发表在Nature杂志上的文献[5]提出建筑占有率是影响建筑能耗的特征之一,准确的建筑占有率对建筑能耗预测至关重要。该文献提出了一种检测移动手机信号得出楼宇中建筑占有率数据的方法。但该方法存在操作繁杂、泄露隐私等缺点。

      在负荷预测领域,常用的预测算法有时间序列法、灰色预测法、回归分析法等[6-7]。时间序列法的运算速度比较快,但没有考虑影响负荷波动的因素,负荷预测误差较大[8];灰色预测法虽然预测精度较高,但其最佳参数难以确定[9]。高斯过程(Gaussian process,GP)回归是基于贝叶斯框架下的机器学习方法[10-11],对高维度、小样本的数据具有较强的处理能力,并具有容易实现、收敛性好、超参数自适应性等特点[12]。传统高斯过程回归是通过求取极大似然估计值获得模型最优超参数,模型容易产生过拟合现象,降低预测准确度。

      针对传统高斯过程回归出现的过拟合问题,本文将通过求取超参数的最大后验估计值来解决。基于最大后验估计的高斯过程回归模型是对先验分布和似然函数的乘积求取最大值以获得最优超参数,可以降低模型的复杂程度,减少训练过程中过拟合情况的发生,且不会对样本集造成浪费[13-14]。但是最大后验估计无法获得一个封闭的解析解,为了求出最大后验估计值并确定唯一的高斯过程回归模型,本文采用基于采样的近似推断算法求取最大后验估计的数值解[15]

      高斯过程回归模型中的协方差函数反映了不同样本集之间的相似性和相关性,对高斯过程回归模型的预测性能起到关键作用[16],且不同协方差函数对相同数据集有不同的学习效果[17]。因此本文研究了常见的几种协方差函数的预测效果,并甄别出最优的协方差函数。

    • 为了将准确的建筑占有率特征用于预测模型中,本文利用挪威Novelda公司开发的人员存在检测传感器XeThru X4M300构建检测系统,对室内人员实时计数。本文选用人员存在检测传感器获取建筑占有率的主要原因有以下3点:1)该雷达传感器的检测范围广、测量精度高、穿透力强、适用于建筑占有率的测量;2)雷达传感器不同于其它直观的智能监控系统,可以保护室内人员的隐私,适用于私密性比较强的场合;3)雷达传感器不会受到温度、光照、恶劣天气等外部因素的影响。

      本文所构建的实验平台如图1所示,雷达传感器安装在房间天花板中。雷达传感器反射信号,形成点云,后台显示出3D点云。比如,当室内有3个人时,点云如图2所示,通过点云聚类,可以判断人数为3。本文将传感器平台得到的建筑占有率数据,对数据集进行补充。

      图  1  雷达传感器网络

      Figure 1.  Radar sensor network

      图  2  传感器检测结果

      Figure 2.  Sensor detection results

    • 高斯过程回归模型可以从权重空间角度或函数空间角度来表示[18]。本文从函数空间的角度出发,定义一个高斯过程模型来描述函数分布。高斯过程实际上是一个无限元的随机变量的高斯分布,由无限维分布的均值函数m(x)和协方差函数$K({\boldsymbol{x}},{{\boldsymbol{x}}}')$共同表示[19],对于任意的x${{\boldsymbol{x}}}'$,高斯过程模型可以表示为

      $$f({{\boldsymbol{x}}}) \sim {\rm{GP}}[m({{\boldsymbol{x}}}),K({{\boldsymbol{x}}},{{\boldsymbol{x}}}')]$$ (1)

      由公式(1)可知,空间中的每一个点都有一个与之对应的正态分布变量,高斯过程就是这无限多个随机变量的联合概率分布。

    • 负荷预测过程中,可以定义函数空间$f({{\boldsymbol{x}}}), $$ f({{{\boldsymbol{x}}}^{(1)}}),f({{{\boldsymbol{x}}}^{(2)}}), \cdot \cdot \cdot,f({{{\boldsymbol{x}}}^{(n)}})$构成随机变量的一个集合,服从联合高斯分布。假设观测负荷$y$有白噪声$\varepsilon $,即$y = f({{\boldsymbol{x}}}) + \varepsilon $$\varepsilon $是一个均值为0,方差为${\sigma ^2}$的服从高斯分布的独立随机变量,可表示为$\varepsilon {\rm{\sim}}N(0,{\sigma ^2})$。因为噪声$\varepsilon $是完全独立于负荷函数$f({{\boldsymbol{x}}})$的高斯白噪声,当$f({{\boldsymbol{x}}})$服从高斯分布时,则负荷观测值$y$的联合分布的集合也是一个高斯过程。

      本文构建高斯过程回归模型预测负荷时[20-25],训练集可由式(2)表示:

      $${\boldsymbol{D}} = \left\{ {\left( {{{{\boldsymbol{x}}}_k},{y_k}} \right)\left| {k = 1,2, \cdot \cdot \cdot ,n} \right.} \right\} = \left( {{{\boldsymbol{X}}},{{\boldsymbol{Y}}}} \right)$$ (2)

      式中:${{{\boldsymbol{x}}}_k} \in {{\mathbf{R}}^d}$$d$维特征矩阵;${y_k} \in {\mathbf{R}}$${{{\boldsymbol{x}}}_k}$通过函数运算后的输出负荷值;$n$表示负荷训练集样本的数量;${{\boldsymbol{X}}} = \left\{ {{{{\boldsymbol{x}}}_1},{{{\boldsymbol{x}}}_2}, \cdot \cdot \cdot ,{{{\boldsymbol{x}}}_n}} \right\}$表示训练输入矩阵;${\boldsymbol{Y}} $为训练输出变量。

      ${n^ * }$组测试集数据如式(3)所示:

      $$\begin{split} {{{\boldsymbol{D}}}_*} = &\{ ({{{\boldsymbol{x}}}_k},{y_k}\left| k = n + 1,k = n + 2, \cdot \cdot \cdot ,\right. \\ &\left.k = n + {n^*} \right)\} = \left( {{{{\boldsymbol{X}}}_ * },{{{\boldsymbol{f}}}_ * }} \right) \end{split}$$ (3)

      式中:${{{\boldsymbol{X}}}_*}$为包含多个特征的测试集数据;${{{\boldsymbol{f}}}_{\rm{*}}}$${{{\boldsymbol{X}}}_*}$经过函数输出的预测负荷。

      那么训练样本内的观测值${{\boldsymbol{Y}}}$和预测值${{{\boldsymbol{f}}}_{\rm{*}}}$之间构成的联合分布如式(4)所示:

      $$\left[ {\begin{array}{*{20}{c}} {\boldsymbol{Y}} \\ {{{\boldsymbol{f}}_*}} \end{array}} \right] \sim N\left( {0,\left[ {\begin{array}{*{20}{c}} {K\left( {{{\boldsymbol{X}}},{{\boldsymbol{X}}}} \right) + {\sigma ^2}{{\boldsymbol{I}}}}&{K\left( {{{\boldsymbol{X}}},{{{\boldsymbol{X}}}_*}} \right)} \\ {K\left( {{{{\boldsymbol{X}}}_{\rm{*}}},{{\boldsymbol{X}}}} \right)}&{K\left( {{{{\boldsymbol{X}}}_*},{K_*}} \right)} \end{array}} \right]} \right)$$ (4)

      式中:$K\left( {{{\boldsymbol{X}}},{{{\boldsymbol{X}}}_*}} \right) = K{\left( {{{\boldsymbol{X}}},{{{\boldsymbol{X}}}_*}} \right)^{\rm{T}}}$是训练集数据的X和测试集数据${{{\boldsymbol{X}}}_ * }$之间的协方差矩阵;$K\left( {{{{\boldsymbol{X}}}_*},{{{\boldsymbol{X}}}_*}} \right)$是测试集数据${{{\boldsymbol{X}}}_ * }$自身的协方差矩阵;${{\boldsymbol{I}}}$为单位矩阵。

      由此可以得出预测值${{{\boldsymbol{f}}}_{\rm{*}}}$的后验分布由式(5)—(7)所示:

      $${{{\boldsymbol{f}}}_ * }\left| {{{\boldsymbol{X}}},{{\boldsymbol{Y}}},{{{\boldsymbol{X}}}_ * }} \right. \sim N[{\bar {{\boldsymbol{f}}}_ * },\operatorname{cov} ({{{\boldsymbol{f}}}_ * })]$$ (5)
      $${\bar {{\boldsymbol{f}}}_ * } = K({{{\boldsymbol{X}}}_ * },{{\boldsymbol{X}}}){\left[ {K({{\boldsymbol{X}}},{{\boldsymbol{X}}}) + \sigma _n^2 {{\boldsymbol{I}}}} \right]^{ - 1}}{{\boldsymbol{Y}}}$$ (6)
      $$\begin{split} \operatorname{cov}\left({{\boldsymbol{f}}}_{*}\right)=&K\left(\boldsymbol{X}_{*}, \boldsymbol{X}_{*}\right)- K\left(\boldsymbol{X}_{*}, \boldsymbol{X}\right) \times\\ &\left[K(\boldsymbol{X}, \boldsymbol{X})+\sigma_{n}^{2} \boldsymbol{I}_{n}\right]^{-1} K\left(\boldsymbol{X}, \boldsymbol{X}_{*}\right) \end{split} $$ (7)

      式中:${\bar {{\boldsymbol{f}}}_ * }$为测试集数据${{{\boldsymbol{X}}}_ * }$经过高斯过程回归预测模型的均值向量;$\operatorname{cov} ({{{\boldsymbol{f}}}_ * })$为预测值对应的方差。

    • 本文基于PyMC3[15, 26]提供的马尔科夫链蒙特卡洛(Markov Chain Monte Carlo,MCMC)方法对高斯过程回归模型的超参数进行采样,并获得其后验估计值。PyMC3是一个概率图推断编程框架,允许用户利用贝叶斯机器学习方法构建模型并估计模型参数,具有很强的灵活性和适应性[27]

    • 本文使用历史负荷数据对高斯过程回归模型进行训练,均值m=0,先验协方差函数选择Mateen类协方差函数、有理二次协方差函数和平方指数协方差函数,各协方差函数的具体描述如下文。

      Matern类协方差函数中不同的贝塞尔函数参数$\nu $影响函数的光滑性,根据文献[28],$\nu {\rm{ = 3/2}}$$\nu {\rm{ = 5/2}}$的Matern类协方差函数分别由式(8)和式(9)表示:

      $$\begin{split}k_{\mathrm{Mat}_{v=5 / 2}}\left({\boldsymbol{x}}, {\boldsymbol{x}^{'}}\right)=&\eta^{2}\left(1+\frac{\sqrt{5({{\boldsymbol{x-x^{'}}}})^{2}}}{l}+\frac{5\left({{\boldsymbol{x-x^{'}}}}\right)^{2}}{3l^{2}}\right) \times \\ &\exp \left[-\frac{\sqrt{5\left({\boldsymbol{x-x^{'}}}\right)}}{l}\right]\end{split}$$ (8)
      $$\begin{split} {k_{{\rm{Ma}}{{\rm{t}}_{{\rm{\nu = 3/2}}}}}}({\boldsymbol{x}},{\boldsymbol{x}}') = & {\eta ^2}\left[1 + \frac{{\sqrt {{\rm{3(}}{{\boldsymbol{x - x}}}'{{\rm{)}}^2}} }}{l}\right] \times \\ &\exp \left[ - \frac{{\sqrt {{\rm{3(}}{{\boldsymbol{x - x}}}'{\rm{)}}} }}{l}\right] \end{split} $$ (9)

      式中:超参数η为垂直尺度因子,有调节协方差函数变化的作用;超参数l为水平因子,起到对输入变量间的距离相对加权的作用。

      有理二次(rational quadratic,RQ)协方差函数,根据文献[28],可由式(10)表示:

      $${k_{{\rm{RQ}}}}({\boldsymbol{x}},{\boldsymbol{x'}}) = {\eta ^2}{\left[1 + \frac{{{{({{\boldsymbol{x - x}}}')}^2}}}{{2\xi {l^2}}}\right]^{{\rm{ - }}\xi }}$$ (10)

      式中超参数$\xi $为调节协方差函数的衰减率因子。

      平方指数(exponentiated quadratic,EQ)协方差函数,根据文献[29],可由式(11)表示:

      $${k_{{\rm{EQ}}}}({\boldsymbol{x}},{\boldsymbol{x'}}) = {\eta ^2}\exp \left[ - \frac{{{{({{\boldsymbol{x - x}}}')}^2}}}{{2{l^2}}}\right]$$ (11)

      根据式(8)—(11),考虑噪声的情况下,不同协方差函数的超参数向量分别为${{\boldsymbol{\theta}}} {\rm{ = }}\left\{ {l,{\eta ^2},{\sigma ^2}} \right\}$${{\boldsymbol{\theta}}} {\rm{ = }} $$ \left\{ {l,{\eta ^2},{\sigma ^2}} \right\}$${{\boldsymbol{\theta}}} {\rm{ = }}\left\{ {l,{\eta ^2},\xi ,{\sigma ^2}} \right\}$${{\boldsymbol{\theta}}} {\rm{ = }}\left\{ {l,{\eta ^2},{\sigma ^2}} \right\}$

    • 上文确定好了核函数的形式,下一步是对模型进行训练。根据文献[30],可知贝叶斯原理的公式如下:

      $$p(A\left| B \right.) = p(A)\frac{{p(B\left| A \right.)}}{{p(B)}}$$ (12)

      根据上式和文献[16]可知超参数的后验分布,如式(13)所示:

      $$p({{\boldsymbol{\theta}}} \left| {{{\boldsymbol{Y}}},{{\boldsymbol{X}}}} \right.) = \frac{{p({{\boldsymbol{Y}}}\left| {{{\boldsymbol{\theta}}} ,{{\boldsymbol{X}}}} \right.)p({{\boldsymbol{\theta}}} \left| {{\boldsymbol{X}}} \right.)}}{{p({{\boldsymbol{Y}}}\left| {{\boldsymbol{X}}} \right.)}}$$ (13)

      式中:$p\left( {{{\boldsymbol{\theta}}} \left| {{\boldsymbol{X}}} \right.} \right)$为超参数的先验;$p\left( {{{\boldsymbol{Y}}}\left| {{{\boldsymbol{\theta}}} ,{{\boldsymbol{X}}}} \right.} \right)$为似然函数;$p\left( {{{\boldsymbol{Y}}}\left| {{\boldsymbol{X}}} \right.} \right)$为边缘似然函数,该概率值与超参数无关,因此可得到下式:

      $$p\left( {{{\boldsymbol{\theta}}} \left| {{{\boldsymbol{Y}}},{{\boldsymbol{X}}}} \right.} \right) \propto p\left( {{{\boldsymbol{Y}}}\left| {{{\boldsymbol{\theta}}} ,{{\boldsymbol{X}}}} \right.} \right)p\left( {{{\boldsymbol{\theta}}} \left| {{\boldsymbol{X}}} \right.} \right)$$ (14)

      根据上式可知超参数的最大后验估计值是似然函数与超参数先验乘积的最大值,计算方法如下:

      $${{{\boldsymbol{\theta}}} _{{\rm{MAP}}}} = \arg \mathop {\max }\limits_{{\boldsymbol{\theta}}} p({{\boldsymbol{Y}}}\left| {{{\boldsymbol{\theta}}} ,{{\boldsymbol{X}}}} \right.)p({{\boldsymbol{\theta}}}\left| {{\boldsymbol{X}}} \right.)$$ (15)

      最后根据式(16)求出对数后验分布最大值的近似值。

      $${{{\boldsymbol{\theta}}} _{{\rm{MAP}}}} = \arg \mathop {\max }\limits_{{\boldsymbol{\theta}}} \log p({{\boldsymbol{Y}}}\left| {{{\boldsymbol{\theta}}} ,{{\boldsymbol{X}}}} \right.)\ln p({{\boldsymbol{\theta}}}\left| {{\boldsymbol{X}}} \right.)$$ (16)

      本文利用MCMC方法获取超参数的最大后验估计值,主要思路是通过不掉向采样(no-u-turn sampler,NUTS)[31]得到参数的推断值。该做法的采样效率高,不必手动调整参数。

    • 本文为了验证以上模型以及实现负荷预测,获取了数据集1[32]和公开数据集2[33]进行实验。

    • 本文对数据集1进行预处理与分析,选用温度、风速、降雨量、当天为星期几、当天的第几个小时、是否假期等与负荷波动有关的因素作为训练特征。

      本文数据的训练特征与负荷的分辨率均为1个小时,选取4组训练集和对应的测试集,训练集为测试集前30天的负荷数据,4个测试集的时长均为2天,样本数量为48。4组训练集与测试集的起始时间划分情况见表1

      表 1  训练集与测试集的划分

      Table 1.  Division of train ing set and test ing set

      组别训练集时间段测试集时间段
      12017-4-18 00:00
      2017-5-18 23:00
      2017-5-19 00:00
      2017-5-20 23:00
      22017-04-20 00:00
      2017-05-20 23:00
      2017-05-21 00:00
      2017-05-22 23:00
      32017-04-22 00:00
      2017-05-22 23:00
      2017-05-23 00:00
      2017-05-24 23:00
      42017-04-24 00:00
      2017-05-24 23:00
      2017-05-25 00:00
      2017-05-26 23:00
    • 本文取得的数据集2为美国哈佛大学某栋实验大楼的负荷数据,数据中包含历史负荷和天气状况等信息。根据用电日期和时间段来生成时间特征,比如:一年中的第几周、当天为星期几、一年当中的第几天、当天的第几个小时。实验数据中的历史负荷、天气特征、时间特征的分辨率都为1 h。本文的人员存在检测传感器平台搭建在国内某公司所在的大楼,该公司的作息时间与原数据的实验大楼基本一致,具有一定的参考性。平台每小时生成一次3D点云,因此分辨率为1 h。本文将检测得到的建筑占有率信息归一化成0~1的数值,加入到原有的数据集中,作为楼宇负荷预测模型的新特征,并在后面的实验中分析增加该特征后预测效果的变化。

      通过数据分析,训练集特征包括以下几个:建筑占有率、当天为周几、一年当中的第几天、一年中的第几周、当天的第几个小时和当地的风速。

      本文对数据集2预处理后,划分训练集,时间段从2013年03月20日00:00至2013年04月20日23:00,训练集数据的分辨率为1 h。在数据存在缺失的情况下,训练集样本数量为768个,即768组实测数据。本文选取4组测试集数据,第1组是从2014年04月01日00:00至2014年04月02日23:00,测试集样本数量为48个。以时间类推,4组测试集数据的划分见表2

      表 2  测试集的划分

      Table 2.  Division of test ing set

      测试集组别测试集时间段样本数量
      12014-04-01 00:00
      2014-04-02 23:00
      48
      22014-04-03 00:00
      2014-04-04 23:00
      48
      32014-04-05 00:00
      2014-04-06 23:00
      48
      42014-04-07 00:00
      2014-04-08 23:00
      48
    • 为了直观地判断负荷预测模型的准确度,本文引入几种常见的精度评价指标来评估模型的准确率,分别为均方根误差(root mean square error, RMSE)RMSE、平均绝对百分比误差(mean absolute percent error,MAPE)MAPE以及决定系数${R^2}$[34-37]。均方根误差和平均绝对百分比误差越低则预测准确度越高。决定系数R2是评价模型拟合程度的一个指标,越接近于1则表明拟合程度越高[37]。各评价指标的计算公式如下:

      $${R_{{\rm{MSE}}}} = \sqrt {\frac{1}{m}\sum\limits_{i = 1}^m {{{({{\hat y}_i} - {y_i})}^2}} } $$ (17)
      $${M_{{\rm{APE}}}} = \frac{1}{m}\sum\limits_{i = 1}^m {\frac{{\left| {{y_i} - {{\hat y}_i}} \right|}}{{{y_i}}}} \times 100\text{%} $$ (18)
      $${R^2} = 1 - \frac{{\displaystyle\sum\nolimits_i {{{({y_i} - {{\hat y}_i})}^2}} }}{{\displaystyle\sum\nolimits_i {{{({y_i} - \bar y)}^2}} }}$$ (19)

      式中:m为测试集的数量;${y_i}$为第i组测试集的真实负荷值;${\hat y_i}$为第i组测试集的负荷预测值;$\bar y$m组测试集的真实负荷值的平均值。

    • 本次实验数据采用数据集1,高斯过程回归预测模型的协方差函数采用Matern32函数,分别利用最大后验估计法与极大似然估计法求取模型的超参数。2种方法的参数设置及实现过程如下文所述。

      模型求取参数的最大后验估计值时,水平因子l和衰减率因子$\xi $的先验分布设置为Gamma分布,噪声σ、垂直度因子η的先验分布设置为Half-Cauchy分布。经过网格搜索确定各先验分布的设置如下:

      $$l\sim{\rm{Gmma(}}\alpha = 4,\beta = 5{\rm{)}}$$ (20)
      $$\xi \sim{\rm{Gmma(}}\alpha = 4,\beta = {\rm{2)}}$$ (21)
      $$\sigma \sim{\rm{HalfCauchy(}}\varsigma = 5{\rm{)}}$$ (22)
      $$\eta \sim{\rm{HalfCauchy(}}\varsigma = 5{\rm{)}}$$ (23)

      式中:α为Gamma分布的形状参数;β为逆尺度参数;$\varsigma$为Half-Cauchy分布的尺度参数。

      模型求取超参数的极大似然估计值时,接入Scikit-learn库的高斯过程回归函数接口进行计算,采用拟牛顿 (Broyden-Fletcher-Goldfarb-Shanno,BFGS) [38]算法对参数进行优化。

      本次实验采取同样的训练集训练上述2个不同的模型,对同样4个测试集的数据进行预测。经过模型训练与测试,得到的预测结果见表3。根据表3中各项评估指标数据显示,测试集1—4中,最大后验估计法和极大似然估计法比较,MAPE值分别降低了5.12%、0.41%、9.46%、9.87%,${R^2}$分别提高了0.28、0.02、0.07、0.12,说明参数基于最大后验估计的预测模型比参数基于极大似然估计的预测模型准确度高。

      表 3  2种参数求取方法的预测结果(Matern32)

      Table 3.  Prediction results of two parameter calculation methods (Matern32)

      测试集最大后验估计极大似然估计
      R2RMSEMAPE/%R2RMSEMAPE/%
      测试集10.7248.6620.070.4468.1925.19
      测试集20.9239.6415.67 0.943.3416.08
      测试集30.9541.75 9.570.8865.4619.03
      测试集40.8271.7617.19 0.792.3527.06
    • 本次实验采用数据集2,在模型参数进行最大后验估计时,分析不同协方差函数的负荷预测准确度。本文设置每种协方差函数的超参数先验分布和噪声均一致,可参考3.3.1节的参数设置。不同协方差函数的4组测试集的预测结果见表4

      表 4  最大后验估计下不同协方差函数的预测结果

      Table 4.  The prediction results of different covariance functions under the maximum posterior estimation

      测试集Matern32Matern52EQRQ
      R2RMSEMAPE/%R2RMSEMAPE/%R2RMSEMAPE/%R2RMSEMAPE/%
      测试集10.9813.644.450.9814.544.830.9716.925.270.9522.16.57
      测试集20.9812.283.770.98611.163.600.9811.734.030.9521.716.54
      测试集30.8125.389.800.7628.4211.420.6832.3713.560.4642.0817.29
      测试集40.9616.354.220.9617.414.420.9519.455.300.9519.996.40

      表4的不同核函数模型的准确度评价指标值可以看出:对于评价指标R2,Matern32相较于EQ最高提升0.13,相较于RQ最高提升了0.35,对于评价指标RMSE,Matern32相较于Matern52最高降低了3.04,相较于EQ最高降低了6.99,对于RQ最高降低了16.7,对于评价指标MAPE,Matern32相较于Matern52最高降低了1.62%,相较于EQ最高降低了3.76%,对于RQ最高降低了7.49%。

      综上,选用Matern32协方差函数的预测误差比其他3种协方差函数低。因此,在高斯过程回归中,选取Mtern32协方差函数可以得到更为准确的预测结果。

      本次实验也对比了模型参数求取极大似然估计值时不同协方差函数的预测准确度,实验结果如表5所示。由实验结果可知求取模型参数的极大似然估计值时,RQ和Matern32协方差函数的预测精度较高。

      表 5  极大似然估计下不同协方差函数的预测结果

      Table 5.  The prediction results of different covariance functions under maximum likelihood estimation

      测试集Matern32Matern52EQRQ
      R2RMSEMAPE/%R2RMSEMAPE/%R2RMSEMAPE/%R2RMSEMAPE/%
      测试集10.9521.355.880.9423.947.370.8537.0611.880.9522.186.52
      测试集20.9422.36.950.9423.327.390.9325.779.620.9522.096.84
      测试集30.4642.1517.540.4137.6818.350.2151.220.100.540.6616.50
      测试集40.9420.16.270.9422.327.130.8731.7910.290.9520.156.41

      进一步对比表4表5可见,最大后验估计方法下,Matern32、Matern52、EQ协方差函数的预测准确度相较于极大似然估计方法有明显提升。其中EQ协方差函数提升最明显,4个测试集中,决定系数R2最大提升了0.47,均方根误差最大降低了20.15,平方绝对百分比误差最大降低了6.54%。实验结果也进一步验证了3.3.1节结论的有效性,即求取超参数的最大后验估计值时,模型的预测准确度较高,证明最大后验估计可以避免过拟合现象的发生,使得模型拟合程度高,进而提升了预测精度。

    • 本次实验的高斯过程回归模型采用Matern32协方差函数,采用的数据为数据集2的测试集1,实验目的是对比有无建筑占有率特征的模型预测精度。图3(a)为考虑建筑占有率特征的预测值曲线图,图3(b)为未考虑建筑占有率特征的预测值曲线图。比较这2个图可知,图3(a)的预测负荷曲线在2个波谷时段的预测准确度比图3(b)高。

      图  3  负荷预测曲线

      Figure 3.  Load forecasting curve

      表6为模型参数进行最大后验估计且采用Matern32协方差函数时,考虑有无建筑占有率的预测结果表。由表6可知,考虑建筑占有率特征时4个测试集的MAPE值都优于未考虑建筑占有率时,测试集1—4中,考虑建筑占有率模型的MAPE值比未考虑时分别降低了0.88%、0.93%、1.86%、0.57%。考虑建筑占有率模型的RMSE值比未考虑时分别降低了0.24、0.8、4.18、2.74。由此说明考虑建筑占有率特征可以提高预测的精确度。

      表 6  最大后验估计法的预测结果

      Table 6.  Prediction results of the maximum a posteriori estimate method

      测试集有建筑占有率无建筑占有率
      R2RMSEMAPE/%R2RMSEMAPE/%
      测试集10.9813.644.450.9813.885.33
      测试集20.9812.283.770.9813.084.70
      测试集30.8125.389.800.7429.5611.66
      测试集40.9616.354.220.9519.094.79

      表7为模型参数进行极大似然估计且采用Matern32协方差函数时,考虑有无建筑占有率的预测结果表。综合表6表7分析得出:本文所提方法相较于未考虑建筑占有率的传统高斯过程回归方法,MAPE值分别降低了1.53%、3.35%、9.68%、2.16%,验证了本文方法的有效性和准确性。

      表 7  极大似然估计法的预测结果

      Table 7.  Prediction results of maximum likelihood estimation method

      测试集有建筑占有率无建筑占有率
      R2RMSEMAPE/%R2RMSEMAPE/%
      测试集10.9521.355.880.9522.45.98
      测试集20.9422.36.950.9423.187.12
      测试集30.4642.1517.540.3745.7919.48
      测试集40.9420.16.270.9421.496.38

      此外,表6表7中测试集3的预测误差与另外3个测试集相比较大,其主要原因是测试集3处于非工作日,各时间段的负荷相较于工作日都有所下降,而训练集中非工作日的数据较少,造成模型对非工作日的参数训练不够精确,使得训练集3的预测准确度明显低于其他训练集,因此可以通过增加训练集的数量降低预测误差。

    • 本文对超参数的采样过程和结果进行分析以判断收敛性。图4为高斯过程回归模型采用Matern32协方差函数时,其参数(l,η,σ)进行1000次采样的采样图,本次实验设置同一参数有4条并行的采样轨迹,采用的训练集特征维度为6,由公式(9)可知参数l的维度也为6,采样过程会对参数l各维度进行采样。图4(a)是各参数1000个采样值的分布图,可看出各参数的最大后验估计值分布趋近于高斯分布;图4(b)是各参数每步采样得到的采样值,可以看出每个参数的采样轨迹相对稳定,围绕某个值附近振荡。

      图  4  参数采样图

      Figure 4.  Diagram of parameter sampling

      表8为各参数采样结果的可视化表,表8中列出了各参数后验的均值、标准差、置信区间以及$\hat R$值。表中l1l6分别是参数l的6个维度。Gelman-Rubin法可以定量地检验收敛性,$\hat R$值为Gelman-Rubin检验法的检验指标,理想状态下$\hat R = 1$,由表8可知各参数的采样过程均收敛。

      表 8  参数采样结果可视化表

      Table 8.  Visual table of parameter sampling results

      参数均值标准差置信区间为3%置信区间为97%$\hat R$
      l16.1790.2735.6996.7271.0
      l22.9620.2612.4943.4521.0
      l316.0871.44413.40818.8181.0
      l44.7790.7233.5536.2671.0
      l50.8340.1470.5901.1121.0
      l613.7041.19211.42515.8601.0
      η66.4173.13960.87772.4931.0
      σ0.8740.5510.0051.7991.0
    • 本文利用人员存在检测传感器获取的建筑占有率数据,结合原始数据的时间特征和天气特征,建立多维高斯过程回归预测模型并对楼宇负荷进行预测,实验结果表明:

      1)建筑占有率特征可以有效提升楼宇负荷预测准确度,因此本文提出的通过传感器网络获取建筑占有率的方法,适用于人员流动性强的楼宇进行负荷预测;

      2)超参数最大后验估计法与极大似然估计法相比较,可以有效防止模型训练过程中过拟合现象的发生,并提高了楼宇负荷预测准确度;

      3)本文对Matern32、Matern52、Rational Quadratic、Exponentiated Quadratic这4种协方差函数的预测效果进行对比,实验数据分析表明Matern类协方差函数拟合能力较强。

      本文所提对参数进行最大后验估计的方法能够有效降低过拟合现象的发生和数据噪声的影响。基于传感器采集建筑占有率数据的方法,适用于人员流动性强且隐私性要求较高的楼宇,可为楼宇的负荷预测提供新的特征。本文模型用于短期负荷预测时有较高的预测精度,适用于楼宇的负荷预测,可给楼宇节能方案的制定提供强有力的数据基础,促进楼宇能耗的降低以及节能建筑的良好发展。

      本文方法预测精度高,但通过采样获得参数最大后验估计的方法存在计算时间较长的缺点,后续研究将通过并行计算进一步提高计算效率。

参考文献 (38)

目录

    /

    返回文章
    返回