您的浏览器不支持JavaScript,请开启后继续

China Heating,Ventilation and Air Conditioning
联系热线:010-64693287 / 010-64693285

一种基于时序频域分解的负荷预测方法研究

  • 作者:
  • 中国暖通空调网
  • 发布时间:
  • 2021-09-07

湖南大学  李毅  彭晋卿  邹斌  罗正意 

       【摘  要】准确的建筑能耗预测对建筑能源系统的智能高效运行起着至关重要的作用。为了更好地挖掘海量数据中蕴含的有效信息,提高短期负荷预测精度,针对负荷数据时序性和非线性的特点,本研究基于湖南省某办公楼的能耗数据,旨在提出一种基于专家知识与机器学习算法集成的短期电力负荷预测模型。该模型通过频域分解方法将原始数据分解为日周期、周周期、低频分量和高频分量四个部分。日周期分量具有较强的周期性,可以直接采用差分整合移动平均自回归模型(ARIMA)进行预测;低频分量可以用线性回归进行预测;对于高频分量采用集成ENN和长短期记忆神经网络(LSTM)模型进行预测。实验结果表明,该方法相比其他先进的单一预测模型有效提高了预测准确率。

       【关键词】时序频域分解;数据采集;负荷预测;均方根误差

0  引言

       随着我国经济的飞速发展和用户对建筑舒适性要求的提高,建筑用能需求逐年增加。电力作为最重要的二次能源,在能源系统和全球经济中起着至关重要的作用。对未来短期电力负荷需求的准确预测不仅能为电网运营商和零售商提供即时电力信息,以制定经济的发电计划,优化售电策略,而且有助于终端用户实现智能高效的建筑能源系统运维[1]。另一方面,随着数字化进程的加快以及通讯技术的发展,智能电网系统对负荷的采集频率和数据准确性也不断提升,为负荷特性分析和负荷预测提供了高质量、海量化的数据集,为短期电力负荷的预测提供了数据基础。

       能耗数据具有时序性和非线性的特点,并且其受需求波动、人员流动等诸多不确定性因素的影响,给建筑能耗的预测带来了巨大挑战。然而,由于其显著的社会和经济价值,迄今为止,已经提出了许多模型来解决负荷预测问题,这些模型可以分为两大类:第一类是机器学习分析方法,其中,神经网络由于其强大的数据处理能力得到了广泛应用。Park等人[1]证明了人工神经网络适合在训练集的负荷和温度模式数据之间进行插值,以确定未来的负荷模式。然而,他们的模型在人们有特定开始工作的日期,比如周一,误差较大,因为他们只利用温度信息。为了解决这个问题,部分研究者在特征中加入了时间信息,根据工作日模式和周末模式分别建立预测模型[2,3]。此外,许多研究人员试图将人工神经网络与其他算法相结合来提高模型性能。Singh等人[4]将进化方法与人工神经网络相结合,并在2018年用一个连续优化实验框架对模型进行了验证。虽然人工神经网络可以有效描述特征之间的非线性关系,但人工神经网络是一种点到点的映射,缺少对时序数据相关性的考量,需要人为添加时间特征保证预测精度。

       对于时间序列数据的预测,部分研究者提出时间序列分析方法。其中,长短期记忆神经网络(LSTM)模型作为一种有效的非线性循环神经网络,由于其能够保存历史信息,兼顾数据的时序性和非线性关系,被广泛应用于能耗预测领域。孙等人提出了在LSTM模型中选择有效特征的方法用于负荷消耗预测[5]。Nespoli等人[6]探究了不同特征的数据质量对LSTM负荷预测精度的影响。Hossain等人[7]基于天气数据和时间特征利用LSTM实现单步提前负荷和多步日间滚动范围预测,并在2020年取得了比其他机器学习模型更好的性能。LSTM网络模型虽然可以充分反映输入数据序列时间中的长期历史过程,但并不能挖掘非连续数据之间的有效信息和潜在关系。同时,专家知识通常仅用于特征工程,并没有与机器学习算法完全集成。

       为了将专家知识集成至机器学习预测模型,并进一步提高模型预测精度。本研究基于湖南省设计院某办公建筑的能耗数据,旨在提出一种基于专家知识与机器学习算法集成的短期电力负荷预测模型。该模型通过频域分解方法将原始数据分解为日周期、周周期、低频分量和高频分量四个部分,并分别研究各个分量的特性,采用相应的预测模型,实验结果表明,该方法相比其他先进的单一预测模型有效提高了预测精度。

1 时序频域分解理论

       建筑负荷的无序性为建筑能耗的预测带来了巨大的挑战。办公建筑电力负荷的变化主要受人们生产、生活规律的支配呈现出规律性、季节性和周期性等特性以及气象等众多相关因素的影响,因此负荷中必然存在随机变化的分量。基于时序频域分解的负荷分解方法以有限傅里叶分解与重构的形式将负荷序列分解为固定周期分量、无固定周期慢变分解和随机快变分量,部分负荷分量呈现出一定的周期性。 

       对于任意时间序列(t=1,2,···,N),根据频域分析方法利用傅里叶变换做如下分解:

         

       式中:a0为直流分量,即序列Xt的均值;N为模型所选用历史负荷的数量;ai表示时域信号中余弦波的成分;bi为时域信号中正弦波的成分。对Xt做傅里叶分解后,得到彼此正交的谐波信号。利用负荷变化周期性的特性,并根据角频率ωi和系数ai、bi的大小,可将时间序列Xt分解为如下形式:

       X(t)=a0+D(t)+W(t)+L(t)+H(t)          (2)

       考虑到负荷具有时序性和周期性的特点,将负荷序列Xt分解为a0+D(t)代表日周期分量,W(t)代表周周期分量,L(t)代表慢变分量,也称为低频分量,可视为一个平稳的时间序列;H(t)是随机快变分量,也称为快变分量,主要体现为负荷变化的随机性。

2  数据采集及处理

       2.1 数据采集

       在本研究中,建筑能耗预测所采用的数据分为两部分:一是湖南省某办公楼2017年1月1日至2020年11月30日近四年的能耗数据,采样周期为1小时。该办公楼分为南北两区,每区均有七层。其中,一至三层的空调主机采用地源热泵机组,另外四层采用风冷热泵机组。该办公楼的配电房在高压侧总进线柜与空调机组变压器侧均安装有智能电表,地源热泵机组和风冷热泵机组的数据分别计量,并将逐时能耗数据通过施耐德平台可视化。气象参数由湖南省气象信息中心提供,参数主要包括逐时温度、湿度、风速、风向和水平太阳辐射强度。数据采集平台如图1所示。为了研究方便,本研究仅对风冷热泵机组的能耗进行预测。


图1 数据采集平台示意图

       2.2 数据预处理

       在数据采集过程中,原始数据会因传感器故障或者电网临时断路等问题存在异常值和缺失值。基于负荷数据具有连续性的假设,我们运用滑动窗口方式发现异常值。与窗口中其他点的距离超过给定阈值的数据点被视为异常值,需要将该样本删除,然后通过线性插值的方式补全缺失值。处理部分结果如图2所示。


图2(a)未经过异常值处理的原始数据    (b)经过异常值处理的数据

       图 3为根据频域分解后的四个分量。可以看出:日周期分量分布规律明显,具有较强的周期性,可以直接根据前一日同一时刻的能耗数据运用差分整合移动平均自回归模型(ARIMA)进行预测。但是由于该办公建筑负荷没有周的周期性,故经过频域分解后周周期分量为0。低频分量是一条平滑的曲线,可以运用简单的线性回归模型预测。高频分量波动较大,但是比原始负荷序列平缓。本模型的关键为高频分量的预测。本研究采用集成ENN和LSTM的深度学习模型预测高频分量。

         
图3 一周能耗的负荷分解分量示意图

       建筑能耗预测所用的数据特征具有不同的量纲单位,如果不消除特征之间的量纲影响,那么数量级大的输入变量将主导建模过程,将导致模型预测结果只受单一或部分变量的影响。因此,需要原始数据集进行数据标准化处理。目前常用的数据标准化处理有离差标准化、标准差标准化两种处理方法,见表1。

表1 数据标准化处理方法比较

       因为建筑能耗数据集特征值的上下限会随着时间而发生改变,而且数据集的样本量足够大,所以本文采用了基于标准差的方法对特征进行标准化处理。

       2.3 特征数据构建

       特征工程构造得到的数据相关性通过Pearson相关系数r实现量化评价,具体表达式如下:

                 (3)

       式中:为数据集的长度;和代表两组特征向量。

       根据专家知识并观察负荷曲线,负荷总是在周六和周一出现变动,即工作日和休息日的转换引起的负荷变动,由于转换改变了负荷模式并增加了负荷预测的难度,模型在这些日子的预测误差易于变大。因此,要预测的日期是星期六还是星期一也作为虚拟变量添加到输入变量中。工作日负荷模式不同于周六、周日和周一负荷模式,并将周一视为特殊数据。因此,选择星期六和星期一作为描述日历效应的输入特征具有明确的物理意义,这是负荷预测问题的一般准则。根据专家知识,初步确定特征向量包括:气象参数(温度、湿度、风速、风向和水平太阳辐射强度、直接太阳辐射强度)、历史负荷和时间相关的特征(月份、星期、年、日期、时间)。

       下图为根据Pearson相关系数绘制的特征热力图:


图4 特征向量相关系数矩阵热图

       从图中可以看出:建筑能耗与室外温度、风速、相对湿度、水平太阳辐射强度等气象参数和月份、星期等时间特征存在较强的相关性。根据陈卓等人[8]的研究发现,当选用历史负荷为4天时,能耗预测的误差较小。因此选择这些参数作为高频分量的特征向量。

       2.4 评价指标

       为了评估模型的预测性能,参考国家电网有限公司评价负荷预测指标,本研究选用均方根误差(Root Mean Square Error,RMSE)指标作为性能指标来检验和衡量算法模型的精确度和效果。表达式如式所示。

                           (4)

       式中:m为预测的总次数;yt和分别代表t时刻能耗的真实值和预测值。均方根误差能够使真实值与预测值在同一量级,更直观地展示预测模型的总体效果。

3  模型训练与结果分析

       3.1 模型训练

       为了充分利用数据,本研究采用四折交叉验证方法。将数据样本均分为四折,每次用其中三折作为训练集,另外一折作为测试集。以保证模型预测的准确性。

       本研究的日周期分量、周周期分量、低频分量、高频分量的预测均基于Keras深度学习工具的 Tensorflow 框架,该框架可以实现在Tensorflow、Theano和CNTK之间进行后端切换,提供高层的神经网络编程接口。

       对于高频分量的预测采用了EnLSTM网络模型,它可以处理时间序列数据。在本实验中,该网络模型采用一个包含40个神经元的LSTM层和一个包含20个神经元的完全连接层。为了避免模型过拟合,在LSTM层使用了比率为0.3的Dropout,并且在完全连接层和输出层之间进行批量归一化。选用ReLu作为激活函数。模型的超参数采用贝叶斯优化算法进行调整,其基本思想是首选一个对目标函数的先验分布模型,然后利用后续新获取到的信息,来不断优化该猜想模型,使模型越来越接近真实的分布。最终确定该模型的超参数如下:

       ENN的尺寸为100,平滑系数为1,其他超参数均采用默认值。

       3.2 预测结果分析

       运用频域分解方法和基本框架训练模型,对各个分量进行预测,然后将各部分的预测值相加即可以得到最终的预测结果,本研究选用一周最终的预测值与实际值的对比如图5所示。从图中可以看出最终预测结果与实际值接近,并且该模型的均方根误差为6.75%。


图5 预测值与真实值对比情况

       本研究对采用相同网络框架的ARIMA、LSTM、CNN-LSTM、EnLSTM等先进的深度学习模型进行对比,不同预测模型的相对误差如表2所示。

表2 不同预测模型的相对误差对比结果

       结果表明,运用基于频域分解的负荷预测模型可以从波动较大、毫无规律的能耗曲线中分解出具有周期性规律的分量,方便运用机器学习模型进行短期电力负荷的预测,从而使模型精度得以提高。

4  结论

       本研究针对具有不规律的电力负荷,结合专家知识运用时序频域分解方法将电力负荷分解为具有规律的日周期分量、周周期分量、低频分量和高频分量,并针对各个分量的特性采用不同的预测模型进行预测,进而得到具有较高预测精度的短期电力负荷预测模型。对于波动较大的高频分量,采用一种集成ENN和LSTM的神经网络模型,充分考虑了负荷序列的时序性和非线性的特点,整体提高了负荷预测精度。

致谢

       本文得到湖南省科技创新计划湖湘高层次人次项目(2020RC5003)、住房和城乡建设部2020年科学技术项目计划(2020-K-165)和湖南省优秀博士后创新人才(2020RC2017)项目的支持,在此表示感谢!

参考文献

       [1]  Park DC, El-Sharkawi M, Marks R, Atlas L, Damborg M. Electric load forecasting using an artificial neural network. IEEE Trans Power Syst 1991;6(2):442–9
       [2]  Lusis P , Khalilpour KR , Andrew L , Liebman A . Short-term residential load forecasting: impact of calendar effects and forecast granularity. Appl Energy 2017;205:654–69
       [3] 刘洋,许立雄.适用于海量负荷数据分类的高性能反向传播神经网络算法[J].电力系统自动 化,2018,42(21):96-103.DOI: 10.7500/AEPS20171215005.
       [4]  Singh P , Dwivedi P . Integration of new evolutionary approach with artificial neural network for solving short term load forecast problem. Appl Energy 2018;217:537–49
       [5]  Sun G, Jiang C, Wang X, Yang X. Short-term building load forecast based on a data- mining feature selection and LSTM-RNN method. IEEE Trans Electr Electron Eng 2020;15(7):1002–10. doi: 10.1002/tee.23144 .
       [6]  Nespoli A , Ogliari E , Pretto S , Gavazzeni M , Vigani S , Paccanelli F . Data quality analysis in day-ahead load forecast by means of LSTM. In: Proceedings of the IEEE international conference on environment and electrical engineering and IEEE industrial and commercial power systems Europe (EEEIC/I&CPS Europe). IEEE; 2020 .
       [7]  Hossain MS , Mahmood H . Short-term load forecasting using an LSTM neural network. In: Proceedings of the IEEE power and energy conference at Illinois (PECI). IEEE; 2020
       [8]  陈卓,孙龙祥.基于深度学习LSTM网络的短期电力负荷预测方法[J/OL].[2018-01-01].电 子技术.http://www.cnki. com.cn/Article/CJFDTotal-DZJS201801011.htm.

       备注:本文收录于《建筑环境与能源》2021年4月刊 总第42期(第二十届全国暖通空调模拟学术年会论文集)。版权归论文作者所有,任何形式转载请联系作者。