您的浏览器不支持JavaScript,请开启后继续

China Heating,Ventilation and Air Conditioning
联系热线:010-64693287 / 010-64693285

融入人员数据的办公建筑能耗预测方法研究

  • 作者:
  • 中国暖通空调网
  • 发布时间:
  • 2021-09-01

连会会 , 姬颖 , 牛梦涵
北京工业大学北京市绿色建筑环境与节能技术重点实验室,北京工业大学城市建设学部

        【摘  要】随着数据采集、存储成本的降低和数据挖掘研究的发展,揭示建筑运行能耗特征和节能潜力的预测方法越来越受到关注。本研究采用单连接聚类法对时间变量进行类别划分,提高模型精度;采用长短期记忆神经网络(Long Short-term Memory, LSTM)算法,构建了办公建筑的逐时能耗预测模型,应用于上海市一栋实际办公建筑,并对比了有无人员数据两种情况下的模型预测精度;结果表明,加入人员数据的模型预测结果显著改善,误差由11.24%降为8.78%。

        【关键词】逐时能耗;人员数据;单连接聚类,LSTM

        【基金编号】国家自然科学基金青年项目(51908006)

1 背景意义

        随着生活水平的不断改善和环境问题的日益凸显,人们对室内环境质量要求越来越高,建筑能耗持续攀升。统计显示,建筑运行能耗占全国能源消费总量的21.7%[1]。大型公共建筑单位面积能耗达到70-300kWh/m2,是居住建筑的10~20倍[2]。公共建筑节能备受关注,国内外建筑能耗预测研究工作随之增多[3,4]。对于办公建筑而言,使用者的数量和活动类型,会影响建筑的内部增益,进而影响系统能源使用的模式。因此,人员参数成为建筑能耗预测的一个重要特征[5]。Zhang和Delzendeh等人的研究表明,能耗的预测值与实际值之间存在很大差异,人员参数是造成这一现象的主要因素[6,7]。赵海湉[8]等人从室内外环境、人员、能耗等数据中提取关键特征规律,利用ARIMA模型,对建筑能耗进行预测,得到人员参数对于建筑能耗预测精度提升最为显著。Ying等人[9]的研究中,人员数量也是能耗预测模型的输入变量。Wei等人[10]的研究表明,在办公建筑能耗预测中,人员数量信息有时甚至比气象信息更重要。本研究对逐时人员数据对办公建筑能耗预测精度的影响进行定量研究。

        常用预测方法有回归分析法[11]、时间序列分析法[12]、人工智能方法[13]等。回归分析法需要历史数据样本量大,建立能耗与各影响因素间的回归函数,由于影响因素种类多且复杂,往往很难构建出合适的函数,且预测精度受样本量的影响较大。时间序列法所需数据种类相对要少,计算速度快,容易忽视时间以外的其他因素的影响[14]。以上两种方法都很难兼顾时序性和非线性的特点。因此,本文选取长短期记忆神经网络(Long Short-term Memory, LSTM)模型对能耗进行预测,该模型不仅可以像普通神经网络一样学习复杂数据之间的非线性规律,还兼具时序性特征,能够选择性地保留历史数据中的有用信息,丢弃无用信息,使得预测结果更加准确、可靠[4]

        本研究为提高模型的准确性,采用单连接聚类法,分析和确定了办公建筑能耗预测模型中星期类型的划分方式;针对目前研究存在的问题,在有无逐时人员数据条件下分别对公共建筑能耗进行预测,并采用皮尔逊相关系数法,探讨加入人员变量的预测影响。

2 研究方法

        本研究采用单连接聚类方法,对输入的时间变量进行类别划分;分别选取有无人员数据的两组输入变量,采用LSTM算法进行模型的建立和验证,完成能耗预测并对比两种不同输入变量下的预测精度。模型建立和验证基于Python中的Keras和TensorFlow 库实现。以上海市实际建筑数据为例,应用上述预测模型及分析方法展开研究。

        2.1 预测模型的建立和评价

        2.1.1 预测模型的建立方法

        LSTM最初是由HOCHREITER和SCHMIDHUBER (1997)提出[15],并被GRAVES进行了改良和推广[16]。在RNN神经网络(Recurrent Neural Network)设计中引入了自循环,这是LSTM神经网络核心。同时其相对于RNN而言的一个关键的扩展是其自循环的权重不是固定的,可以根据上下文进行改变。此外,还通过门控制此自循环的权重,累计的时间尺度也会动态的发生变化[17]


图1 LSTM 神经元典型结构[18]

        图1(a)所示,在这个神经元典型结构中有3个门结构,分别是输入门(input gate)、输出门(output gate)、遗忘门(forget gate)。在LSTM中,第一步通过遗忘门来决定我们会从细胞状态中丢弃什么信息;第二步在输入门中确定什么样的新信息会被放在细胞状态中;第三步在输出门中确定要输出的值。图1(b),是用来决定什么信息可以通过cell state。这个决定由“forget gate”层通过sigmoid来控制,它会根据上一时刻的输出和当前输入来产生一个0到1 的值,来决定是否让上一时刻学到的信息通过或部分通过。图1(c),是产生我们需要更新的新信息。这一步包含两部分,第一个是一个“input gate”层通过sigmoid来决定哪些值用来更新,第二个是一个tanh层用来生成新的候选值,它作为当前层产生的候选值可能会添加到cell state中。图1(d),把一二步结合起来就是丢掉不需要的信息,添加新信息的过程。图1(e),是决定模型的输出,首先是通过sigmoid层来得到一个初始输出,然后使用tanh将值缩放到-1到1间,再与sigmoid得到的输出逐对相乘,从而得到模型的输出[19]

     

        公式(1)到(6)表示LSTM的全过程,t为时间点;it为输入门;ft为遗忘门;ot为输出门;ht为当前时刻神经元内部状态; Ct为当前时刻外部状态;xt为当前时刻外部输入;W为权重矩阵;b为偏差矩阵;tanh、σ为激活层函数。

        2.1.3预测效果的评价方法

        为了评估模型的性能[9],本研究使用了两个指标来比较结果的准确性:平均相对误差(MRE-Mean Relative Error)和均方根误差 (Mean Square Error)。

            

        式中,PA和PF分别为实际能耗值和预测能耗值,N是能耗数据的个数。

        本研究采用在预测分析中使用较为广泛的均方误差作为模型拟合结果的判断依据,平均相对误差作为各种方法预测效果的判断根据。

        2.2 变量选取

        能耗以年、月、周、日等不同时间为周期所呈现出来的变化规律是其内在规律;外在规律主要是指温度、湿度、太阳辐射量等客观随机因素对能耗曲线的影响;而人是办公建筑中能耗消耗的主体,办公建筑内,设备的功率及人员的工作时间变化对大型公共建筑能耗的影响越来越大。故根据现有的实际数据,设置了九个输入变量:时间参数——月、日、星期、星期类型、时;气象参数——温度、相对湿度、太阳辐射量;人员数据。本研究旨在预测办公建筑的动态能耗,因此输出变量为逐时能耗数据。

        2.3 星期类型的划分

        通过对历史数据分析,发现日类型因素对能耗变化有重要影响,日类型包括特殊日、周六、周日和工作日等,一般情况下,周末和节假日的能耗明显不同于工作日的能耗[20]。因此本研究对不同星期类型进行划分。   

        聚类分析是数据挖掘中的一项重要技术,它能够快速地分析数据并提取有效信息,将对象分为多个类别或簇,使其在同一个类别中的数据对象之间具有较高的相似度,而不同类别中的数据对象具有很大的差异。用该方法对样本能耗数据进行分类,不需要提前确定具体的分类标准,可以实现自动分类[21]。该方法原理简单,计算速度快,分类效果好。因此本研究通过分析历史日均能耗值,根据数据呈现的特点,采用单链接聚类法(最短距离法)对每周进行星期类型划分,将划分结果作为模型输入值,可简化预测模型。

3 案例研究

        3.1案例介绍

        本研究选取上海市某办公建筑为案例建筑,建筑面积29000m2,选取该建筑2013年的运行数据和气象数据作为模型建立与验证的数据源,包括时间参数;逐时能耗数据;逐时人员数据;室外温、湿度、辐射等数据。

        3.2 输入输出变量的选取

        综合能耗预测的影响因素和现有的实际数据,设置了2.2中描述的九个输入变量。为探讨人员变量对预测结果的影响,设置两组不同的输入变量:一组为时间参数和气象参数八个输入变量;另一组为时间参数、气象参数及人员数据九个变量。本研究旨在预测办公建筑的动态能耗,因此输出变量为逐时能耗数据。

        3.3 星期类型的划分

        从数据源中,选取6月24日-8月18日共8周的逐时能耗数据建立模型,该8周办公建筑逐时能耗数据如下图2所示。

        从图2中看出,能耗具有按天和按周的周期性变化特点。计算得出能耗数据的日均值,将8周的日均值绘制于图3。可以看出办公建筑每周的能耗变化大致呈现出相同的特性,但每周周一到周五的日均能耗不同是因为室外气温不同。在6月24日-6月30日,该周室外气温在22℃~25℃之间,办公人员开启空调数较少,因此这周能耗低于其他周。


图2 办公建筑逐时能耗数据                      图3 办公建筑能耗日均值

        用单链接聚类对日均能耗数据进行聚类分析,应用R软件进行计算,结果如图4所示。图中横坐标为6月24日-8月18日每日序号,从号码1至号码56分别代表8周的56天,由于按照整工作周来选取建立模型所需的数据量,因此号码对应的星期如图5所示。


图4 办公建筑能耗日均值聚类分析结果                 图5 号码对应周与星期

        由图4可以看出,聚类分析将8周的56天分为两大类,将第二大类又分成了两小类。第一大类共有11天,其中有8天为周六;第二大类中的第二小类(右侧)共有10天,其中有5天为周日,其余5天为第一周的周一至周五,这是由于第一周的日均能耗受室外温度影响与其余5天周日的日均能耗在相似的水平;另一类为周一到周五混合。因此将办公建筑的星期类型分为三类:工作日、周六、周日。该结果也明显符合图2和图3中工作日的能耗较高,周末能耗较低的情形。这是因为办公建筑功能单一,其能耗产生变化主要是由于建筑内人员的上班时间和活动规律导致的波动,因此其主要功能在工作日使用,周末可能有个别人员需要加班,使用率大大下降。并且周六与周日的能耗特性也不尽相同,可以看出在7-8月的时候周日能耗普遍远远大于周六的能耗,又明显低于工作日的能耗。此外,对同星期类型日而言,能耗特性呈现出较高的相似性。且在6-8月这段时间内无法定节假日,因此本研究只考虑夏季高温时段的正常日,不考虑节假日情形。因为办公建筑能耗特性分为工作日、周六、周日三种类型,在建立神经网络模型时,输入层输入值分别定为1、2、3。

        3.4 模型的建立和验证

        3.4.1预测模型的建立

        LSTM模型的算法实现,如图6所示。由于各变量之间尺度差别不大,在进行数据预处理时,未对输入变量进行归一化处理。


图6  LSTM预测流程

        3.4.2 无人员变量的LSTM预测结果 

        从2013年办公建筑数据源中选取6月24日-8月18日共8周的逐时能耗数据和除人员数据以外的8个变量来训练模型。建立夏季高温日办公建筑逐时能耗模型如图7所示,均方误差值RMSE为50.43,模型拟合效果好。

        用训练好的模型对8月19日-9月15日共4周的办公建筑逐时能耗进行预测,与实测的逐时能耗数据进行对比,验证能耗预测模型的拟合度,预测效果如图8所示。


图7 无人员变量办公建筑逐时能耗模型拟合结果   图8 无人员变量办公建筑逐时能耗模型预测结果

        由图8可以看出,逐时能耗预测模型的拟合效果较好,其中工作日的拟合曲线精度较高,而周末的预测结果,趋势上较为接近,但日均能耗波动较大,从而使预测结果有偏差,办公建筑模拟预测结果的整体平均相对误差为11.24%。下面进一步分析各星期类型的预测精度。表1为不同星期类型平均预测精度比较。从表1可以看出,LSTM神经网络预测模型对于不同星期类型的能耗预测结果有较大差异,其中对于类型1工作日的预测精度比较高,可以控制在10%左右。其次为周六,而对周日的预测结果相对误较大。这是由于办公建筑,工作日的使用情况比较稳定,而周末,办公建筑的能耗波动主要取决于加班等人行为因素,并未考虑到本模型的建模当中,因此对于办公建筑周末的预测结果较差。

表1 办公建筑不同星期类型平均预测精度比较

        3.4.3 有人员变量的LSTM 预测结果 

        在上述基础加入人员数据,建立夏季高温日办公建筑逐时能耗模型,均方误差值RMSE为43.24,模型拟合效果提升,如图9所示。同样对8月19日-9月15日共4周的办公建筑逐时能耗进行预测,并与实测的逐时能耗数据进行对比,预测结果如图所10示。


图9 有人员变量办公建筑逐时能耗模型拟合结果    图10 有人员变量办公建筑逐时能耗模型预测结果

        由图10可以看出,在加入人员变量之后,逐时能耗预测模型的拟合效果更好,其中工作日的拟合曲线精度变高,周末的预测结果明显变好。表2为加入人员数据不同星期型平均预测精度比较,可以看出,在加入人员变量之后,工作日预测模型精度在8.78%左右,整体相对误差都小于10%。

表2 加入人员变量后不同星期类型平均预测精度比较

        3.5 预测结果对比分析

        为解释为何加入人员变量后周末预测效果显著提升,我们把8月19日-9月15日共4周的办公建筑逐时能耗做时均处理,将逐时人员数据也做时均处理,得到11图,可以看出,在一天中,工作日时均人员数据与时均能耗数据的分布相似,周六到周日这种相似性减弱。


图11  能耗和人员数据的时均曲线   

        采用皮尔逊相关系数法,应用SPSS,将不同星期类型的时均人员数据与时均能耗数据做相关性分析,得到表3。可以看出,时均人员数据与时均能耗呈现正相关,且相关性显著。在工作日1,相关性最显著;周六2、周日3相关性显著变弱。说明了办公建筑时间数据包含了人员数据对能耗预测的影响,由于工作日的使用情况比较稳定,周末人员少且变动不稳定,这种包含关系从工作日到周日依次变弱。      

表3 时均能耗与不同星期类型时均人员数据的相关性分析

        **.在0.05级别(双尾),相关性显著; *.在0.01级别(双尾),相关性显著。

4 结论

        本研究采用单连接聚类分析的方法,确定了办公建筑能耗预测模型中星期类型的划分方式,分为工作日、周六、周日三种类型,提高了能耗预测模型的预测精度。应用长短期记忆神经网络模型对办公建筑逐时能耗进行预测,对比分析有无人员变量的预测结果,加入人员变量后,预测结果的相对误差由11.24%降为8.78%;工作日,相对误差由10.19%降为8.78%;周六,相对误差由11.9%降为8.26%;周日,相对误差由15.81%降为9.29%,加入人员变量后,预测精度明显变好。将逐时人员数据与逐时能耗数据进行相关性分析,工作日的相关性最显著,周六、周日相关性变弱。

参考文献

        [1] 中国建筑节能协会能耗专委会.《中国建筑能耗研究报告(2020)》. 2020.
        [2] 丰艳萍,武涌. 节能运行监管—我国大型公共建筑节能管理的必然选择[J]. 暖通空调,2007,37(8): 8-12.
        [3] Safa Mjccd,Safa Mahdi,Allen Jeremy. Improving sustainable office building operation by using historical data and linear models to predict energy usage[J]. Sustain able Cities and Society,2017,29:107-117.
        [4] 廖文强, 王江宇, 陈焕新,等.基于长短期记忆神经网络的暖通空调系统能耗预测[J].制冷技术,2019,39(1):45-50,54.
        [5] M. Ashouri, F. Haghighat, B.C.M. Fung, H. Yoshino. Development of a ranking procedure for energy performance evaluation of buildings based on occupant behavior, Energy Build, 183 (2019) 659-671. 
        [6] Zhang W, Tan S, Lei Y, et al. Life cycle assessment of a single-family residential building in Canada: a case study [J] . Building Simulation, 2014, 7(4) :429-438.
        [7] Delzendeh E, Wu S, Lee A, et al. The impact of occupants' behaviours on building energy analysis: a research review [J]. Renewable and Sustainable Energy Reviews, 2017, 80: 1061-1071.
        [8] 赵海湉, 王需, 林波荣等. 使用需求参数对建筑大数据能耗预测影响规律初探[J]. 建筑节能, 2020,48(07).
        [9] Sun Y, Haghighat F, Fung B C M. A Review of the-State-of-the-Art in Data-driven Approaches for Building Energy Prediction[J]. Energy and Buildings, 2020, 221:110022.
        [10] Y. Wei, et al, Prediction of occupancy level and energy consumption in office building using blind system identification and neural networks, Appl. Energy 240 (2019) 276-294.
        [11] 周璇, 凡祖兵, 刘国强,等. 基于多元非线性回归法的商场空调负荷预测[J]. 暖通空调, 2018, 048(003):120-125.
        [12] 欧阳前武, 符亚磊, 任中俊. 基于时间序列分析模型的建筑能耗两级预测关系研究[J]. 建设科技, 2019(14).
        [13] Fekri M N, Patel H, Grolinger K, et al. Deep learning for load forecasting with smart meter data: Online Adaptive Recurrent Neural Network[J]. Applied Energy, 2021, 282.
        [14] 朱芸芸. 基于人工神经网络模型的区域建筑业态配比方法研究[D]. 北京工业大学, 2020.
        [15] HOCHREITER S, SCHMID HUBER J. Long short-term memory[J]. Neural Computation 1997, 9(8):1735-1780.
        [16] GRAVES A. Generating sequences with recurrent neural networks[DB/OL]. https ://arxivorg/abs/1308 0850,2013.
        [17] 周晓旭. 基于层次聚类的LSTM神经网络模型在江苏省降水量预测中的应用[D]. 山东大学, 2020.
        [18] 王激华, 仇钧, 方云辉,等. 基于深度长短期记忆神经网络的短期负荷预测[J]. 广东电力, 2020(8).
        [19] http://colah.github.io/posts/2015-08-Understanding-LSTMs/
        [20] 刘晶, 朱锋峰, 林辉. 基于相似日负荷修正算法的短期负荷预测[J]. 计算机工程与设计, 2010(06):125-128.
        [21] 李沁, 李百战, 丁勇. 大型办公建筑照明及插座系统电耗逐时使用率聚类分析[J]. 土木建筑与环境工程, 2014, 036(005):89-94.

        备注:本文收录于《建筑环境与能源》2021年4月刊 总第42期(第二十届全国暖通空调模拟学术年会论文集)。版权归论文作者所有,任何形式转载请联系作者。