您的浏览器不支持JavaScript,请开启后继续

China Heating,Ventilation and Air Conditioning
联系热线:010-64693287 / 010-64693285

基于数据挖掘的建筑热惰性周期研究

  • 作者:
  • 中国暖通空调网
  • 发布时间:
  • 2020-01-03

河北工业大学  朱 佳  孙春华  耿欣欣  齐承英

       【摘 要】首先建立了以室外温度和历史耗热量为自变量的建筑热惰性周期回归预测模型,然后利用MATLAB软件对某地不同热工性能的散热器供暖建筑楼栋耗热量进行回归预测分析,发现耗热量受建筑热惰性周期的影响,并提出建筑热惰性周期的概念。通过对回归结果相对误差分析发现,建筑热惰性周期经历三个时期,即波动期,平稳期和波动发散期。对于不同热工性能的建筑通常有不同的最佳热惰性周期,且随着热工性能的提高,最佳热惰性周期变长。这一研究为供热系统的供热参数准确预测提供有价值的理论参考。

       【关键词】数据挖掘;耗热量;回归预测模型;MATLAB;建筑热惰性周期

1 引言

       在如今的信息化时代里,各种行业或组织的数据得以海量积累和传递。但是,从海量的数据当中提取有用的信息也成为了一个难题。在海量数据面前,传统的数据分析工具和方法很无力。数据挖掘是一种将传统的数据分析方法与处理大量数据的复杂算法相结合的技术,它可以从大量模糊的随机数据中,提取隐含在其中的潜在有用信息和知识,为此数据挖掘广泛应用于各个行业。国内外众多学者也纷纷将这一技术应用于供热领域。Werner[1]通过应用数据挖掘技术对多个瑞典区域的供热系统热负荷历史数据进行研究、分析,最终得出影响供热负荷的主要因素为室外温度、自然风和太阳辐射的影响相对较小这一重要结论。OMER[2]等人以土耳其Afyon地区的大量历史气象参数为基础,运用数据挖掘技术对气象参数进行分析,发现相对湿度对建筑的耗热量较小,而室外温度、风速和太阳辐射一定程度上对耗热量影响较大。WESTPHAL[3]等人对大量气象参数、系统热负荷和耗热量的历史数据进行数据挖掘应用,得出不同的气象参数周期选取对预测结果也有较大影响。除了将数据挖掘应用于对未知的潜在信息探索上,这一技术还被应用于供热的能耗预测方面。毕海军[4]使用大量的样本信息,通过模糊神经网络,考虑了室外温度、风力、风向、阴晴状况,对锅炉的供回水温度进行了预测。张德山[5]等人利用多年实际的数据,建立了室外温度与热负荷指标的关系,用以指导热电厂的输出。石兆玉[6]通过研究、分析、试验大量历史数据,运用回归分析将前几天的供热参数及当天的供热参数汇总以预测当天的热负荷,并得到了较高的精度。大量的研究已经表明,采用数据挖掘技术对建筑能耗预测是可行的,但是对于历史数据周期的选取和准确性这二者之间的关系还是有待深入探讨的,这也是本文的研究目的。

2 数据挖掘模型建立

       热负荷的准确预测是实现热力站按需供热达到节能运行的基础和前提。实现按需供热的供热系统应该根据用户需热量及室外气象参数的变化进行周期性调节,而供热系统供热量由建筑功能、用户生活习惯以及室外气象参数决定,必然具有一定的内在规律。由于供暖系统和建筑存在热惰性,故而对室温的扰动往往有较大的延迟性,因此预测模型的时间单位往往以天为基数,所以预测按时间分类应为中期预测。加之笔者有着大量的历史耗热量数据,以及越来越多回归分析能耗预测的成功应用,故本文采用回归分析法预测能耗。

       回归分析法是通过挖掘历史数据来建立自变量与因变量间的关系,以回归模型的方式进行预测[7]。由于回归分析是用数学模型来反映各个自变量和因变量的联系,所以自变量的选择很大程度上决定着预测结果的准确性。建筑耗热量具有时间遗传特性[8],故建筑的历史耗热量也对建筑的耗热量有影响。太阳辐射能是室外温度的绝对影响因素,同时太阳辐射能又能对室内温度进行补偿,所以太阳辐射能对建筑耗热量的影响实际上也可体现为室外温度和历史耗热量上。

       本文采用室外温度和前m天的历史耗热量作为预测模型的自变量,采用最小二乘法来建立回归预测模型,其预测模型如下:

       

       式中:Q,Qi分别为当天的耗热量预测值,前i天的耗热量实测值,kJ;Qyk,Qsk分别为预测耗热量和实际耗热量,kJ;b是回归函数的系数;δ为相对误差;tw为室外温度,℃。

       预测耗热量时采用迭代计算的方式,得到未来1~7天的耗热量。然后运用公式(2)得到预测耗热量与真实值的最小误差,这也是本文的最终目的,即寻找预测值最为准确的建筑热惰性周期m值。

       本文以智慧热网监测平台上传的海量数据为基础,利用计算机数据挖掘理论建立智慧供热监测参数预处理数学模型。对智慧热网各监测参数时序分析,通过其时序特征建立各监测参数的数据预处理模型是本文研究的前提基础。

3 数据选择与预处理

       本文所用的室外温度由室外气象仪采集并自动记录数据,历史耗热量来源于供热系统的实时监控汇总。由于设备精度、设备故障、外界干扰等因素,会导致记录的室外温度数据包含粗大数据,这些数据与真实值相差甚多,若不剔除,将使预测的结果准确性大大降低。首先将选取的历史室外温度汇总,并对其进行曲线拟合,然后将真实值与拟合值作误差,采用拉依达准则法对误差进行处理,根据公式(3)~(5)将异常值剔除,再用内插法进行数据的补充。

       此外,由于供暖初末期供热系统运行不稳定,得到的数据波动性较大,严重影响预测结果,故在选用数据时只选择供暖系统中期稳定的数据。对于异常数据,采用以下方法预处理。耗热量和室内外温度满足公式(6)、(7),由于室内温度一般在设定值上下波动1~2℃,室内温度相较于室外温度来说波动较小,故在公式(8)对耗热量进行线性化处理时可省略室内温度项,其中为传热系数和面积的乘积,该值变化不大。若耗热量数据异常会导致发生突变,根据公式(9)~(11)对进行判断并用内插法进行数据的补充。
       

       式中:Wi为室外温度与拟合温度的差;Qi,Qi+1分别为第i天,第i+1天的耗热量实测值,kJ;tni,tni+1分别为第i天,第i+1天的室内温度,℃;twi,twi+1分别为第i天,第i+1天的室外温度,℃。

4 建筑热惰性周期m值分析

       对某地小区楼栋1采集的2016/2017年度供暖季数据进行模拟预测,该楼栋的建筑年限为2011年。经过筛选剔除异常数据后,选用较为稳定的供暖中期即第33天至第104天共72天的数据,通过MATLAB软件将其中前65天数据进行拟合,拟合完成后预测未来7天的耗热量并与实际耗热量进行比对,结果详见图1。横坐标为热惰性m的取值。纵坐标为预测值于实际值的相对误差。

图1楼栋1预测相对误差图

       从图1可以看到:当m<10时,预测值与真实值的相对误差的波动较大,且误差绝对值也较大最大可达16.62%;当m在区间[10,12]时,预测值与真实值的相对误差较小且变化相对平稳,最大为8.92%;当m>12时,预测值与真实值的相对误差又开始出现波动并逐渐扩大。由图可知,预测当天的耗热量与前12天历史耗热量相关性较大,而与12天之前的历史耗热量相关性较小。    

       为了更清楚的看出相对误差的变化情况,这里引进相对误差波动值这一概念,相对误差波动值就是m=j和m=j+1所对应的相对误差的差值。楼栋1的相对误差波动值详见图2。从相对误差波动值可以看到,当m处于[10,12]时,相对误差的波动值在1%左右;而当m<10天之前,波动值在±10%以内;而当m>12时,波动值在±20%以内。

图2楼栋1的相对误差波动值

       深入研究耗热量预测值与实际值的相对误差及波动值的特性,选取了另外三个不同小区楼栋,这些小区的末端均是散热器,小区的建筑年限分别为2004年、2007年、2009年,分别作出这些楼栋耗热量预测值的相对误差和波动值,并进行分析对比,具体如下。

   图3楼栋2预测相对误差图                   图4楼栋2的相对误差值 

       从图3和图4可以看到:在对建筑年限为2004年的小区楼栋2耗热量预测时,当m<5时,相对误差有小的波动;当m处于[5,8]时,相对误差较为平稳变化,最大为8.81%;当m>8时,相对误差无规则上下波动,变化较大。

       从相对误差波动值变化曲线可以看出,当m处于[5,8]时,相对误差的波动值在1%左右;而当m<10天之前,波动值在±5%以内;而当m>12时,波动值在±25%以内。 

图5楼栋3预测相对误差图                  图6楼栋3的相对误差值

       如图5所示,在对建筑年限为2007年的小区楼栋3耗热量预测结果分析,当m<7时,相对误差呈现小规模波动,最大可达10.56%;当m位于[7,9]时,相对误差较为平稳变化,并且数值较小,最大为8.91%;当m>9时,相对误差无规则上下波动,其数值也较大。

       如图6所示,从相对误差波动值变化曲线可以看到,当m处于[7,9]时,相对误差的波动值在1%左右;而当m<7天之前,波动值在±5%以内;而当m>9时,波动值在±25%以内。

图7楼栋4预测相对误差图                   图8楼栋4的相对误差值

       同样,如图7所示,当对建筑年限为2009年的小区楼栋4耗热量预测结果分析,当m<7时,相对误差呈现小规模波动,最大可达10.88%;当m位于[7,9]时,相对误差较为平稳变化,并且数值较小,最大为8.79%;当m>9时,相对误差无规则上下波动,其数值也较大。

       如图8所示,从相对误差波动值变化曲线可以看到,当m处于[7,9]时,相对误差的波动值在1%左右;而当m<7天时,波动值在±5%以内;而当m>9时,波动值在±30%以内。

       通过对小区不同建筑热力入口进行供暖中期的耗热量预测结果的对比与分析,可以清晰的看到每个楼栋的耗热量预测值与实际值的相对误差都存在着三个阶段:当m处于第一阶段时,预测结果与实际值的相对误差出现小幅度波动;当m处于第二阶段时,随着m的增加,预测结果与真实值的相对误差和波动均小,趋势平稳;当m处于第三阶段时,随着m的增加,相对误差越来越大并逐渐呈现发散状。根据这三个阶段的变化特性,将第一阶段称为波动期,第二阶段称为平稳期,第三阶段称为波动发散期,如图9所示。

图9相对误差变化趋势图

       通过上述4个楼栋耗热量的对比分析还能发现,平稳期的相对误差波动值的绝对值均小于1%,而在波动期和波动发散期的相对误差波动值的绝对值均大于1%。

       在楼栋1的例子中,为了保证预测结果的稳定性与准确性,较为合理的m值范围应为[10,12],同时考虑到m的扩大会提高计算难度,也会扩大除耗热量外别的影响因子的扰动,故而取楼栋1 的最佳热惰性周期m值为10。同样,楼栋2的最佳热惰性周期m值为5,楼栋3的最佳热惰性周期m值为7,楼栋4的最佳热惰性周期m值为7。不仅仅最佳热惰性m值随着建筑年限改变而变化,不同年限建筑的预测耗热量稳定期开始与结束的时间也不同的,但是稳定期包含的天数却大致相等,为了更清晰地看到这一变化规律,将上述楼栋的稳定期放一起进行对比,如下图10所示。

图10不同年代建筑耗热量预测的热惰性周期m值变化趋势图

       分析不同建筑年代热惰性周期出现差异的原因,大致可以归结为以下几点:

       随着围护结构热工性能的提高,室内温度受外界影响越来越小,故而与当天耗热量相关的历史耗热量天数会增加,即热惰性周期m值会增大。

       由于使用的历史耗热量数据均来自同一地区,所以建筑年代相近的热惰性周期m值出现相等的情况。

       笔者所用的数据都是供暖中期72天连续、稳定的数据,所以预测结果的开始值与结束值之间差距较小。

5 结论

       应用数据挖掘的技术,以大量的历史数据为基础,预测并研究邢台地区多个小区楼栋的耗热量,可以得到以下结论:

       (1)建立了建筑热惰性周期数据挖掘模型。

       (2)通过时序数据挖掘技术对各类不同热工性能建筑耗热量进行预测,根据预测误差波动规律得出影响建筑热负荷的历史数据周期,即建筑热惰性周期m值。

       (3)筑热惰性周期通常划分为三个阶段:波动期,平稳期,波动发散期。在波动期时,随着m的增加,误差波动值会小幅度波动;在平稳期时,误差波动值变化很小、趋势平稳,且相对误差波动值均在1%左右;在波动发散期时,误差波动值会越来约大、逐渐发散。

       (4)由于围护结构性能的差异,不同建筑的最佳热惰性周期m值会有差异。热工性能越好的建筑其m值越大。

       (5)本文是以不同热工性能建筑的热力入口历史耗热量为基础,若是以整个建筑的耗热量为基础进行分析,变化趋势应会更加明显。

参考文献

       [1] Werner S. The heat load in district heating systems [D].Gothen-burg:Chalmers University of Technology,1984;
       [2] OMER Y, TOLGA Y. Climatic parameters and evaluation of energy consumption of the Afyon geothermal district heating system, Afyon, Turkey[J].Renewable Energy, 2009, (34):706-710;
       [3] WESTPHAL F S, LAMBERTS R. The use of weather data to estimate the rural bads of residential buildings[J].Energy and Builds, 2004, (36):47-54.
       [4] 毕海军.基于模糊技术的小区供热站运行参数预测及燃烧控制研究:(硕士学位论文)青岛:中国海洋大学.2004;
       [5] 张德山,王保民,陈正洪,等.北京市城市集中供热节能气象预报系统的应用[J].煤气与热力, 2008, 28(11):A23-A25;
       [6] 石兆玉. 供热系统运行调节与控制[M].北京.清华大学出版社,1994;
       [7] 李晓梅.基于灰色系统理论的夏季电力负荷预测模型的研究:(硕士学位论文)北京:北京交通大学.2004;
       [8] 龙恩深.建筑能耗基因理论研究[D].重庆大学,2005。

       备注:本文收录于第21届暖通空调制冷学术年会(2018年10月23~27日,中国·三门峡)论文集。版权归论文作者所有,任何形式转载请联系作者。