摘要
为了准确预测地铁车站的空调负荷,首先通过地铁车站能耗监测平台的历史数据分析,识别得到客流量和室外气象参数是主要影响因素。其次利用车站CO2体积浓度逐时监测数据建立客流量神经网络预测模型,并与闸机数据对比,预测模型的复相关系数
地下轨道交通车站作为一种典型的公共建筑,单位建筑面积能耗是常规公共建筑的2~4
机器学习算法逐渐应用于建筑空调负荷预测,主要包括人工神经网络(artificial neural network, ANN)和支持向量机(support vector machine, SVM)等方法。Wang
动态客流量参数精确计算也是预测的难点。地铁车站客流量的相关研究主要集中在两个方面。一种是通过经验公式估算确定,如梁
考虑到大部分地铁车站内都对CO2体积浓度进行了多点监测,可能能够间接反映客流量的变化。本文选择广州某换乘车站为研究对象,首先通过相关性分析确定地铁车站空调负荷的关键影响因素,之后结合车站CO2浓度逐时监测数据和部分实测客流数据建立了动态客流量预测模型,以此为基础构建地铁车站空调负荷预测模型,并比较神经网络和支持向量机算法的负荷预测效果。
本文数据来源于广州某地铁车站能耗监测平台,车站为“T”型换乘车站,设计早高峰客流量为40 213人·
(1)数据量大:监测平台的最小数据采样间隔1 min,可提取完整的供冷周期的运行数据。
(2)缺少关键参数:本研究需提取的参数主要包括负荷、室外干球温度、室外湿球温度、客流量和列车行车对数,但是其中客流量和列车行车对数无法直接从监测平台获取,列车行车对数可从列车运行图得到,客流量具有时变性,也不易直接获取,可考虑用监测平台多个测点CO2体积浓度数据进行拟合替代。
(3)数据缺失:从数据平台提取不同变量、不同时间段数据会有不同的缺失情况,需要在预处理阶段进行相应的填充。
(4)数据异常:由于制冷机组、传感器等设备在运行过程中存在着性能失常、数据传输异常等情况,由此带来数据异常,难以直接识别。
地铁车站负荷预测需要从监测平台提取带有时间标签的室外干球温度、室外湿球温度以及多个测点的二氧化碳数据。本文的空调负荷预测主要是用于指导地铁车站空调系统的节能优化运行,需要的是逐时空调负荷预测值,属于短期空调负荷预测任务,因此需要收集的是近期半个月到几个月的历史数据,数据采样间隔为1 h。
缺失值填充的方法主要有统计学方法和基于机器学习算法的方法。考虑到充分利用数据中的其他可用属性(部分属性值缺失),可以用机器学习算法来进行数据填充。常用的数据缺失值填充算法有k近邻(k-nearest neighbor,kNN)算法。kNN 算法是基于某种距离度量,在训练集样本中找到与各个测试集样本距离最近的k个样本,并基于对应的k个样本信息对测试集样本的标签或者属性值进行预测。
监测平台提取的数据有两种异常情况,一种是数据记录中单个数据属性会出现突变等情况,在时间序列上产生极端变化,这种异常肉眼可见,属于“显性异常”;另一种数据异常比较隐蔽,数据记录中每个数据属性在正常波动范围内,但是组成的数据点不符合客观规律,如客流量较大时,负荷反而较低,这种数据明显属于异常数据,需将各属性关联起来进行分析才能发现,属于“隐性异常”。其中“显性异常”数据识别起来较为简单,一般通过设定数据正常波动范围或者基于前后时刻数据差值进行判断即可解决。对于“隐性异常”数据的识别一般采用基于聚类的识别方法。k-means聚类,通过最小化簇内各样本与样本中心的平方误差来得到最优的划分结果,可用于判断“隐性异常”。
通过k-means聚类算法将样本集划分为k个样本簇之后,假设当某一个簇样本集很小时,视该簇数据样本为异常数据;此外在较大的样本簇中,假设正常数据样本距离簇中心较近,认为距离簇中心较远的数据样本为异常数据。
以上述地铁车站能耗监测平台的历史数据作为数据来源,采样时间为2019年4月1日至2019年8月31日,采样间隔为1 h,经数据预处理后用于空调负荷预测。
灰色关联度分析是相关性分析方法的一种,通过比较因素变化曲线的几何形状相似程度,可判断不同因素之间的关联性。下面采用灰色关联度方法对车站空调负荷影响因素进行分析。
从地铁车站能耗监测平台提取2019年8月份逐时室外干球温度、室外湿球温度以及对应时刻的负荷值,此外根据列车运行时刻表计算出不同时间段的列车行车对数。由于监测平台缺少客流数据,而AFC数据中仅有进出站客流信息,对于换乘客流以及乘客停留时间等数据需进行现场实测得到。因此通过实测结合AFC数据得到地铁车站2019年8月份的进出站人数、换乘客流以及停留时间等信息,采用1.2.3节客流量参数计算方法,计算得到8月份逐时客流量参数,、、、和构成数据矩阵,其中为比较数据列,、、和为参考数据列。对各指标进行量纲一处理,如
(5) |
式中:和分别为每个数据列中的最大值和最小值。
根据量纲一化后的比较数据列和参考数据列,按照
(6) |
式中:和分别为比较数据列和参考数据列的第个元素; 为分辨系数。
最后对关联系数求均值得到关联度。计算结果如
灰色关联度的计算结果表明,客流量参数的关联度最大,室外干湿球温度次之,列车行车对数的关联度最小。说明客流的动态变化是地铁车站空调负荷具有时变性的主要影响因素,客流量的准确预测是车站空调负荷准确预测的基础。
从2.1.1节分析中,确定地铁车站空调负荷预测的输入参数有:客流量、室外干球温度、室外湿球温度、是否为工作日(1/0)。考虑到客流量在一天内随着时间变化较为规律,故可以将预测时刻也纳入输入变量。采用灰色关联度分析方法,对预测时刻负荷和负荷的历史数据进行自相关性分析,结果如

图1 负荷自相关系数变化图
Fig. 1 Autocorrelation coefficient change of cooling load
综上,确定地铁车站空调负荷预测输入变量为:①客流量;②是否为工作日(1/0);③预测时刻;④室外干球温度;⑤室外湿球温度;⑥预测时刻前1 h、2 h、3 h、23 h、24 h的空调负荷。故地铁车站空调负荷预测模型的结构为
(7) |
式中:为预测时刻前1 、2 、3 、23 、24 h,分别取1、2、3、23、24。
通过对车站监测平台新风量监测数据进行分析,发现其新风量供给量较为稳定,这也是目前许多车站的现状。此外,由于车站内CO2测点分布广泛,在车站内部远离出入口的CO2测点受出入口热压和风压作用下的自然通风量影响较小,本研究通过相关性分析对测点进行了判断和筛选。因此车站内部CO2测点能即时反映人员动态变化情况,且数据容易获取,可考虑采用CO2浓度数据对客流量进行拟合。
基于实测得到的2019年8月份的实际客流参数,从监测平台提取CO2浓度数据作为输入量,但是由于车站内部CO2监测点数量较多,分布在不同线路的站台、站厅以及换乘平台,采用灰色关联度进行分析,最终选择关联度超过0.75的三个测点,记为A、B和C。分别采用线性回归算法和神经网络算法建立客流量预测模型。并选用复相关系数
根据相关性分析选择测点A、B、C的CO2体积浓度数据作为自变量,对应时刻客流量实测数据作为因变量,采用线性回归方法进行拟合。得到拟合关系式如下:
(8) |
式中:为测点A的CO2浓度数据,1
采用

图2 线性回归客流量预测结果对比
Fig. 2 Comparison of linear regression passenger flow prediction results
神经网络的概念来源于生物的神经元结构,是由具有超强自适应能力的简单神经元并行互连组成的网
通过建立神经网络预测模型得到客流量预测值,与客流量实测数据进行比较,如

图3 神经网络客流量预测结果对比
Fig. 3 Comparison of passenger flow prediction results of BPNN
相比于线性回归方法,BPNN算法预测精度更高,更能有效反映客流变化趋势,这也表明采用CO2浓度预测地铁车站客流量的方法是可靠的,该模型预测得到的客流量可应用于负荷预测。
考虑到不同时间尺度的历史数据得到的模型可能存在差异,本节基于不同时间尺度历史数据,分别采用BPNN算法和SVM算法建立负荷预测模型,并比较两种模型在某一典型周(包含工作日和非工作日)的预测效果。选取2019年8月份的某一典型周(8月1日至8月7日)作为测试集,分别以8月份之前1个月历史数据(2019年7月份)、2个月历史数据(2019年6月份至7月份)、3个月历史数据(2019年5月份至7月份)、4个月历史数据(2019年4月份至7月份)作为训练数据。测试集的空调负荷逐时变化曲线如

图4 测试集空调负荷逐时变化曲线
Fig. 4 Hourly variety curve of cooling load in the test set
采用BPNN算法,分别以8月份之前1个月历史数据(2019年7月份)、2个月历史数据(2019年6月份至7月份)、3个月历史数据(2019年5月份至7月份)、4个月历史数据(2019年4月份至7月份)作为训练数据,在测试集上的预测结果如

图5 神经网络算法负荷预测结果对比
Fig. 5 Comparison of cooling load prediction results of BPNN in the test set
从不同时间尺度训练数据下BPNN算法的负荷预测结果可以看出,不同时间尺度下神经网络算法的预测效果并无明显差异,
SVM由Vapnik

图6 支持向量机算法负荷预测结果对比
Fig. 6 Comparison of cooling load prediction results of SVM in the test set
对比神经网络算法和支持向量机算法的负荷预测效果,结果表明,当增加训练数据量时,两种算法的预测效果均无显著提升,
以广州某地铁车站为预测对象,基于地铁车站监测平台历史数据,建立动态客流量预测模型,并以此为基础,分别利用BPNN和SVM两种机器学习算法,建立了地铁车站空调负荷逐时预测模型。结论如下:
(1)利用灰色关联度方法对地铁车站空调负荷影响因素进行相关性分析,结果表明影响车站空调负荷的影响因素重要性排序为:客流量参数>室外气象参数>列车行车对数,客流量参数是影响负荷动态变化的最主要因素,这也验证了文献[
(2)基于监测平台CO2浓度数据和部分客流量实测数据,分别利用线性回归和神经网络两种算法建立动态客流量预测模型,并根据预测效果最终选择神经网络算法建立动态客流量预测模型,
(3)基于动态客流量预测模型,利用CO2浓度数据预测车站动态客流量,并将其作为车站负荷预测的输入参数。基于不同时间尺度历史数据,分别采用BPNN算法和SVM算法建立地铁车站空调负荷预测模型。比较两种模型在某一典型周(包含工作日和非工作日)的预测效果发现,两种算法的
作者贡献声明
苏醒:确定具体研究内容和实施方案,指导论文撰写及修改成稿。
王磊:完成数据整理分析及计算,撰写论文初稿。
田少宸:协助指导数据分析。
秦旭:提供现场数据,协助指导数据整理。
参考文献
GUAN B, ZHANG T, LIU X. Performance investigation of outdoor air supply and indoor environment related to energy consumption in two subway stations [J]. Sustainable Cities and Society, 2018, 41: 513. [百度学术]
SU Z, LI X. Sub-system energy model based on actual operation data for subway stations [J]. Sustainable Cities and Society, 2020, 52: 101835. [百度学术]
GUAN B, LIU X, ZHANG T, et al. Energy consumption of subway stations in China: Data and influencing factors [J]. Sustainable Cities and Society, 2018, 43: 451. [百度学术]
CASALS M, GANGOLELLS M, FORCADA N, et al. A breakdown of energy consumption in an underground station[J]. Energy and Buildings, 2014, 78: 89. [百度学术]
WANG L, LEE W.M. E, YUEN K.K. R. Novel dynamic forecasting model for building cooling loads combining an artificial neural network and an ensemble approach [J]. Applied Energy, 2018, 228: 1740. [百度学术]
CHEN Z, SUN Y, YANG G, et al. Air conditioning load prediction based on DE-SVM algorithm [C]// Proceedings of the 2010 Third International Symposium on Intelligent Information Technology and Security Informatics. Jinggangshan: IEEE, 2010: 276-279. [百度学术]
LI Q, MENG Q, CAI J, et al. Predicting hourly cooling load in the building: A comparison of support vector machine and different artificial neural networks [J]. Energy Conversion and Management, 2009, 50 (1): 90. [百度学术]
樊佳慧. 基于乘客在站停留时间估计的地铁环控系统负荷计算研究[D]. 北京:北京交通大学交通运输学院,2018. [百度学术]
FAN Jiahui. Research on load calculation of subway environmental control system based on estimation of Passenger dwell time in Station[D]. Beijing: School of Transportation, Beijing Jiaotong University, 2018. [百度学术]
李婷婷,毕海权,王宏林,等. 基于BP神经网络的地铁站厅空调负荷预测[J]. 计算机科学,2019, 46 (11): 590. [百度学术]
LI Tingting, BI Haiquan, WANG Honglin, et al. Prediction of air-conditioning load in metro station hall based on BP neutral network[J]. Computer Science, 2019, 46 (11):590. [百度学术]
付亮. 地铁车站中央空调系统负荷预测与节能优化[D]. 西安:西安建筑科技大学, 2019. [百度学术]
FU Liang. Load forecasting and energy saving optimization of central air conditioning system in metro station[D]. Xi'an: Xi'an University of Architecture & Technology, 2019. [百度学术]
梁园. 地铁换乘站公共区空调计算人员的研究[J]. 制冷与空调, 2013, 27 (2) : 158. [百度学术]
LIANG Yuan. Study of the computational person in public condition system of transfer subway station[J]. Refrigeration and Air Conditioning, 2013, 27 (2): 158. [百度学术]
何磊. 辐射末端复合空调系统监督控制方法研究[D]. 成都:西南交通大学,2016. [百度学术]
HE Lei. Research on supervisory control method for radiant facility combining with air-conditioning system[D]. Chengdu: Southwest Jiaotong University, 2016. [百度学术]
VAPNIK V N. The nature of statistical learning theory[M]. New York: Springer, 1995. [百度学术]
NANYE L, DANIEL G, GUILHERME J, et al. Application of support vector regression to genome-assisted prediction of quantitative traits[J]. Theoretical and Applied Genetics, 2011, 123 (7): 1065. [百度学术]