摘要
为了减少电动汽车大规模集成到电网造成的不利影响,提出了一种能够实现充电站充电负荷精准预测的方法。该方法利用LightGBM(light gradient boosting machine)与XGBoost(eXtreme gradient boosting)模型构建线下‒线上组合模型。考虑充电负荷、时间、温度、天气等历史数据,利用LightGBM模型初步建立充电负荷线下预测模型;基于XGBoost模型,以线下预测模型输出负荷和实际负荷的误差为优化目标,实时变化的交通流量为协变量,建立线上预测模型,并对初步预测结果进行误差修正。某市实际充电站预测结果表明,相比于随机森林(RF)、LightGBM模型、XGBoost模型、多层感知机(MLP)以及LightGBM‒RF组合模型,该组合模型具有更高的预测精度,同时可以准确预测不同充电站的实时充电负荷。
电动汽车具有2种属性,一种属性是需要充电,另一种属性是可以随机移动,因此电动汽车被视为随机性的移动负荷。这2种属性给电网运营带来了一系列挑战。大规模电动汽车并入电网充电容易导致电网负荷过载,从而影响能源系
充电负荷预测研究方法分为模型驱动法和数据驱动
上述文献聚焦于预测方法的构建,将所有特征同时输入模型中进行预测,缺乏对输入特征实时变化的考量。为充分利用数据的实时变化,采用适合于高维度海量数据的LightGBM与XGBoost模型构建线下‒线上组合模型,分批输入特征。LightGBM模型对天气、温度等实时变化小的特征进行线下模型训练,XGBoost模型对实时变化大的交通流数据进行线上模型完善,从而更好地适应环境因素的实时变化。将充电负荷预测范围精确到以充电站为单位,以能够精准预测任意组合充电站的充电负荷为目标。实验结果表明,该线下‒线上组合模型是一个在充分考虑输入数据实时变化的前提下实现多个充电站充电负荷精准预测的通用模型。
通过调研获取了国内某个城市86个公用充电站的充电负荷数据,对充电站充电特性及共性进行分析。
将充电站每小时输出功率数据的质量作为筛选指标,选取充电站充电功率数据进行分析,数据周期为2021‒01‒01―2021‒12‒20,采样频率为每小时记录一次,每个充电站共记录8 496条数据。

图1 各充电站充电功率极值曲线
Fig.1 Extreme value curve of charging power of each charging station

图2 某充电站充电功率变化曲线
Fig.2 Charging power change curve at a charging station
LightGBM是由梯度提升决策树(GBDT)改进所得的集成算法,在进行分类、预测、数据挖掘时,能够解决GBDT因数据量过大而出现的过拟合、训练速度缓慢等问
为了防止过拟合现象的发生,LightGBM模型采用直方图算法和带深度限制的Leaf-wise(按叶子生长)策略。直方图算法能够将连续的特征值离散化,并以离散值个数为宽度构造相应直方图。利用直方图存放遍历数据时产生的统计量,可在占用内存更小的情况下加速遍历以寻找最佳分割
XGBoost是一种决策树模型,以减小残差为目标,不断构建子模型、生成预测值,直到残差能够满足系统的误差要求,预测精度随迭代次数的增加而提
相比于GBDT和随机森林,XGBoost模型做出了多项改进。通过添加正则化术语有效控制决策树的复杂性,提高模型的概括能力,从而减少过度拟合的风险。同时,XGBoost模型能够实现随机采样和缺失值自动处理,支持二阶泰勒展开以去除目标函数中的常数项、选择并行化特征以及自定义损失函数,有效提升预测速
相比于XGBoost模型,LightGBM模型虽然具有更高的运算精度与速度,但是其Leaf-wise策略更易出现过度拟合,而且线上模型的实时性大大增加了深度限制的设置难度。为了充分发挥线上模型的修正作用,最终选择XGBoost模型进行线上学习。
为了提高模型的预测精度,首先构建一个训练完备的线下模型,再通过实时滚动的线上模型对结果进行进一步的修正。组合模型预测框架如

图3 预测框架
Fig.3 Prediction framework
(1) 线下模型建立。将充电站历史充电负荷、天气、温度、日期等数据作为输入,构造历史充电负荷统计量和与日期相关的新特征,所有特征共同输入LightGBM模型中得到充电站充电负荷预测值。可根据预测需要选择参与训练的充电站,对充电站数目不加限制,所有充电站的信息拼接后共同输入模型。
(2) 线上模型建立。将预测站点附近的交通流量实时信息作为新的输入数据,选择的站点需与步骤(1)中一致。然后,通过XGBoost模型对真实充电负荷与预测值之间的残差进行预测,即,最终输出。
(3) 结果输出。将线下模型得到的充电站充电负荷预测值与线上模型得到的残差加和作为最终的充电负荷预测值,即。
除分析充电站历史充电负荷数据影响外,还着重考虑温度、天气、交通流量等因素对充电负荷的影响。温度与天气数据通过公开数据获得。

图4 某市2021年温度和天气情况分布
Fig.4 Temperature and weather map of a city in 2021
交通流量数据是由百度地图基于海量的交通出行大数据、车辆轨迹大数据和位置定位大数据等挖掘计算所得,包括拥堵指数和平均速度两部分,采样频率为5 min采样一次。
(1) |
式中:为拥堵指数;为车辆实际行程时间;为车辆畅通行程时间;为车辆畅通情况下平均车速;为车辆实际平均车速。

图 5 某市某路段拥堵指数与平均速度随时间的变化
Fig.5 Variation of traffic congestion index and average speed with time at certain road section in a city

图6 某市3条路段拥堵指数随时间的变化
Fig.6 Variation of traffic congestion index with time at three road sections in a city
原始数据只包括时间、充电站历史充电负荷、天气、温度和交通流量数据,为了进一步提高预测的准确性以及更加精确地描述数据,需从原始数据中进一步提取特征。将输出功率发生时间的月、日、星期、时刻信息进行拆分,构造month、day、dayofweek和hour特征。然后,判断该时间是一年中的第几天、第几个星期、是否为工作日,构造days、week和is_workday特征。针对充电站的输出功率数据,采用时间窗移动方法,选择预测前1~4 h的输出功率作为新特征,并计算前2~4 h输出功率的最大值、最小值、均值与标准差,对特征进一步补充。模型最终输入特征如
类型 | 名称 | 说明 |
---|---|---|
特征1 | pdate | 充电功率记录时间 |
特征2 | days | 一年的第几天 |
特征3 | month | 所在月份 |
特征4 | week | 一年的第几个星期 |
特征5 | day | 所在月份的第几天 |
特征6 | hour | 几点 |
特征7 | dayofweek | 周几 |
特征8 | is_workday | 是否为工作日 |
特征9 | tem_max | 当日最高温度 |
特征10 | tem_min | 当日最低温度 |
特征11 | weather_day | 当日白天天气 |
特征12 | weather_night | 当日夜晚天气 |
特征13 | rolling_1h | 预测时刻前1 h的输出功率 |
特征14 | rolling_2h_max | 预测时刻前2 h的输出功率最大值 |
特征15 | rolling_2h_min | 预测时刻前2 h的输出功率最小值 |
特征16 | rolling_2h_mean | 预测时刻前2 h的输出功率均值 |
特征17 | rolling_2h_std | 预测时刻前2 h的输出功率标准差 |
特征18 | rolling_2h | 预测时刻前2 h的输出功率 |
特征19 | rolling_3h_max | 预测时刻前3 h的输出功率最大值 |
特征20 | rolling_3h_min | 预测时刻前3 h的输出功率最小值 |
特征21 | rolling_3h_mean | 预测时刻前3 h的输出功率均值 |
特征22 | rolling_3h_std | 预测时刻前3 h的输出功率标准差 |
特征23 | rolling_3h | 预测时刻前3 h的输出功率 |
特征24 | rolling_4h_max | 预测时刻前4 h的输出功率最大值 |
特征25 | rolling_4h_min | 预测时刻前4 h的输出功率最小值 |
特征26 | rolling_4h_mean | 预测时刻前4 h的输出功率均值 |
特征27 | rolling_4h_std | 预测时刻前4 h的输出功率标准差 |
特征28 | rolling_4h | 预测时刻前4 h的输出功率 |
特征29 | station_name | 充电站名称 |
在机器学习的回归分析中,采用线性回归决定系数(
(2) |
(3) |
式中:n为测试样本数量;为第i个样本的真实值;为第i个样本的预测值;为样本均值。
线上XGBoost模型的输入变量只有一个流量特征,因此只对线下LightGBM模型的多个特征的重要性进行分析。回归分析时LightGBM模型采用分裂信息增益作为决策树的重要性构建指标,特征在决策树中出现次数越多则越重要,该特征的信息增益总和也越大。信息增益计算式为
(4) |
式中:、分别为左右子节点的样本总数;;、分别为左右子节点的基尼系数。筛选信息增益最大的前29个特征构建特征重要性分析图,结果如

图7 充电站特征重要性分析
Fig.7 Importance analysis of charging station features
重要性为零的特征在
对
为了验证LightGBM与XGBoost组合模型的有效性,将实验数据按照4∶1的比例划分为训练集和测试集,选择单一算法模型随机森林(RF)、LightGBM、XGBoost、多层感知机(MLP)以及组合模型LightGBM‒RF作为对比模型,与LightGBM与XGBoost组合模型的充电负荷预测结果进行对比,结果如
模型 | 评价指标 | |
---|---|---|
/% | ||
RF | 0.998 539 | 0.863 0 |
LightGBM | 0.998 108 | 2.275 2 |
XGBoost | 0.998 527 | 2.117 6 |
MLP | 0.996 865 | 3.015 8 |
LightGBM‒RF | 0.999 661 | 0.825 6 |
LightGBM‒XGBoost | 0.999 928 | 0.227 7 |
分别选择1、12、24、36、48、60、72、84个充电站对模型进行训练,再从该城市3个不同的市辖区分别选择一个典型充电站进行充电负荷预测,3个充电站分别命名为充电站1、充电站2、充电站3,验证组合模型的通用性,结果如

图8 充电站数目对
Fig.8 Effect of the number of charging stations on
选择的3个充电站均在单站训练的情况下得到最优预测结果,随着充电站数目的增加,预测结果均出现不同程度的波动,但并未形成一个稳定的变优或变坏趋势,仍处在一个优异表现的范围内,说明LightGBM‒XGBoost组合模型能够有效实现一个模型对多个充电站的预测。
新能源汽车的高速发展为电网带来压力,实现充电站充电负荷的精准预测十分必要。考虑天气、温度、交通流量等影响因素,构建了时间、历史充电负荷统计量等新特征,基于LightGBM与XGBoost模型提出了线下‒线上相结合的组合算法。以数据的实时变化为标准,分批将数据输入线下‒线上模型,并通过选择不同数目的充电站进行训练,创建了一个能够精准预测多个充电站充电负荷的通用模型。相比RF、LightGBM、XGBoost、MLP模型以及LightGBM‒RF组合模型,LightGBM‒XGBoost组合模型的预测结果具有更高的精度,并且线下线上相结合的形式能够实现模型结果的实时更新,对于新能源汽车与电网的有效整合具有积极影响。
未来应对算法进行进一步优化,探究充电车辆的类型、充电站位置等因素对充电站充电负荷预测的影响,优化参与训练充电站的选择标准,减少充电站的不同组合对预测精度的影响,构建更具通用性的模型。
作者贡献声明
李 波:论文框架设计,建模仿真,论文撰写与修改。
王 宁:研究思路指导,论文审阅与修改。
吕叶林:数据采集与分析,论文撰写。
陈 宇:图表绘制,论文撰写。
参考文献
夏文芳. 电动汽车用电负荷预测及对城市电网的影响[J]. 农村电气化, 2018(11): 9. [百度学术]
XIA Wenfang. Electric vehicle load predication and analysis of influence of electric vehicle load on urban power network [J]. Rural Electrification, 2018(11): 9. [百度学术]
MÜLLER M, BLUME Y, REINHARD J. Impact of behind-the-meter optimised bidirectional electric vehicles on the distribution grid load[J]. Energy, 2022, 255: 124537. [百度学术]
ALLENSPACH C, HOGGER R, OBUSHEVS A, et al. Implementation of quasi-static time series simulations for analysis of the impact of electric vehicles on the grid[C]//2019 IEEE 60th International Scientific Conference on Power and Electrical Engineering of Riga Technical University (RTUCON). Piscataway: IEEE, 2019: 1-10. [百度学术]
ZWEISTRA M, JANSSEN S, GEERTS F. Large scale smart charging of electric vehicles in practice[J]. Energies, 2020,13(2):298. [百度学术]
魏阳喆. 电动汽车充电对电网影响综述[J]. 时代汽车, 2022(2): 108. [百度学术]
WEI Yangzhe. Overview of the impact of electric vehicle charging on the power grid [J]. Times Automotive, 2022(2): 108. [百度学术]
金兆鹏. 电动汽车大规模接入对电网安全运行影响及管控措施分析[J]. 装备维修技术, 2019(4): 159. [百度学术]
JIN Zhaopeng. Analysis of the impact of large-scale access of electric vehicles on the safe operation of power grid and control measures[J]. Equipment Technology, 2019(4): 159. [百度学术]
陈男, 孙晓东, 马志鹏. 电动汽车接入电网对电网谐波的影响[J]. 电子测试, 2021(17): 122. [百度学术]
CHEN Nan, SUN Xiaodong, MA Zhipeng. The impact of electric vehicles connected to the grid on grid harmonics [J]. Electronic Test, 2021(17): 122. [百度学术]
BUZNA L, DE FALCO P, FERRUZZI G, et al. An ensemble methodology for hierarchical probabilistic electric vehicle load forecasting at regular charging stations[J]. Applied Energy, 2021, 283: 116337. [百度学术]
DENG S, CHEN F, WU D, et al. Quantitative combination load forecasting model based on forecasting error optimization[J]. Computers and Electrical Engineering, 2022, 101: 108125. [百度学术]
蔡黎, 葛棚丹, 代妮娜, 等. 电动汽车入网负荷预测及其与电网互动研究进展综述[J]. 智慧电力, 2022, 50(7): 96. [百度学术]
CAI Li, GE Pengdan, DAI Nina, et al. Review of research progress on load prediction and grid interaction of electric vehicles [J]. Smart Power, 2022, 50(7): 96. [百度学术]
王哲, 万宝, 凌天晗, 等. 基于谱聚类和LSTM神经网络的电动公交车充电负荷预测方法[J]. 电力建设, 2021, 42(6): 58. [百度学术]
WANG Zhe, WAN Bao, LING Tianhan, et al. Electric bus charging load forecasting method based on spectral clustering and LSTM neural network [J]. Electric Power Construction, 2021, 42(6): 58. [百度学术]
王琨, 高敬更, 张勇红, 等. 基于LSTM神经网络的复合变量电动汽车充电负荷预测方法技术研究[J]. 工业仪表与自动化装置, 2019(1): 27. [百度学术]
WANG Kun, GAO Jinggeng, ZHANG Yonghong, et al. Study on forecasting method of charging load of hybrid variable electric vehicle based on LSTM neural network [J]. Industrial Instrumentation & Automation, 2019(1): 27. [百度学术]
ZHENG Y, SHAO Z, ZHANG Y, et al. A systematic methodology for mid-and-long term electric vehicle charging load forecasting: the case study of Shenzhen, China[J]. Sustainable Cities and Society, 2020, 56: 102084. [百度学术]
陈丽丹, 张尧, FIGUEIREDO A. 电动汽车充放电负荷预测研究综述[J]. 电力系统自动化, 2019, 43(10): 177. [百度学术]
CHEN Lidan, ZHANG Yao, FIGUEIREDO A. Overview of charging and discharging load forcasting for electric vehicles [J]. Power System Automation, 2019, 43(10): 177. [百度学术]
梁宏涛, 刘红菊, 李静, 等. 基于机器学习的短期负荷预测算法综述[J]. 计算机系统应用, 2022, 31(10): 25. [百度学术]
LIANG Hongtao, LIU Hongju, LI Jing, et al. Survey on short-term load forecasting algorithm based on machine learning [J]. Computer Systems & Applications, 2022, 31(10): 25. [百度学术]
王华彪, 李小勇. 基于融合注意力机制改进双向长短时记忆网络在电动汽车充电负荷中的预测研究[J]. 电网与清洁能源, 2022, 38(6): 104. [百度学术]
WANG Huabiao, LI Xiaoyong. Prediction of electric vehicle charging load based on integrating attention mechanism to improve BiLSTM [J]. Power System and Clean Energy, 2022, 38(6): 104. [百度学术]
FENG J, YANG J, LI Y, et al. Load forecasting of electric vehicle charging station based on grey theory and neural network[J]. Energy Reports, 2021, 7: 487. [百度学术]
SHEN X, ZHAO H, XIANG Y, et al. Short-term electric vehicles charging load forecasting based on deep learning in low-quality data environments[J]. Electric Power Systems Research, 2022, 212: 108247. [百度学术]
李恒杰, 朱江皓, 傅晓飞, 等. 基于集成学习的电动汽车充电站超短期负荷预测[J]. 上海交通大学学报, 2022,56(8):1004. [百度学术]
LI Hengjie, ZHU Jianghao, FU Xiaofei, et al. Ultra-short-term load forecasting of electric vehicle charging stations based on ensemble learning [J]. Journal of Shanghai Jiao Tong University, 2022,56(8):1004. [百度学术]
吴丹, 雷珽, 李芝娟, 等. 基于XGBoost与LightGBM集成的电动汽车充电负荷预测模型[J]. 电子技术应用, 2022, 48(9): 44. [百度学术]
WU Dan, LEI Ting, LI Zhijuan, et al. Electric vehicle charging load forecasting based on XGBoost and LightGBM integration model [J]. Application of Electronic Technique, 2022, 48(9): 44. [百度学术]
邱瑞东, 何山, 董宁, 等. 基于LSTM-LGB模型的光伏电站辐照强度预测[J]. 安徽大学学报(自然科学版), 2021, 45(3): 66. [百度学术]
QIU Ruidong, HE Shan, DONG Ning, et al. Irradiation intensity prediction of photovoltaic power station based on LSTM-LGB model[J]. Journal of Anhui University(Natural Sciences), 2021, 45(3): 66. [百度学术]
肖迁,穆云飞,焦志鹏,等.基于改进LightGBM的电动汽车电池剩余使用寿命在线预测[J].电工技术学报,2022,37(17):4517. [百度学术]
XIAO Qian, MU Yunfei, JIAO Zhipeng, et al. lmproved LightGBM based remaining useful life prediction of lithium-ion battery under driving conditions [J]. Transactions of China Electrotechnical Society,2022,37(17):4517. [百度学术]
昌玲, 邓国安. 基于LightGBM及LSTM融合的科技园区短期负荷预测[J]. 湖南电力, 2021, 41(6): 31. [百度学术]
CHANG Ling, DENG Guoan. Short term load forecasting of science and technology park based on integration of LightGBM and LSTM [J]. Hunan Electric Power, 2021, 41(6): 31 [百度学术]
蔡明, 孙杰, 李培德, 等. 三种机器学习算法在回归应用中的对比分析[J]. 智能计算机与应用, 2022, 12(8): 165. [百度学术]
CAI Ming, SUN Jie, LI Peide, et al. Comparative analysis of three machine learning algorithms in regression application [J]. Intelligent Computers and Applications, 2022, 12(8): 165. [百度学术]
卢锦玲, 郭鲁豫, 张梦雪, 等. 基于MGS‒LGBM算法的电力系统暂态稳定评估[J]. 电力科学与工程, 2020, 36(3): 52. [百度学术]
LU Jinling, GUO Luyu, ZHANG Mengxue, et al. Power system transient stability assessment based on MGS-LGBM [J]. Electric Power Science and Engineering, 2020, 36(3): 52. [百度学术]
肖宇, 赵建有, 叱干都, 等. 基于XGBoost的短时出租车速度预测模型[J]. 交通信息与安全, 2022, 40(3): 163. [百度学术]
XIAO Yu, ZHAO Jianyou, CHIGAN Du, et al. A short-term prediction model for taxi speed based on XGBoost [J]. Journal of Transport Information and Safety, 2022, 40(3): 163. [百度学术]
杨洋, 谷震浩. 基于XGBoost‒DNN的中期电力负荷预测[J]. 计算机系统应用, 2021, 30(9): 186. [百度学术]
YANG Yang, GU Zhenhao. Mid-term power load forecasting based on XGBoost-DNN [J]. Computer System & Applications, 2021, 30(9): 186. [百度学术]
DONG J, CHEN Y, YAO B, et al. A neural network boosting regression model based on XGBoost[J]. Applied Soft Computing, 2022, 125: 109067. [百度学术]
代业明, 周琼. 基于改进Bi‒LSTM和XGBoost的电力负荷组合预测方法[J]. 上海理工大学学报, 2022, 44(2): 138. [百度学术]
DAI Yeming, ZHOU Qiong. Power load combination forecasting method based on improved Bi-LSTM and XGBoost [J]. Journal of University of Shanghai for Science and Technology, 2022, 44(2): 138. [百度学术]
CHICCO D, WARRENS M J, JURMAN G.The coefficient of determination R-squared is more informative than SMAPE, MAE, MAPE, MSE and RMSE in regression analysis evaluation[J].PeerJ Computer Science,2021,7: e623. [百度学术]
AMARA-OUALI Y, GOUDE Y, HAMROUCHE B, et al. A benchmark of electric vehicle load and occupancy models for day-ahead forecasting on open charging session data[C]//Proceedings of the Thirteenth ACM International Conference on Future Energy Systems. New York: ACM, 2022: 193-207. [百度学术]