摘要
为了合理预测城市轨道交通列车在正线上发生故障的概率,首先通过定性分析得到列车编组数、累计走行公里、架修或大修经历为列车故障发生概率的主要影响因素。之后基于实际数据以每12万km为观测范围生成单列车在一定走行公里内故障发生次数的离散数据集,并根据数据呈现的分布特点选择泊松分布、零膨胀泊松分布及可能的函数形式构造3个备选模型。经过模型比选,最终提出基于泊松分布的城市轨道交通正线列车故障发生概率预测模型。结果表明:列车编组数的增加会提高列车故障发生概率;累计走行公里的增加会使列车故障发生概率先降低后回升,在列车投入运营后的第4个12万km阶段达到最低值,在第7个12万km阶段超过初始值。
城市轨道交通列车故障是造成正线运营延误甚至中断的主要原因之
在理论上,一起列车故障就是一次贝努利试验的结果,每一列车在开行某个班次时,它如果顺利完成即成功,如果发生列车故障即失败。而城市轨道交通列车每日发生故障一般属于小概率事件,这使得出现一次失败所需的贝努利试验次数十分巨大。针对这一特点,很多学者往往采用离散型分布中的泊松分
考虑到在停车场等非正线上发生的列车故障不影响列车正常运营,本文选择城市轨道交通列车在正线上发生故障的概率作为重点研究对象(以下提及的列车故障发生概率若无特别说明,均指城市轨道交通列车在正线上发生故障的概率)。首先定性分析列车故障发生概率的主要影响因素,之后基于实际数据生成包含这些影响因素的离散型数据集,在此基础上从泊松分布、负二项分布、零膨胀泊松分布、零膨胀负二项分布中选择合适的分布及可能的函数形式构建备选模型并标定,最后通过模型比选确定最终的城市轨道交通正线列车故障发生概率预测模型。
从产品构成的角度来看,城市轨道交通列车由多节车厢串联而成,任一车厢的部件出现损坏时,均视作该列车的一起故障,而编组越多的列车拥有的部件会越多,出现故障的可能性也就越高。因此城市轨道交通列车的编组数应对其故障发生概率产生显著影响,且列车故障发生概率会因列车编组数增加而变高。
从产品使用的角度来看,城市轨道交通列车具有系统集成度高、设备种类多、设备工况复杂等特点,刚投入使用的列车需要经历一段部件磨合期才能达到最佳使用状
需要注意的是,城市轨道交通列车在整个寿命周期中会经历各种类型的维修,目前计划修是国内外城市采用的主流列车维修方
考虑到城市轨道交通列车每日发生故障一般属于小概率事件,需要在一定的走行公里范围内对其进行观察。根据《地铁设计规范
综上所述,最终通过定性分析得到的列车故障发生概率的主要影响因素为列车编组数、累计走行公里、架修或大修经历。下面将基于实际数据生成包含上述影响因素的离散型数据集。
本文数据由某城市轨道交通公司提供,具体包括全网各线列车的首次正式投入使用日期、2011至2019年间架修和大修记录、2017至2019年间故障记录(含故障发生的时间、地点及原因)、编组情况以及全网各线2011至2019每年总列车运营里程。
经过初步数据整理,共有910列对象列车、600起在正线上发生的列车故障记录。首先,剔除了其中投入运营时间不明(35列)、列车编组有变更(2列)、架修和大修记录缺失(76列)的对象列车。其次,考虑到因偶然因素造成的列车故障随机性太强,为了避免各类偶然因素对主要影响因素的干扰,剔除了因异物卡阻(30起)、乘客冲门(15起)、其余偶然因素(56起)造成的列车故障记录。最终保留了797列对象列车、499起列车故障记录作为后续研究的基础数据。
基础数据未直接给出列车的累计走行公里,需要通过列车的累计运营时间乘以日均走行公里进行推算。
列车的累计运营时间可根据列车的首次正式投入使用日期、架修和大修记录确定。首先用列车首次正式投入使用日期作为累计运营时间的起始日期,之后查询列车是否有过架修或大修经历,如果有,则累计运营时间的起始日期需更换为列车完成最近一次架修或大修后正式投入使用的日期,以重置其累计运营时间。至于是否应对架修后的列车和大修后的列车进行区分,考虑到架修和大修的本质都是对列车部件进行更新,只是大修更全面彻底,所以如果造成列车故障的部件均在架修和大修时涉及检修和更换,则无需对两者进行区分。为此,对列车故障成因进行统计,如

图1 列车故障成因统计
Fig.1 Statistics of train fault cause
日均走行公里通常由年总列车运营里程除以年总列车数再除以365d得到,但其忽略了该年新上线列车实际开行天数不到365d的问题,从而导致日均走行公里偏小。本文在计算日均走行公里时对此做了改进,即
(1) |
式中:为列车在第年日均走行公里,km∙
在实现列车累计走行公里的可推算后,以12万km为间隔将其依次划分出多个累计走行公里阶段并确定每个阶段的起止日期。由于列车故障记录的时间范围为2017至2019年,因此只能将起止日期均在2017至2019年内的累计走行公里阶段作为统计对象,对列车在该阶段发生故障的次数进行计数,具体步骤如

图2 单列车在各累计走行公里阶段故障发生次数的数据生成
Fig.2 Data generation of fault occurrence number for single train in each cumulative running kilometer period
在基础数据的797列对象列车中,有130列因正式投入运营时间较晚未在2017至2019年完成第1个12万km阶段,未被计入数据集。在剩余的对象列车中,分别有271、325、71列在2017至2019年完成了1、2、3个12万km阶段,在数据集中相应地被计入1、2、3次。在基础数据的499起列车故障记录中,有254起的发生日期未在其关联的对象列车于2017至2019年完成任一12万km阶段的起止日期范围内,未被计入数据集。因此,最终生成的数据集中共有1134列对象列车(重复的对象列车因所处累计走行公里阶段不同而具有独立性,故视作一列新的对象列车),245起列车故障记录。各累计走行公里阶段的统计情况如
从

图3 列车故障发生频率随累计走行公里阶段变化的趋势
Fig.3 Trend of train fault frequency with cumulative running kilometer period
为了从泊松分布、负二项分布、零膨胀泊松分布、零膨胀负二项分布中选择合适的分布构建模型,需观测离散型数据集内不同列车故障发生次数的出现频数,并计算列车故障发生次数总体均值及方差,结果如

图4 列车故障发生次数的观测频数
Fig.4 Observation frequencies for different train fault occurrence numbers
泊松分布在离散数据分析中相当常用。假定随机变量服从泊松分布,则其概率函数如下:
(2) |
式中:为泊松参数,一旦确定即可计算随机变量取不同值的概率;为列车走行一个12万km期间在正线上发生故障的次数。
只要建立泊松参数与列车编组数、列车当前所处累计走行公里阶段的序号之间的回归方程,即可实现考虑各主要影响因素情况下列车故障发生概率的预测。泊松参数与自变量之间的回归通常采用对数线性模
(3) |
式中:为列车当前所处累计走行公里阶段的序号,取值为1,2,…,对应第1,2,…个12万km阶段,在架修或大修后需重新累计;为列车编组数,根据国内常用的编组形式,取值一般为4,5,6,7,8;为待估系数。
零膨胀泊松分布是在泊松分布的基础上考虑数据集存在零过多现象而提出的分布。假定随机变量服从零膨胀泊松分布,则其概率函数如下:
(4) |
式中:为零膨胀参数,表示取值为0的非泊松数据所占的比例。当时,数据集存在零过多现象,若,则
泊松参数与零膨胀参数应彼此独立并均与主要影响因素有所关联,为此需对泊松参数、零膨胀泊松参数与列车编组数、列车当前所处累计走行公里阶段的序号进行两两组合来建立回归方程,共有2种可能的组合方案。泊松参数与自变量之间的回归依旧采用对数线性模型,零膨胀参数与自变量之间的回归通常采用logistic回归模
(5) |
(6) |
式中:为待估系数。
三个备选模型中待估系数的标定基于极大似然估计,通过Gauss-Newton迭代法获得数值
各备选模型的估计结果如
针对模型一和模型二,从两方面定量比较两者的优劣。首先,比较两个模型所预测的不同累计走行公里阶段总列车故障记录数与实际值的平均差异程度,计算方法见
(7) |
式中:为第个阶段实际的总列车故障记录数;为第个阶段预测的总列车故障记录数;为阶段个数。
其次,绘制ROC曲线比较两个模型的泛化能力,ROC曲线下包含的面积越大,模型泛化性能越

图5 各备选模型的ROC曲线
Fig.5 ROC curves for each alternative model
从比较结果来看,模型一无论是预测效果还是泛化能力均优于模型二。因此,最终的城市轨道交通正线列车故障发生概率预测模型如下:
(8) |
确定泊松参数后,便可通过得到列车故障发生概率。不同列车编组数、累计走行公里阶段组合下的列车故障发生概率如
以城市轨道交通列车为研究主体,综合考虑多方因素,提出了基于泊松分布的城市轨道交通正线列车故障发生概率预测模型。主要研究工作总结如下:
(1)通过定性分析得到列车编组数、累计走行公里、架修或大修经历为列车故障发生概率的主要影响因素。当列车经历架修或大修后,需重新累计其走行公里。
(2)探究了各影响因素对列车故障发生概率的影响规律:列车编组数的增加会提高列车故障发生概率;累计走行公里的增加会使列车故障发生概率先降低后回升。
(3)以每12万km为观测范围生成单列车在一定走行公里内故障发生次数的离散数据集,基于数据呈现的分布特征选择泊松分布、零膨胀泊松分布构建了3个备选模型。之后根据显著性检验、预测值与实际值的平均差异程度以及ROC曲线进行模型比选,结果显示基于泊松分布的模型最优。由此提出了基于泊松分布的城市轨道交通正线列车故障发生概率预测模型。
(4)根据模型结果可推断:在列车编组数固定的情况下,列车故障发生概率会在列车投入运营后的第4个12万km阶段达到最低值,在第7个12万km阶段超过初始值。
参考文献
DING Xiaobing, YANG Xuechen, HU Hua, et al. The safety management of urban rail transit based on operation fault log[J]. Safety Science, 2017, 94: 10. [百度学术]
徐田坤. 城市轨道交通网络运营安全风险评估理论与方法研究[D]. 北京: 北京交通大学, 2012. [百度学术]
XU Tiankun. Study on risk assessment theory and methods on urban rail transit network operation[D]. Beijing: Beijing Jiaotong University, 2012. [百度学术]
中华人民共和国住房和城乡建设部. 地铁设计规范:GB 50157-2013[S]. 北京: 中国建筑工业出版社, 2014. [百度学术]
Ministry of Housing and Urban-Rural Development of the People’s Republic of China. Code for design of metro:GB 50157-2013 [S]. Beijing: China Architecture & Building Press, 2014. [百度学术]
LORD D, WASHINGTON S P, IVAN J N. Poisson, Poisson-gamma and zero-inflated regression models of motor vehicle crashes: balancing statistical fit and theory[J]. Accident Analysis & Prevention, 2005, 37: 35. [百度学术]
黄合来, 许鹏鹏, 翟晓琪. 不同区划方案对宏观交通事故建模的影响[J]. 同济大学学报(自然科学版), 2016, 44(3): 377. [百度学术]
HUANG Helai, XU Pengpeng, ZHAI Xiaoqi. Influence of zonal configurations on macro-level traffic safety modeling[J]. Journal of Tongji University (Natural Science), 2016, 44(3): 377. [百度学术]
NAZNIN F, CURRIE G, LOGAN D, et al. Application of a random effects negative binomial model to examine tram-involved crash frequency on route sections in Melbourne, Australia[J]. Accident Analysis & Prevention, 2016, 92: 15. [百度学术]
DONG C J, RICHARDS S H, CLARKE D B, et al. Examining signalized intersection crash frequency using multivariate zero-inflated Poisson regression[J]. Safety Science, 2014, 70: 63. [百度学术]
陈颖雪, 石志峰, 刘志钢. 基于零膨胀回归模型的城市轨道交通触网故障频次研究[J]. 数学的实践与认识, 2019, 49(9): 172. [百度学术]
CHEN Yingxue, SHI Zhifeng, LIU Zhigang. Research on the contact line system fault frequency of urban rail transit based on zero-expansion regression model[J]. Journal of Mathematics in Practice and Theory, 2019, 49(9): 172. [百度学术]
孟祥海, 覃薇, 霍晓艳. 基于统计与假设检验的高速公路交通事故数据分布特性[J]. 交通运输工程学报, 2018, 18(1): 139. [百度学术]
MENG Xianghai, QIN Wei, HUO Xiaoyan. Distribution characteristics of traffic crash data of freeway based on statistics and hypothesis test[J]. Journal of Traffic and Transportation Engineering, 2018, 18(1): 139. [百度学术]
邵伟中, 宋博, 刘纯洁. 城市轨道交通车辆运行与维修[M]. 北京: 中国建筑工业出版社, 2019. [百度学术]
SHAO Weizhong, SONG Bo, LIU Chunjie. Operation and maintenance of urban rail transit vehicles[M]. Beijing: China Architecture & Building Press, 2019. [百度学术]
程祖国, 王居宽, 陈鞍龙, 等. 城市轨道交通车辆部件故障与均衡修修程周期[J]. 城市轨道交通研究, 2006, 9(1): 46. [百度学术]
CHENG Zuguo, WANG Jukuan, CHEN Anlong, et al. Vehicle component failures and balanced-maintenance period[J]. Urban Mass Transit, 2006, 9(1): 46. [百度学术]
许帅帅. 地铁车辆故障信息统计分析及检修策略优化[D]. 成都: 西南交通大学, 2013. [百度学术]
XU Shuaishuai. Metro vehicle fault information statistical analysis and maintenance strategy optimization[D]. Chengdu: Southwest Jiaotong University, 2013. [百度学术]
陆万忠. 城市轨道交通车辆检修制度研究[D] . 北京: 北京交通大学, 2007. [百度学术]
LU Wanzhong. Research on maintenance system of urban transit vehicles[D]. Beijing: Beijing Jiaotong University, 2007. [百度学术]
皇甫小燕, 程祖国, 王建兵. 上海轨道交通列车车门故障时域特征分析[J]. 城市轨道交通研究, 2012, 15(7): 30. [百度学术]
HUANGFU Xiaoyan, CHENG Zuguo, WANG Jianbing. Time-domain analysis on Shanghai metro train door failure[J]. Urban Mass Transit, 2012, 15(7): 30. [百度学术]
顾保南, 叶霞飞. 城市轨道交通工程[M]. 武汉: 华中科技大学出版社, 2007. [百度学术]
GU Baonan, YE Xiafei. Urban rail transit engineering[M]. Wuhan: Huazhong University of Science & Technology Press, 2007. [百度学术]