摘要
研究了基于时依等比例风险回归模型的换道时长(LCD)影响因素。利用开源HighD数据集,提取了560条完整的换道(LC)轨迹,对整体换道时长分布进行了非参数估计;引入时依等比例风险回归模型,对当前车辆换道时长的影响因素进行分析。结果表明:大部分驾驶员在3~8 s内完成换道行为;共有6个变量显著影响换道时长,其中最为关键的为当前车辆自身车速,同时当前车道的前车与目标车道的后车对换道时长的影响也非常显著。
换道行为是指车辆(当前车辆)在行驶过程中由当前车道换至目标车道的行为,不仅涉及与前方车辆的交互影响,还受到目标车道前后车的影响。在现实交通场景中,由换道行为导致的交通事故居高不下,探索车辆换道行为的影响机理和决策机制迫在眉
对于换道时长的研究主要集中于换道时长分布以及换道时长影响因素。研究表明,换道时长普遍在1~16 s内,换道时长和时间段、道路类型、车流密度、车辆类型、换道方向、驾驶风格以及当前车辆与周围车辆的交互影响有关。符锌砂
生存分析是对生存时间的分布特征进行描述,并对影响生存时间的主要因素进行分析的一种统计方法。将生存分析应用到换道时长分析中,所对应的起始时间为换道的起始时刻,即换道起点时刻;截止时间也可称为失效时间,指换道结束时刻。广义生存时间为换道时长,指换道起点时刻至结束时刻所经历的时长,与之对应的基础公式如下所示:
式中:为车辆在内完成换道的概率;为时间后车辆在内完成换道的概率;为各时刻车辆完成换道的概率;为的分布函数;为车辆换道时长大于的概率;为时间后车辆完成换道的概率;为累积危险率函数。事实上,只要得知其中任意一个函数,就可以推导出其余公式。
生存分析类函数大致可以划分为非参数类模型、半参数类模型以及参数类模
半参数类模型中最为著名的为比例风险回归模
式中:为基本危险率函数;为自变量(影响换道时长的因素);为自变量对应的偏回归系数。
该模型中未对作任何假定,是一个非参数部分的建模,回归系数则是需要根据样本进行估计的参数,是一个参数部分的建模。该模型中仅是以某一时刻的变量信息对因变量进行建模,然而在对因变量进行回归分析的过程中,自变量有可能也随着时间而变化,因此必须考虑自变量的时变特性。Fisher
式中:为生存函数;为随时间变化的自变量。通过极大似然函数对以上参数进行估计,极大似然函数的表达式如下所示:
式中:为二元变量,若车辆在时刻完成换道,其值为1,反之为0;为不同观测时刻的风险集合,。不同于时不变等比例风险回归模型,在每个风险集中,自变量的值均在变化。
HighD数据采集于2017年至2018年间,采集地点为德国高速公路,采集时长为16.5 h,采集路程为45 000 km,总计包含11万辆车的信息。使用先进的计算机视觉算法、神经网络及贝叶斯平滑算法提取出的轨迹数据为每秒40帧,数据集中每条轨迹的坐标误差不到10 cm,这主要得益于该数据集以4K (4 0962 160)格式采集的缘
为了探索更为复杂情形下的换道时长机理,对换道过程中同时包含5辆车的换道轨迹进行提取与分析,如

图1 换道轨迹示意图
Fig.1 Schematic diagram of LC trajectory

图2 某条换道轨迹起始点和截止点示意图(数据采集间隔为0.025 s)
Fig.2 Schematic diagram of starting point and ending point of a LC trajectory(data acquisition interval is 0.025 s)
总计提取560条有效换道轨迹,HighD数据集的每个tracks文件中所包含的有效换道次数以及该数据集换道时长整体分布如

图3 HighD数据集的每个tracks文件中有效换道次数和换道时长整体分布
Fig.3 Effective LC counts for each track file in HighD dataset and overall distribution of LCD

图4 HighD数据集中2条换道轨迹样本
Fig.4 Two examples of LC trajectories in HighD dataset
对换道时长进行回归建模,采用非参数方法KM(Kaplan-Meier)和NA(Nelson-Aalen)方
式中:为在时刻完成换道的车辆数;为在时刻前完成换道的车辆数。

图5 基于整体生存函数和累积危险率函数的换道时长分布(KM和NA方法)
Fig.5 Distribution of LCD based on overall survival function and cumulative hazard function (KM and NA method)
由于HighD数据集的采集间隔为0.025 s,以0.100 s为间隔进行重新集聚(取其平均值)。若每条轨迹换道时长为,则每条轨迹共有观测记录条。每条观测记录均包含当前时间点周边车辆的速度、加速度以及位置信息。

图6 时依等比例风险回归模型数据输入格式
Fig.6 Data input format of time-dependent proportional-hazards regression model
时依等比例风险回归模型模拟结果如
随着、、、、的增加,车辆有更短换道时长的概率将会更低,而随着的增加,换道时长增加的概率则会越高。以当前车辆的速度为例,其在模型中的回归系数为0.117,则。随着当前车辆速度每增加1 m·
采用时依等比例风险回归模型与HighD开源数据集,总计提取了560条完整的换道轨迹(换道时长平均值为5.69 s,中位数为5.55 s),对换道时长进行深入分析。引入非参数方法对该数据集中的整体换道时长分布进行估计,发现大部分车辆在3 s至8 s内完成了换道行为;引入时依等比例风险回归模型对换道时长进行建模,发现共有6个变量显著影响换道时长,对换道时长影响最大的3个显著变量分别为当前车辆自身的车速、当前车道前车加速度、当前车道后车加速度,同时当前车道前车以及目标车道后车对当前车辆换道时长的影响最为显著。显著影响换道时长的变量可作为换道决策的参考依据,甚至可以作为换道轨迹预测算法中的输入变量,同时换道时长的平均值、中位数、中位生存时间等指标均可用以衡量不同换道轨迹集间换道行为的差异性。受限于数据集,仅依据周边车辆的运动信息对当前车辆换道时长的影响因素进行建模,后续研究可以采集驾驶员特征、天气状况、不同道路类型等数据做进一步的探索。
作者贡献声明
李林波:相关概念及方案讨论,论文语言组织。
李 杨:数据处理及分析,实验设计及初稿撰写。
邹亚杰:论文审阅,结果分析及建议。
参考文献
吴兵, 王文璇, 李林波, 等. 多前车影响的智能网联车辆纵向控制模型[J]. 交通运输工程学报, 2020,20(2): 188. [百度学术]
WU Bing, WANG Wenxuan, LI Linbo, et al. Longitudinal control model for connected autonomous vehicles influenced by multiple preceding vehicle [J]. Journal of Traffic and Transportation Engineering, 2020,20(2): 188. [百度学术]
吴兵, 罗雪, 李林波. 考虑驾驶风格的模糊控制跟驰模型[J]. 同济大学学报(自然科学版), 2020,48(5): 694. [百度学术]
WU Bing, LUO Xue, LI Linbo. Fuzzy control car-following model with the consideration of driving style [J]. Journal of Tongji University (Natural Science), 2020,48(5):694. [百度学术]
LI L, LI Y, NI D. Incorporating human factors into LCM using fuzzy TCI model[J]. Transportmetrica B: Transport Dynamics, 2021,9(1): 198. [百度学术]
ZHENG Z. Recent developments and research needs in modeling lane changing[J]. Transportation Research, Part B: Methodological, 2014,60: 16. [百度学术]
LUO Y, XIANG Y, CAO K, et al. A dynamic automated lane change maneuver based on vehicle-to-vehicle communication[J]. Transportation Research, Part C: Emerging Technologies, 2016,62: 87. [百度学术]
YANG D, ZHENG S, WEN C, et al. A dynamic lane-changing trajectory planning model for automated vehicles[J]. Transportation Research, Part C: Emerging Technologies, 2018,95: 228. [百度学术]
LI L, LI Y, NI D, et al. Dynamic trajectory planning for automated lane-changing[C]// Transportation Research Board 100nd Annual Meeting. Washington DC: TRB, 2021:1-21. [百度学术]
XIE G, GAO H, QIAN L, et al. Vehicle trajectory prediction by integrating physics- and maneuver-based approaches using interactive multiple models[J]. IEEE Transactions on Industrial Electronics, 2018,65(7): 5999. [百度学术]
TOLEDO T, ZOHAR D. Modeling duration of lane changes[J]. Transportation Research Record, 2007,1999(1): 71. [百度学术]
VLAHOGIANNI E I. Modeling duration of overtaking in two lane highways[J]. Transportation Research, Part F: Traffic Psychology and Behaviour, 2013,20: 135. [百度学术]
YANG M, WANG X, QUDDUS M. Examining lane change gap acceptance, duration and impact using naturalistic driving data[J]. Transportation Research, Part C: Emerging Technologies, 2019,104: 317. [百度学术]
LI Y, LI L, NI D. Comprehensive survival analytical for lane-changing duration[C]// Transportation Research Board 100nd Annual Meeting. Washington DC: TRB, 2021:1-19. [百度学术]
WANG Q, LI Z, LI L. Investigation of discretionary lane-change characteristics using next generation simulation data sets[J]. Journal of Intelligent Transportation Systems, 2014,18(3): 246. [百度学术]
OLSEN E C B, LEE S E, WIERWILLE W W, et al. Analysis of distribution, frequency, and duration of naturalistic lane changes[J]. Proceedings of Human Factors and Ergonomics Society Annual Meeting, 2002,46(22): 1789. [百度学术]
CAO X, YOUNG W, SARVI M. Exploring duration of lane change execution[C]// Australasian Transport Research Forum. Brisbane:[s.n.], 2013: 1-17. [百度学术]
WU J, ZHANG S, SINGH A K, et al. Hazard-based model of mandatory lane change duration[C]// CICTP 2017. Reston:American Society of Civil Engineers, 2018:805-811. [百度学术]
符锌砂, 胡嘉诚, 何石坚. 基于交通状况及行驶速度的高速公路换道时间研究[J]. 公路交通科技, 2020,37(4): 133. [百度学术]
FU Xinsha, HU Jiacheng, HE Shijian. Study on expressway lane-changing time based on traffic condition and driving speed[J]. Journal of Highway and Transportation Research and Development, 2020, 37(4): 133. [百度学术]
张颖达, 邵春福, 李慧轩, 等. 基于NGSIM轨迹数据的换道行为微观特性分析[J]. 交通信息与安全, 2015,21(6): 19. [百度学术]
ZHANG Yingda, SHAO Chunfu, LI Huixuan,et al. Speed characteristic analysis based on NGSIM trajectory data[J]. Journal of Transport Information and Safety, 2015,21(6): 19. [百度学术]
FISHER L D, LIN D Y. Time-dependent covariates in the Cox proportional-hazards regression model[J]. Annual Review of Public Health, 1999,20(1): 145. [百度学术]
COX D. Regression models and life tables[J]. Journal of the Royal Statistical Society, Series B: Methodological, 1972,34(2): 187. [百度学术]
CHEN C, XIE Y. Modeling the safety impacts of driving hours and rest breaks on truck drivers considering time-dependent covariates[J]. Journal of Safety Research, 2014,51: 57. [百度学术]
WASHINGTON S P, KARLAFTIS M G, MANNERING F L. Statistical and econometric methods for transportation data analysis[M]. Boca Raton: Chapman and Hall/CRC, 2020. [百度学术]
王文成, 杨小宝, 周映雪, 等. 基于Cox风险模型的城市道路交通拥堵持续时间分析[J]. 长安大学学报(自然科学版), 2015,35(Z1): 235. [百度学术]
WANG Wencheng, YANG Xiaobao, ZHOU Yingxue, et al. Cox’s proportional hazard regression model for estimating urban traffic congestion duration[J]. Journal of Chang’ an University (Natural Science Edition), 2015,35(Z1):235. [百度学术]
PUNZO V, BORZACCHIELLO M T, CIUFFO B. On the assessment of vehicle trajectory data accuracy and application to the Next Generation Simulation (NGSIM) program data[J]. Transportation Research, Part C: Emerging Technologies, 2011,19(6): 1243. [百度学术]
KRAJEWSKI R, BOCK J, KLOEKER L, et al. The HighD dataset: a drone dataset of naturalistic vehicle trajectories on German highways for validation of highly automated driving systems[C]// 2018 21st International Conference on Intelligent Transportation Systems (ITSC). [S.l.]:IEEE, 2018:1-8. [百度学术]
KAPLAN E L, MEIER P. Nonparametric estimation from incomplete observations[J]. Journal of the American Statistical Association, 1958,53: 457. [百度学术]