摘要
基于自然驾驶实验,获取“人‒车‒环境”多维驾驶行为数据,经过数据清洗与筛选构建危险驾驶行为标准数据库。采用显著性分析对指标进行筛选,并构建八维度的危险驾驶行为预测指标集。以神经网络为第一层,以基于注意力机制的长短期记忆(LSTM)网络为第二层,建立危险驾驶行为预测双层时序模型。结果表明:该模型能有效提升预测准确率(10%);分层结构和注意力机制对预测准确率有较好的提升作用,分别为5%和3%。
危险驾驶行为表征及演化全过程一直是道路交通安全领域的研究热
最早的危险驾驶行为数据采集主要依靠主观问卷调研方法,问询驾驶人在发生危险驾驶行为时的驾驶操作、周边环境及心理情况等,通过提取关联性指标构建危险驾驶行为预测模
在危险驾驶行为预测指标方面,主要采用单一非时序的指标对危险驾驶行为进行表征与预测。Yoshitake
现阶段用于时序预测的模型可大致分为3类,即参数模型、非参数模型及半参数模型。参数模型中使用较多的是整合移动平均自回归模型(ARIMA)及其衍生模
综上,采用自然驾驶数据,结合数据划分及视频检验方法,构建危险驾驶行为预测指标集。通过显著性分析对现有指标进行筛选和排序,设计分层数据输入模型结构,构建危险驾驶行为研究的标准指标集。构建以LSTM网络模型与注意力机制为框架的预测模型,测试不同输入结构以及时间窗下预测准确率及误差,提出用于危险驾驶行为预测的参数及结构化建议。
基于注意力机制及分层网络的危险驾驶行为预测方法包括2个模块:数据处理模块以及危险驾驶行为预测模块。如

图 1 模型整体结构
Fig. 1 System framework of the proposed model
自然驾驶数据通常为时序数据,采集的自然驾驶数据包括车辆轨迹数据、驾驶员属性、车辆驾驶数据、环境及周边车辆行驶数据,数据采集频率一般为10 Hz。
原始自然驾驶数据存在数据缺失、数据异常、噪声以及离群值较多等问题。在数据结构调整之前,需要对已有数据进行缺失值插补、异常值识别以及数据平滑处理。由于自然驾驶数据采集频率较高,因此采用均值法处理缺失值。假设自然驾驶指标,(驾驶行为数据,周边车辆数据等)存在数据缺失值,采用下式计算:
(1) |
式中:和分别表示的前数据和后数据;。
由于设备精度的限制,因此数据序列中可能存在显著偏离的离群异常值。为避免异常值对后续分析造成干扰,需要对其进行识别并修复。
目前主流的异常值识别方法包括拉依达准则()、肖维勒(Chauvenet)准则、迪克逊(Dixon)准则、格拉布斯(Grubbs)准则等。格拉布斯准则是在未知总体标准偏差的情况下,对正态样本或接近正态样本异常值进行判别的一种方法。由于格拉布斯准则理论严密、概率意义明
式中:是检验点;分别是检验点向前向后共取10个点作为检验样本的均值以及标准差。当N=10时,在5%置信概率下值取2.234,即当满足时检验点为异常值。
出于改善样本质量的目的,考虑到样本采集频率足够小、理论上邻近数据点间数值变化缓慢,因此采用移动平均法对整体数据进行平滑处理。最后,采用Matlab软件对数据进行清洗,获得自然驾驶数据库。
基于清洗后的自然驾驶数据,筛选危险驾驶行为状态。在危险场景指标筛选过程中,综合考虑了横向危险场景以及纵向危险场景。针对横向危险场景,采用横向加速度等指标进行危险判定;针对纵向危险场景,采用tTTC以及纵向加速度等指标进行判定。进一步选取危险场景替代指标,基于已有研究结论采用场景类判断指标以及操作类判断指标判别危险驾驶行为状态。场景类判断指标包括tTTC及超速。在判断过程中,tTTC<1.0 s或速度>120 km·
已有研

图 2 模型输入结构
Fig. 2 Input framework of the proposed model
预测时间窗指驾驶人产生意图到发生操作的时间窗宽度。采用固定时间窗宽度方法,即筛选执行行为前固定时间段内驾驶行为表征指标进行模型构
LSTM网络模型被用于危险驾驶行为时序特征提取,并通过模型训练最终对驾驶行为状态进行预测。LSTM网络结构包含1个存储单元和3个门(输入门、输出门和遗忘门)。模型内部状态主要受遗忘门和输入门的综合影响,遗忘门确定当前单元中需要保存的信息,输入门确定需要保留多少外部输入的信息,最后通过输出门将两者综合信息进行混合并输出到下一个状态。

图 3 LSTM神经元结构
Fig. 3 LSTM neuron structure
遗忘门: | (2) |
输入门: | (3) |
单元状态: | (4) |
(5) |
输出门: | (6) |
(7) |
式中:为当前时刻的输入;分别为当前状态下遗忘门、输入门及输出门状态;为激活参数;为权重参数;为偏置参数;和为单元状态;*表示矩阵元素的乘积。3个门都以ReLU函数作为激活函数以对单元状态进行归一化。
通过探索数据内部联系,注意力机制可以自动对系统参数进行优化,并改善模型的准确

图 4 基于注意力机制的LSTM网络结构
Fig. 4 Structure of LSTM network based on attention mechanism
对LSTM网络模型在每个时间点上的预测值权重进行计算,通过加权求和方式对预测值进行累加,并替换原预测值。权重总和计算式如下所示:
(8) |
(9) |
式中:为不同指标对该参数的贡献值。计算式如下所示:
(10) |
式中:、、为模型自学习参量。
注意力机制使用及其代码参见文献[
采用模型准确率评价模型的好坏,并引入平均绝对误差(αMAE)作为参考。平均绝对误差定义如下所示:
(11) |
式中:表示模型预测结果中危险驾驶行为状态;表示实际状态。
数据来源于上海自然驾驶实验研究(SH‒NDS)。实验由同济大学、通用汽车有限公司以及弗吉尼亚理工运输研究所共同开展,共招募60名司机,通过驾驶装载了SHRP2 NextGen数据采集系统的车辆进行实验。每个车辆上都装备了可实时采集车辆加速度、速度、转向信息及通信数据的自然驾驶数据采集盒、GPS定位传感器、高精度雷达以及4台观测驾驶人与前后路况的摄像头。通过这些设备,可以采集到包括驾驶人特性、车辆运行数据、道路环境及驾驶事件等多变量的时序数据。试验数据采集频率为10 Hz,通过实验共获得了10 500例出行数据(每个驾驶人出行1次记为1例)。自然驾驶数据包括驾驶员的所有日常出行,必然产生与研究内容不相关的出行记录,如加油、洗车、检修、短距离出行等,由于行车时间较短,因此对应的CSV文件或视频记录大小有限。驾驶过程必然对应较为可观的行车时间,因此将小于1 000 Kb的CSV文件删除,最终获得有效数据8 000例。

图5 摄像头视角
Fig. 5 Camera views
基于以上出行数据,通过缺失值插补、异常值识别与删除以及数据平滑处理,最终获得危险驾驶行为基础数据库。该数据库包含速度、加速度等操作类指标,同时也包含前后车距离等场景类指标。通过计算,获得驾驶人出行过程中的tTTC,以tTTC构建危险驾驶行为的自变量并将其作为模型的输入之一。本研究中,危险驾驶行为状态的判断可以采用场景类判断指标以及操作类判断指标。场景类判断指标包括tTTC及超速。在判断过程中,tTTC<1.0 s或速度超过120 km·
通过危险驾驶行为判定规则,基于tTTC异常、超速及横纵向加速度数据设置标签。根据前文定义,当满足危险驾驶倾向及危险场景参数时,驾驶行为标签为“危险=1”,其他情况下标签为“安全=0”。采用Matlab软件根据该逻辑对数据进行筛选,最终从8 000份出行数据中采集到危险驾驶行为发生点854个,包括该点以及该点之前3.0 s内所有采集到的数据。为了获得驾驶人属性及外部环境数据,同时提升危险驾驶行为数据标签准确性,通过视频记录对854个点进行验证,验证标准如
为了提升模型预测准确度,降低误差,对现有指标与危险驾驶行为状态之间的显著性进行验证。通过显著性分析,将显著性指标作为模型最终输入。有8个变量被运用到危险驾驶行为模型构建中,分别是性别、疲劳驾驶、天气、平曲线、纵断面、速度、横向加速度以及tTTC。各指标显著性及指标描述性统计如
采用TensorFlow框
第2层的输入变量仍为8个,通过变量拟合输出的二分类结果即该时刻下驾驶行为状态(危险=1,安 全=0)。为了验证模型的准确性,采用7∶3的训练比进行模型测试。模型采用成本最小化函数(Adam)进行优化,将ReLU作为激活函数,为了防止过拟合,设定0.5为模型退出阈值。采用平均绝对误差(αMAE)验证模型误差。为了验证所提模型的适用性,对比注意力机制的作用,分别对NS与FS中的LSTM以及Attention-LSTM网络模型的准确率及误差进行计算。模型预测结果准确率及误差如
由
由
为了验证所提出的模型的有效性,将所提出的模型与现有常用的二分类模型进行对

图 6 模型预测结果
Fig. 6 Prediction results of models
提出了一种基于注意力机制及分层网络的危险驾驶行为预测方法。通过优化模型结构对驾驶全时全要素信息进行保存,同时引入注意力机制,然后通过网络自学习权重将LSTM网络所有时刻的输出重新排序,并对输入信息权重进行优化。对比不同宽度时间窗下模型预测准确率及误差,给出了危险驾驶行为预测的参考时间窗宽度。结果表明,所提出模型能有效提升危险驾驶行为时序预测准确率并降低误差,在时间窗宽度为2.0 s时模型表现最好。
作者贡献声明
徐文翔:数据分析,基础模型构建,初稿撰写。
王俊骅:提出论点,构建论文框架,初稿修改,模型优化。
傅 挺:论文修改,模型优化,数据分析。
参考文献
ROSEBOROUGH J E W, WICKENS C M, WIESENTHAL D L. Retaliatory aggressive driving: a justice perspective [J]. Accident Analysis and Prevention, 2021, 162 : 106393. [百度学术]
TAO D, ZHANG R, QU X. The role of personality traits and driving experience in self-reported risky driving behaviors and accident risk among Chinese drivers [J]. Accident Analysis and Prevention, 2017, 99: 228. [百度学术]
MA Y, TANG K, CHEN S, et al. On-line aggressive driving identification based on in-vehicle kinematic parameters under naturalistic driving conditions [J]. Transportation Research,Part C: Emerging Technologies, 2020,114:554. [百度学术]
EVANS L, WASIELEWSKI P. Do accident-involved drivers exhibit riskier everyday driving behavior?[J]. Accident Analysis and Prevention, 1982,14(1): 57. [百度学术]
DOGAN I. Design of a GPS data logger device with street-level map interface [J]. Advances Engineering Software, 2010, 416: 859. [百度学术]
ORFILA O, SAINT PIERRE G, MESSIAS M. An android based ecodriving assistance system to improve safety and efficiency of internal combustion engine passenger cars [J]. Transportation Research, Part C: Emerging Technologies, 2015, 58: 772. [百度学术]
ZHAO X H, XU W X, MA J M, et al. Effects of connected vehicle-based variable speed limit under different foggy conditions based on simulated driving[J]. Accident Analysis and Prevention, 2019,128:206. [百度学术]
BAGDADI O, VARHELYI A. Development of a method for detecting jerks in safety critical events [J]. Accident Analysis and Prevention, 2013, 50: 83. [百度学术]
YOSHITAKE H, SHINO M. Risk assessment based on driving behavior for preventing collisions [J]. IATSS Research, 2018, 42: 240. [百度学术]
LEE S, OLSEN E, WIERWILLE W. A comprehensive examination of naturalistic lane-changes [R]. Washington DC:National Highway Traffic Safety Administration, 2004. [百度学术]
WAHLBERG A. The relation of acceleration force to traffic accident frequency: a pilot study [J]. Transportation Research,Part F: Traffic Psychology and Behaviour, 2000, 3: 29. [百度学术]
ZHAO X, XU W, MA J, et al. An analysis of the relationship between driver characteristics and driving safety using structural equation models [J]. Transportation Research, Part F: Traffic Psychology and Behaviour, 2019, 62: 529. [百度学术]
KARLAFEIS M, VLAHOGIANNI E I. Memory properties and fractional integration in transportation time-series [J]. Transportation Research, Part C: Emerging Technologies, 2009, 17: 444. [百度学术]
ZHONG M, LINGRAS P, SHARMA S. Estimation of missing traffic counts using factor, genetic, neural, and regression techniques [J]. Transportation Research, Part C: Emerging Technologies, 2004, 12: 139. [百度学术]
HONG W, DONG Y, ZHENG F, et al. Hybrid evolutionary algorithms in a SVR traffic flow forecasting model [J]. Applied Mathematics and Computation, 2011, 217: 6733. [百度学术]
FENG X, LING X, ZHENG H, et al. Adaptive multi-kernel SVM with spatial-temporal correlation for short-term traffic flow prediction [J]. IEEE Transactions on Intelligent Transportation Systems, 2019, 20(6): 2001. [百度学术]
HHBTEMICHAEL F G, MECIT C. Short-term traffic flow rate forecasting based on identifying similar traffic patterns [J]. Transportation Research, Part C: Emerging Technologies, 2016, 66: 61. [百度学术]
DIMITRIOU L, TSEKERIS T, STATHOPOULOS A. Adaptive hybrid fuzzy rule-Based system approach for modeling and predicting urban traffic flow [J]. Transportation Research,Part C: Emerging Technologies, 2008, 16: 554. [百度学术]
TAN M C, WONG S C. An aggregation approach to short-term traffic flow prediction [J]. IEEE Transactions on Intelligent Transportation Systems, 2009, 10(1): 60. [百度学术]
JAIN A, SINGH A, KOPPULA H S, et al. Recurrent neural networks for driver activity anticipation via sensory-fusion architecture [C]//2016 IEEE International Conference on Robotics and Automation (ICRA). Stockholm: IEEE, 2016: 1-8. [百度学术]
季学武, 费聪, 何祥坤, 等. 基于 LSTM 网络的驾驶意图识别及车辆轨迹预测[J]. 中国公路学报, 2019, 32(6): 34. [百度学术]
JI Xuewu, FEI Cong, HE Xiangkun, et al. Driving intention identification and vehicle trajectory prediction based on LSTM network[J]. China Journal of Highways, 2019, 32(6): 34. [百度学术]
ZHANG Z, HE Q, GAO J, et al. A deep learning approach for detecting traffic accidents from social media data [J]. Transportation Research, Part C: Emerging Technologies, 2018, 86: 580. [百度学术]
YANG M, WANG X, QUDDUS M. Examining lane change gap acceptance, duration and impact using naturalistic driving data[J].Transportation Research, Part C: Emerging Technologies, 2019,104: 317. [百度学术]
VELICER W F, JACKSON D N. Component analysis versus common factor analysis: some issues in selecting an appropriate procedure[J]. Multivariate Behavioral Research, 1990, 25(1): 1. [百度学术]
DOSHI A, TRIVEDI M. A comparative exploration of eye gaze and head motion cues for lane change intent prediction[C]// 2008 IEEE Intelligent Vehicles Symposium. Eindhoven: IEEE, 2008: 49-54. [百度学术]
JAIN A, KOPPULA H, RAGHAVAN B, et al. Car that knows before you do: anticipating maneuvers via learning temporal driving models[C]// International Conference on Computer Vision (ICCV). Santiago: IEEE, 2015: 3182-3190. [百度学术]
AOUDE G, DESARAJU V, STEPHENS L H, et al. Behavior classification algorithms at intersections and validation using naturalistic [C]//IEEE Intelligent Vehicles Symposium. Baden: IEEE, 2011: 601-606. [百度学术]
SHERSTINSKY A. Fundamentals of recurrent neural network (RNN) and long short-term memory (LSTM) network [J]. Physica D: Nonlinear Phenomena, 2020, 404:132306. [百度学术]
BAHDANAU D, CHO K, BENGIO Y. Neural machine translation by jointly learning to align and translate[C]// International Conference on Learning Representations. Santiago: IEEE, 2015: 1-15. [百度学术]
CATTANEO M D, MA X, MASATLIOGLU Y, et al. A random attention model [J]. Journal of Political Economy, 2020, 128: 2796. [百度学术]
SMILKOV D, THORAT N, ASSOGBA Y, et al. TensorFlow.js: machine learning for the web and beyond[C]// Proceedings of the 2nd SysML Conference. Palo Alto: [s.n.], 2019: 1-13. [百度学术]
KOGANEI R, SASAKI K, WATANABE N. Characteristic identification of oil dampers for railway vehicles using neural networks[J]. WIT Transactions on the Built Environment, 2008, 103: 725. [百度学术]
HONGLE R, SONG Y, LIU J, et al. A deep learning approach to the prediction of short-term traffic accident risk [C]//2018 IEEE International Conference on Intelligent Transportation Systems (ITSC). Maui: IEEE, 2017 : 1-9. [百度学术]