摘要
基于纯电动汽车的高频运行数据选取了15项与驾驶安全有关的特征参数;通过对各特征参数的统计分析,提出了多参数组合阈值边界线进行危险驾驶行为识别,然后对比分析了两种聚类算法和4种降维方法的效果,采用t分布随机邻域嵌入(t‑SNE)和高斯混合模型(GMM)组合算法建立了驾驶风格分类模型,将驾驶风格分为3种类型。在此基础上,研究了不同驾驶风格对应的车辆运行特性。该分类模型能够有效反映驾驶员的驾驶习惯,为车队管理和道路安全提供可靠的评估依据。
根据国家统计局2013—2020年发布的《中国统计年鉴》,我国道路安全事故发生情况可以看出近几年的车祸发生数量呈增长趋势,这表明交通安全问题日渐严重。驾驶员作为交通行为的首要执行者、车辆的操控者,是导致交通事故的主要原因。因此,驾驶员在行驶过程中驾驶行为的安全性具有重大的研究价值。
国内外学者多采用无监督学习模型进行驾驶风格分类,通过对分类结果的分析确定驾驶风格类别。目前研究驾驶风格用的无监督学习主要有基于划分、层次、密度及模型等不同方法的聚类方法。基于划分的无监督学习聚类方法主要有K均值(K-means)和模糊C均值(FCM)。亓航
已有研究采用的聚类算法多是针对低维数据集设计的,处理高维数据集通常会面临“维灾难效应”,会出现基于距离的度量函数失效、聚类中心难以确定及计算效率低等问题。本文采用先降维后聚类的研究思路,在对比不同降维及聚类方法的基础上,提出利用t-SNE和GMM组合算法建立基于驾驶安全的驾驶风格分类模型,用于对不同驾驶风格进行分类。此外,已有研究关于异常驾驶行为的判定多采用固定阈值,本文在深入分析与驾驶安全相关的特征参数变化规律基础上,提出多参数组合阈值边界线识别危险驾驶行为的方法。本文的研究可以有效改进分类效果,提高异常驾驶识别精度。研究内容可为运输企业的安全运营提供指导,为道路安全评估提供参考。
基于车辆的OBD接口,通过CAN总线获取车辆实时运行数据,并将采集的数据通过无线网络发送至服务器进行处理,数据采集流程如

图1 车辆监测数据采集流程
Fig.1 Vehicle monitoring data collection process
本文研究数据主要来自于北京、成都、天津、上海四座城市的200辆纯电动汽车4个月的高频运行数据,汽车用途有私家车、网约车、共享汽车。数据样本具有采样频率高、车辆用途多样、驾驶员分布广泛、出行次数频繁等优点,适用于驾驶员的驾驶行为分析。
由于原始数据是按车辆VIN码分类储存的,且采集信号中存在的无效数据字段导致原始数据体量巨大,影响后续研究。因此,本文首先剔除了无效字段信号数据和充电与静置片段数据,形成每车每次独立的运行数据文件。考虑到一次正常行车时长不会过短,且驾驶工况在较短时间内变化不会很大,所以结合车辆的上电状态及车速,剔除一次行车时长小于10min和数据缺失率超过5%的行程事件。处理后的一次行车事件数据如

图2 一次行车事件数据
Fig.2 Data in a driving event
数据采集和传输过程受到干扰可能导致远程数据管理平台接收到的数据存在波动、异常或缺失等问题。为了消除异常数据的影响,在进行数据分析前需要对原始数据进行质量控制。首先对于轻微波动的信号数据采用滑动窗口均值滤波方法进行处理,效果如

图3 滤波前后数据对比
Fig.3 Comparison before and after treatment of filter

图4 异常值处理效果
Fig.4 Treatment of abnormal value
在对原始数据进行质量控制后,参考文献[
注: 为单次行驶事件中数据点;vi为每个采样点的车速;a
对车辆速度与前向加速度参数进行分析得到
(1) |
式中:x表示车辆速度;β1和β2是拟合参数;

图5 前向加速度分位值随速度变化关系
Fig.5 The relationship between acceleration quantile value and velocity
文献[

图6 急加速判断阈值线
Fig.6 The judgment threshold line of rapid acceleration
对车辆速度与制动减速度参数进行分析,各分位值结果如
(2) |
式中:表示车辆速度;β1、β2、β3、β4是拟合参数;

图7 制动减速度分位值随速度变化关系
Fig.7 The relationship between braking deceleration quantile value and velocity
参考急加速阈值线设定,本文同样定义了急减速判断阈值线为第99%分位值,如

图8 急减速判断阈值线
Fig.8 The judgment threshold line of sharp deceleration
在不同的道路环境中限速是不同的,在城市道路中,车辆的限速一般为60km·
对车辆速度与方向盘角速度参数进行分析,各分位值结果见
(3) |

图9 方向盘角速度分位值随速度变化关系
Fig.9 The relationship between steering wheel angular quantile value and velocity
式中:x表示车辆速度;a、b、c是拟合参数;
同理,本文定义了急转向判断阈值线为第99%分位值,阈值线如

图10 急转向判断阈值线
Fig.10 The judgment threshold line of sharp turning
对车辆速度与方向盘转角参数进行对比分析,各分位值结果见
(4) |
式中:x表示方向盘转角;a、b、c是拟合参数;

图11 车速各分位值随方向盘转角变化关系
Fig.11 The relationship between speed quantile value and the steering wheel angle
同理,本文定义了转向安全车速分界线为第99%分位值,转向超速行为通过该分界线进行识别,如

图12 转向超速判断阈值线
Fig.12 The judgment threshold line of overspeed while turning
在聚类算法中K均值聚类算法因原理易懂、收敛速度快的优点得到广泛应用。但K均值聚类算法结果受初始聚类中心影响非常大,而且其要求簇的形状必须是圆形的,若实际样本点是椭圆分布的,其聚类结果可能会出现多个圆形的簇混在一起,聚类效果差。高斯混合模型(GMM)可以弥补K均值聚类算法的不足,GMM未将每个样本点置于明确簇中,而给出了该样本点在各簇中的概率或可能性,因此能够有效避免硬分配,并且簇的形状可以是任意椭圆状,而不仅局限于圆形。
假设数据集服从由K个多元高斯分布组成的GMM,即可分为K类。对于每个样本xi,高斯混合分布的概率密度函数为
(5) |
式中:是混合系数;,为每个高斯成分的均值和方差。为第k个高斯成分的概率密度函数,即xi属于第k类的概率,可表示为
(6) |
使用期望最大化(EM)算法对GMM进行非线性概率函数的优化。首先根据类别数目设定模型参数初值,迭代多次求出参数,即每一个样本属于第k类的概率,由最大后验概率准则可知,后验概率最大的那项类别为该样本所属聚类结
为了避免高维数据集导致的“维灾难效应”,在利用聚类算法进行驾驶风格分类时需要提前对驾驶行为数据集进行降维处理。常见的降维方法有多维尺度分析(MDS)、主成分分析(PCA)、等距特征映射(ISOMAP)和t分布随机邻域嵌入(t-SNE)
(5) |
式中:K表示分类数量;表示第k类的观测值总数;a(i)是观测值与所在第k类其他值的平均距离;b(i)是观测值与其他集群中所有值的平均距离中最小值;表示第k类集群观测值的索引集。
本文基于驾驶风格特征参数数据集比较了不同K取值的轮廓系数,确定最佳聚类K值,由

图13 不同K取值的轮廓系数
Fig.13 Silhouette coefficient with different values of K
将上述降维方法结合K均值聚类算法和GMM两种聚类算法进行聚类效果的对比,结果如
驾驶行为是指驾驶员在某一次驾驶过程具体的操作行为,驾驶风格是指驾驶员在驾驶时所表现的综合行为特征,也是驾驶员养成的基本固定的驾驶习惯。也就是说驾驶行为能够反映驾驶风格,驾驶风格从一定程度上决定驾驶行为。为了揭示3种不同驾驶风格对应的车辆运行特征,本文从监测数据服务器接收的私家车与网约车数据中,提取同一款纯电动车型30名驾驶员一个月的驾驶事件(共2 227次)对应的驾驶数据。运用t-SNE算法对驾驶数据进行降维,采用GMM算法对降维后数据进行驾驶风格分类,聚类效果如

图14 驾驶风格聚类效果
Fig.14 Clustering effect of driving style
根据

图15 危险驾驶行为发生次数分布情况
Fig.15 Distribution of the occurrence times of dangerous driving behavior
为提高驾驶员安全认知,探究驾驶风格划分方法,本文利用纯电动汽车高频运行数据开展研究工作,主要结论如下:
(1)对驾驶行为数据进行统计分析,根据分析结果提出了采用多参数组合阈值边界线进行异常驾驶行为的识别,并得到了不同驾驶行为特征参数的危险驾驶阈值边界线。
(2)选取了15个与驾驶安全有关的驾驶风格特征参数,对多参数降维及聚类算法进行研究,通过轮廓系数对2种聚类算法和4种降维方法的性能进行评价,结果表明t-SNE和GMM组合算法分类效果最好。
(3)以t-SNE和GMM组合算法建立了基于驾驶安全的驾驶风格分类模型,将驾驶风格分为3种类型,不同驾驶风格对应的车辆运行特性分析结果验证了分类算法的有效性。
作者贡献声明
纪少波:论文研究思路提出及语言组织。
张珂:车辆运行特性统计分析。
李伦:驾驶风格分类方法对比。
苏士斌:试验样本方案制定。
何绍清:车辆运行数据采集。
冯远宏:数据接收方法研究。
张强:数据预处理方法研究。
参考文献
亓航, 刘畅, 伍毅平, 等. 基于图谱的驾驶行为特征安全性描述方法研究 [J]. 交通工程, 2019, 19(6): 1. [百度学术]
QI Hang, LIU Chang, WU Yiping, et al. Research on safety description method of driving behavior characteristics based on graph [J]. Traffic Engineering, 2019, 19(6): 1. [百度学术]
徐婷, 张香, 张亚坤, 等. 基于AdaBoost算法的货车驾驶人安全倾向性分类 [J]. 安全与环境学报, 2019, 19(4): 1273. [百度学术]
XU Ting, ZHANG Xiang, ZHANG Yakun, et al. Truck driver safety tendency classification based on adaboost algorithm [J]. Journal of Safety and Environment, 2019, 19(4): 1273. [百度学术]
余荣杰, 龙晓捷, 涂颖菲, 等. 基于低频轨迹数据的分时租赁驾驶人驾驶风格分析 [J]. 同济大学学报(自然科学版), 2019, 47(10): 1463. [百度学术]
YU Rongjie, LONG Xiaojie, TU Yingfei, et al. Driving style analysis of time-sharing rental drivers based on low-frequency trajectory data [J]. Journal of Tongji University (Natural Science Edition), 2019, 47(10): 1463. [百度学术]
SHI Xiupeng, WONG Yiik Diew, LI Michael Zhifeng, et al. A feature learning approach based on XGBoost for driving assessment and risk prediction [J]. Accident Analysis & Prevention, 2019, 129: 170. [百度学术]
牛增良, 李海斌, 王文峰, 等. 基于聚类分析的营运驾驶人危险驾驶行为研究 [J]. 山东交通学院学报, 2014, 22(1): 19. [百度学术]
NIU Zengliang, LI Haibin, WANG Wenfeng, et al. Study on dangerous driving behavior of operating drivers based on cluster analysis [J]. Journal of Shandong Jiaotong University, 2014, 22(1): 19. [百度学术]
文江辉, 杨先敏, 吴超仲. 大数据环境下营运车辆驾驶行为特征分析 [J]. 交通信息与安全, 2018, 36(4): 42. [百度学术]
WEN Jianghui, YANG Xianmin, WU Chaozhong. Analysis on driving behavior characteristics of operating vehicles in big data environment [J]. Traffic Information and Safety, 2018, 36(4): 42. [百度学术]
ZHU Bing, JIANG Yuande, ZHAO Jian, et al. Typical-driving-style-oriented personalized adaptive cruise control design based on human driving data [J]. Transportation Research Part C: Emerging Technologies, 2019, 100: 274. [百度学术]
李立治, 杨建军, 刘双喜, 等. 国内人群的驾驶风格分类及识别方法研究 [J]. 重庆理工大学学报(自然科学), 2019, 33(11): 33. [百度学术]
LI Lizhi, YANG Jianjun, LIU Shuangxi, et al. Study on the classification and recognition of driving style of domestic crowds [J]. Journal of Chongqing University of Technology (Natural Science), 2019, 33(11): 33. [百度学术]
李卓轩, 林凯迪, 郭建华, 等. 基于车联网数据的运输车辆安全评价模型 [J]. 南通大学学报(自然科学版), 2020, 19(1): 26. [百度学术]
LI Zhuoxuan, LIN Kaidi, GUO Jianhua, et al. Transportation vehicle safety rvaluation model based on internet of vehicles data [J]. Journal of Nantong University (Natural Science Edition), 2020, 19(1): 26. [百度学术]
刘通, 付锐, 张名芳, 等. 融合K-means与高斯混合模型的驾驶风格聚类研究 [J]. 中国安全科学学报, 2019, 29(12): 40. [百度学术]
LIU Tong, FU Rui, ZHANG Mingfang, et al. Study on driving style clustering based on k-means and gaussian mixture model [J]. China Safety Science Journal, 2019, 29(12): 40. [百度学术]
张志鸿. 基于OBD数据分析的驾驶行为研究 [D]. 西安:长安大学, 2017. [百度学术]
ZHANG Zhihong. Research on driving behavior based on OBD data analysis [D]. Xi'an : Chang 'an University, 2017. [百度学术]
吴紫恒, 吴仲城, 张俊, 等. 基于模糊C均值和神经网络的驾驶行为评价研究 [J]. 计算机系统应用, 2018, 27(3): 263. [百度学术]
WU Ziheng, WU Zhongcheng, ZHANG Jun, et al. Research on driving behavior evaluation based on fuzzy C-means and neural network [J]. Application of Computer Systems, 2018, 27(3): 263. [百度学术]
李经纬, 赵治国, 沈沛鸿, 等. 驾驶风格K-means聚类与识别方法研究 [J]. 汽车技术, 2018(12): 8. [百度学术]
LI Jingwei, ZHAO Zhiguo, SHEN Peihong, et al. Study on K-means clustering and recognition of driving style [J].Automobile Technology, 2018(12): 8. [百度学术]
王海星, 王翔宇, 王招贤, 等. 基于数据挖掘的危险货物运输风险驾驶行为聚类分析 [J]. 交通运输系统工程与信息, 2020, 20(1): 183. [百度学术]
WANG Haixing, WANG Xiangyu, WANG Zhaoxian, et al. Clustering analysis of dangerous goods transportation risk driving behavior based on data mining [J]. Journal of Transportation Systems Engineering and Information, 2020, 20(1): 183. [百度学术]
黄曦. 城市下穿隧道交通安全分析 [D].成都:西南交通大学, 2013. [百度学术]
HUANG Xi. Traffic Safety Analysis of Urban Underpass Tunnel [D]. Chengdu: Southwest Jiaotong University, 2013. [百度学术]
许书权. 基于车辆运行监控系统的驾驶行为安全与节能评价方法研究 [D].西安:长安大学, 2015. [百度学术]
XU Shuquan. Research on driving behavior safety and energy saving evaluation method based on vehicle operation monitoring system [D]. Xi’an: Chang 'an University, 2015. [百度学术]
夏杰. 基于道路运输企业安全生产管理数据的驾驶行为安全与节能评价方法 [D]. 北京:北京交通大学, 2016. [百度学术]
XIA Jie. Evaluation method of driving behavior safety and energy saving based on safety production management data of road transportation enterprises [D]. Beijing:Beijing Jiaotong University, 2016. [百度学术]
彭江琴. 基于GID的车联网保险UBI费率与驾驶行为评分研究 [D]. 南京:南京邮电大学, 2016. [百度学术]
PENG Jiangqin. Research on UBI rate and driving behavior score of Internet of vehicles insurance based on GID [D]. Nanjing: Nanjing University of Posts and Telecommunications, 2016. [百度学术]
任慧君, 许涛, 李响. 利用车载GPS轨迹数据实现公交车驾驶安全性分析 [J]. 武汉大学学报(信息科学版), 2014, 39(6): 739. [百度学术]
REN Huijun, XU Tao, LI Xiang. Analysis of bus driving safety based on on-board GPS trajectory data [J]. Geomatics and Information Science of Wuhan University, 2014, 39(6): 739. [百度学术]
朱爽. 车联网环境下基于UBI的车险费率厘定模式与方法研究 [D]. 北京:北京交通大学, 2015. [百度学术]
ZHU Shuang. Research on the model and method of car insurance rate determination based on ubi in the environment of internet of vehicles [D]. Beijing:Beijing Jiaotong University, 2015. [百度学术]
李福林. 疲劳驾驶的危害及预防 [J]. 产业与科技论坛, 2013, 12(6): 127. [百度学术]
LI Fulin. Harm and prevention of fatigue driving [J]. Forum of Industry and Science & Technology, 2013, 12(6): 127. [百度学术]
BESTEL Robert, DAUS Andreas W., Thielemann Christiane . A novel automated spike sorting algorithm with adaptable feature extraction [J]. Journal of Neuroscience Methods, 2012, 211(1): 168. [百度学术]
HINNEBURG Alexander, AGGARWAL Charu C., KEIM Daniel A. What is the nearest neighbor in high dimensional spaces? [C]//Proceedings of the 26th International Conference on Very Large Data Bases. San Francisco:Morgan Kaufmann Publishers Inc. 2000: 506-515. [百度学术]