摘要
基于行驶轨迹全球导航卫星系统(GNSS)数据,提出了出租车运动学片段提取规则和方法。根据主成分分析(PCA)及累积贡献率,确定了8个表征运动学片段的关键指标;结合K‒均值聚类算法,挖掘出租车运动特征模式。为了确保运动特征模式关键指标权重的客观合理性,采用考虑指标关联性的CRITIC(criteria importance through intercriteria correlation)法和考虑指标离散程度的熵权法,构建了基于纳什均衡的组合赋权的多准则妥协解排序(VIKOR)评价模型,用于多时空情景下出租车运动特征模式评价和出租车行驶状态研判。结果表明,基于纳什均衡的组合赋权法可以有效融合CIRTIC法与熵权法对评价指标的优势,获得更合理的权重系数。就安全性、效率和舒适性而言,出租车行驶状态在主干路和次干路上优于在支路上。早高峰出租车行驶安全性最佳,平峰和晚高峰相对一般。
在绿色低碳政策的持续推动以及相关基础设施逐渐完善的背景下,以零排放为特点的纯电动汽车成为新能源汽车的发展主流。截至2022年6月底国内新能源汽车保有量为1 001万辆(占汽车总量3.23%),其中纯电动汽车810.4万辆,占新能源汽车总量的80.93%。许多城市在出租车领域加速更新纯电动汽车。早在2016年,太原就将全市8 292辆出租车全部更换为纯电动汽车。2019年中国公布了出租车领域全面电动化时间表,北京、上海、重庆等新能源汽车应用较为成熟的城市率先实现出租车电动化,2030年前将在全国范围内实现出租车电动化。纯电动汽车的运行噪声相对更低,效率更高,但其特有的交通特性也使得交通管理者面临着新的挑战。因此,在出租车电动化逐渐普及的背景下,有必要开展出租车行驶状态特征分析与模式挖掘,明确作为营运车辆的出租车是否需要定制化的驾驶行为优化建议。
目前,针对行驶状态的研究主要是为了提升车辆的运行安全
已有车辆行驶状态判别大多针对私家车提出优化车辆运行安全性的建议,缺乏针对出租车运动特征模式挖掘的综合评价。本文通过出租车运动学片段提取和运动特征指标计算,结合主成分分析(PCA)和K‒均值聚类算法,从安全性、效率和舒适性3个方面确定了8个关键指标,刻画出租车运动学片段,挖掘出租车运动特征模式。为了确保关键指标权重的客观合理性,采用考虑指标关联性的CRITIC(criteria importance through intercriteria correlation)法和考虑指标离散程度的熵权法,构建了基于纳什均衡的组合赋权的多准则妥协解排序(VIKOR)评价模型,综合评价多时空情景下出租车行驶状态。该研究结果可为制定出租车驾驶行为优化建议、提升乘车体验感提供支持。
结合出租车行驶轨迹全球导航卫星系统(GNSS)数据分析,反映出租车实际行驶状态特征或运动学片段的判别条件为:①将车辆速度v在5 km·
步骤1 判断当前是否为怠速阶段(初始为否)。若否则进入步骤2,若是则进入步骤3。
步骤2 判断当前车速是否大于5 km·
步骤3 判断当前车速是否大于5 km·
步骤4 若运动学片段的怠速时间小于10 s,则该怠速阶段不计;若怠速时间大于180 s,则增加一个怠速时间为180 s的怠速阶段记录。
步骤5 判断遍历是否结束。若未结束则开始下一条记录,进入步骤1,若结束则进入步骤6。
步骤6 得到各怠速阶段起点索引及怠速时间。相邻的2个怠速阶段起点为运动学片段的首末数据索引。
为了挖掘出租车行驶状态特征模式,需要选取具有代表性的指标刻画运动学片
构造行驶状态特征指标变量的线性组合,使得线性组合可以最大程度上反映初始变量包含的信息,即提取行驶状态特征指标中相关性较强的变量,利用较少的变量代替众多初始变量并尽量保留原始数据包含的信息,从而达到降维的目
(1) |
式中:zij(i=1,2,…,m;j=1,2,…,n)为第i个运动学片段的第j个特征指标值;m为运动学片段总数;n为行驶状态特征指标总数。
对初始参数矩阵Zm×n进行中心标准化处理,防止因特征指标量纲不同造成数据离散程度变大而导致的主成分分析建模错误。在标准化矩阵的基础上,计算n个特征指标之间的相关系数矩阵
(2) |
式中:raj为第a个特征指标与第j个特征指标之间的相关系数。
计算相关系数矩阵R的n个特征值λj,对所有特征值排序得到λ1≥λ2≥…≥λn,并计算第j个特征指标的贡献率Pj及前s个特征值的累积贡献率Ps:
, | (3) |
为了保证主成分分析降维结果的精度,最终选择的主成分应包含原始特征指标的大部分信息。因此,在主成分的选择上应尽可能选用特征值超过1的主成分,并确保各主成分的累积贡献率不低于80%。
基于主成分分析得到运动学片段的特征指标,并采用聚类方法对运动学片段分类,挖掘出租车运动特征模式。考虑到出租车运动特征模式没有明确学习目标的特性,选择非监督学习且具有计算简便快捷高效等优点的K‒均值聚类算
结合出租车运动特征模式,开展多时空情景下的出租车行驶状态综合研判。考虑到用于刻画出租车运动特征模式的指标之间不可相互换算,采用可以有效评价准则间存在冲突和不可公度情形的多属性决策方
刻画出租车运动特征模式的指标之间存在关联性,为了合理确定评价指标的权重,采用CRITIC法计算权重,不仅考虑变异对指标的影响,还考虑关联性对指标的影
CRITIC法利用评价指标之间的冲突程度和对比强度确定指标权重。对比强度是指同一指标对不同出租车运动特征模式的取值差异。采用评价指标之间的平均差替代标准差,克服了使用标准差刻画对比强度造成的量纲和数量级不一致的缺陷。评价指标之间的冲突程度由相关系数度量。为了避免负相关系数导致的计算误差,使用相关系数绝对值计算评价指标的信息量。信息量越大表明出租车运动特征模式之间的差异性越大,第j个特征指标的客观权重计算式为:
(4) |
(5) |
式中:w1j为CRITIC法计算得到的第j个特征指标的客观权重;Mj为第j个特征指标的平均差;为特征指标均值。w1j越大,表明第j个特征指标对出租车运动特征模式影响越大。
熵权法能够考虑评价指标的离散程度,更加准确地计算出租车运动特征模式评价指标所包含的信息量。熵值越小则评价指标对应的样本数据越有序,权重越大。第j个特征指标的客观权重计算式为
(6) |
式中:w2j为熵权法计算得到的第j个特征指标的客观权重;pij为第i个运动学片段的第j个特征指标所占的比例,即pij=。
采用CRITIC法以及熵权法分别计算出租车运动特征模式特征指标的权重,记为wk=(wk1,wk2,…,wkn)(k=1,2)。2种方法线性组合权重系数记为μk=,则第i个运动学片段的组合权重计算式为
(7) |
为了计算最优权重
(8) |
根据矩阵的微分性质,得出最优化模型公式一阶导数条件并归一化处理得到最优化组合权重系数为
(9) |
代入
对n个行驶状态特征指标以及m个运动学片段组成的初始参数矩阵进行标准化处理,得到标准化矩阵D=(dij)m×n。根据标准化矩阵,确定正理想解与负理想解为:
(10) |
(11) |
计算备选方案到正负理想解的距离比值,包括第i个运动学片段的最大群体效用Si以及最小个体遗憾Ri,计算式为:
(12) |
(13) |
根据所得的群体效用值Si和最小个人遗憾值Ri,计算第i个运动学片段的折衷评价值为
(14) |
式中:q∈[0,1]为决策机制系数。当q>0.5时,表示侧重于根据所有指标来评价出租车运动特征模式;当q<0.5时,表示侧重于根据某一指标评价出租车运动特征模式;当q=0.5时,表示折衷情况,即在决策机制中均衡考虑群体利益的最大化和最小化个体遗憾的重要程度。本文选取q=0.5进行最终决策。
最后,对多时空情景下的出租车运动特征模式进行排序并确定最优决策方案。将所有评价对象的Si、Ri、Qi值从小到大排列,值越小对应的评价对象越优。若满足以下2个条件,则Qi值最小的评价对象
条件1 可接受的成效门槛为
(15) |
式中:A1、A2分别表示Qi值排序第一及第二的出租车运动特征模式;F表示可接受的优势阈值;m表示运动学片段总数,当m≤4时,取F=1/4。
条件2 可接受的可靠度。对于Qi值最小对应的最佳出租车运动特征模式,其相应的Si值(或Ri值)必须小于Qi排序第二的评价对象。
若只满足条件1,则在所有评价的出租车运动特征模式中A1、A2为最优方案。若只满足条件2,则A1,A2,…,An均为最优方案,其中n的最大值由 Q(An)-Q(A1)<F确定。
以深圳市2019年1月21日至29日共计9 d采样间隔为1 s的700万条出租车行驶轨迹GNSS数据为驱动,选取主干路、次干路和支路各5条为研究对象,提取共计1 757条运动学片段,每条运动学片段的平均时长为152.11 s、平均行驶距离为663.77 m,部分典型运动学片段如

图1 出租车运动学片段及特征模式挖掘
Fig.1 Kinematic segments of taxi and feature pattern mining
根据提取的1 757条运动学片段及对应的特征指标,可以构建一个1 757×13的运动学片段数据矩阵。采用主成分分析计算特征指标主成分的特征值、贡献率及累积贡献率,结果如
根据
评价 角度 | 评价指标 | 指标符号 | 均值 | 方差 | 最小值 | 最大值 |
---|---|---|---|---|---|---|
安全性 | 超速幅度均值/% | Emean | 0.13 | 0.017 | 0 | 1.35 |
超速比例/% | Rl | 6.10 | 58.490 | 0 | 42.00 | |
效率 | 怠速时间占比/% | qc | 46.21 | 0.067 | 1.10 | 100.00 |
加速度均值/(m· | a | 0.71 | 0.070 | 0.17 | 2.20 | |
行驶速度均值/(km· | vmean | 29.72 | 273.570 | 2.13 | 78.38 | |
舒适性 |
最大减速度/(m· | a | -2.15 | 0.032 | -2.58 | -0.15 |
加速时间占比/% | qa | 26.64 | 0.013 | 0.23 | 54.00 | |
加减速频率/(次·mi | fad | 29.26 | 153.850 | 0.76 | 52.74 |
利用主成分分析筛选出关键指标后,将更新的运动学片段数据库(1 757×8)作为样本数据输入,采用K‒均值聚类算法对出租车运动学片段进行分类,得到肘部图,如

图2 出租车运动特征模式
Fig.2 Taxi kinematic feature pattern
由
采用CRITIC法、改进CRITIC法、熵权法以及本文提出的基于纳什均衡的组合赋权法得到的评价指标权重如
指标权重 计算方法 | 不同评价指标权重 | |||||||
---|---|---|---|---|---|---|---|---|
超速幅度均值 | 超速比例 | 怠速时间 占比 | 加速度均值 | 行驶速度均值 | 最大减速度 | 加速时间 占比 | 加减速度频率 | |
CRITIC法 | 0.170 | 0.150 | 0.130 | 0.110 | 0.160 | 0.100 | 0.100 | 0.090 |
改进CRITIC法 | 0.160 | 0.110 | 0.110 | 0.140 | 0.120 | 0.130 | 0.130 | 0.110 |
熵权法 | 0.090 | 0.070 | 0.060 | 0.200 | 0.060 | 0.130 | 0.200 | 0.190 |
组合赋权法 | 0.123 | 0.088 | 0.086 | 0.171 | 0.094 | 0.129 | 0.165 | 0.146 |
基于VIKOR模型评价多时空情景下的出租车运动特征模式,得到出租车行驶状态综合研判结果,处于前33.3%的记作优,处于33.3%~66.7%的记作良,其他记作差,结果如
时间 情景 | 分类 | 主干路 | 次干路 | 支路 | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
安全性 | 效率 | 舒适性 | 研判结果 | 安全性 | 效率 | 舒适性 | 研判结果 | 安全性 | 效率 | 舒适性 | 研判结果 | ||
早高峰 | 1 | 5.00 | 7.00 | 2.33 | 差 | 10.00 | 4.00 | 7.00 | 优 | 8.00 | 5.67 | 4.00 | 良 |
2 | 10.00 | 2.67 | 7.00 | 优 | 3.50 | 7.33 | 2.00 | 差 | 3.50 | 6.67 | 0.00 | 差 | |
3 | 8.00 | 6.33 | 3.67 | 良 | 7.50 | 6.67 | 3.00 | 良 | 10.00 | 1.33 | 8.33 | 优 | |
平峰 | 1 | 4.00 | 7.33 | 2.33 | 差 | 8.00 | 6.67 | 3.33 | 良 | 5.00 | 7.67 | 1.33 | 差 |
2 | 10.00 | 2.00 | 8.00 | 优 | 10.00 | 2.00 | 9.00 | 优 | 9.50 | 5.00 | 7.67 | 优 | |
3 | 4.50 | 7.33 | 2.33 | 差 | 3.50 | 7.67 | 1.67 | 差 | 2.00 | 6.00 | 2.00 | 差 | |
晚高峰 | 1 | 7.50 | 6.00 | 4.33 | 良 | 8.00 | 6.00 | 3.33 | 良 | 0.00 | 7.00 | 1.33 | 差 |
2 | 10.00 | 0.67 | 9.67 | 优 | 2.50 | 7.67 | 1.33 | 差 | 10.00 | 0.33 | 9.00 | 优 | |
3 | 5.00 | 7.67 | 3.00 | 差 | 9.00 | 1.33 | 10.00 | 优 | 5.50 | 6.00 | 4.33 | 差 |
出租车在主干路上的行驶安全性最佳,其次是次干路,支路最差。这说明在主干路上,出租车驾驶员遵守限速意识较强,行驶速度在道路限速内;在次干路和支路上,超速行为逐渐增多,超速幅度也逐渐提高,尤其是在支路上,出租车行驶安全隐患较大。此外,早高峰期间出租车行驶安全性最佳,平峰和晚高峰期间相对一般。这说明驾驶员在早晨的驾驶心态较为平和,超速行为较少;随着时间的推移,尤其是经过了一天的工作后,驾驶状态会逐渐激进,在晚高峰期间的安全性表现欠佳。
3种等级道路上出租车在晚高峰的行驶效率最低。在早高峰期间,出租车在主干路和支路上的行驶效率低,在次干路上行驶效率较高。这说明在次干路上,即使早高峰期间出租车也有着较为不错的高效率行驶状态。支路由于其道路条件一般,交通状况复杂,相较于主干路和次干路,出租车行驶效率最差。舒适性方面,在支路、次干路、主干路上出租车行驶的舒适性逐级提高。这是因为道路条件的提高以及交通状况的改善,使得出租车的加减速频率和幅度都有所减小,能够为乘客提供更平稳舒适的乘车体验。
出租车行驶状态综合研判时,可根据出租车行驶轨迹提取运动学片段,计算运动特征模式指标,快速匹配映射得到出租车运动特征模式和相应的安全性、效率、舒适性及综合评价结果,进而定制化地提出驾驶行为优化建议。若当前的行驶状态安全性较差而效率较高,则提出适当降低行驶速度或加速度的建议。
本文以行驶轨迹GNSS数据为驱动,通过分析行驶状态特征,研究出租车运动学片段研判条件和流程,提出出租车运动学片段提取方法。以深圳市共计9 d采样间隔为1 s的出租车行驶轨迹GNSS数据为例,共提取1 757条出租车运动学片段。采用主成分分析进行降维,确定了8个关键指标,结合K‒均值聚类算法,生成包含主干路、次干路和支路在早高峰、平峰和晚高峰9个时空情景的27类出租车运动特征模式库。基于纳什均衡组合赋权的VIKOR评价模型结果表明,综合安全性、效率和舒适性三方面,出租车行驶状态在主干路和次干路上优于在支路上。出租车在主干路上的行驶安全性最佳,其次是在次干路上,支路上最差。此外,早高峰出租车行驶安全性最佳,平峰和晚高峰相对一般。3种等级的道路上出租车在晚高峰的行驶效率最低,在支路上出租车行驶效率最差。支路、次干路、主干路上出租车行驶舒适性逐步提高。
作者贡献声明
董春娇:研究思路提出,研究方法整体设计。
吴 睿:特征提取,模型构建。
杨道源:模型构建,数据分析。
赵 丹:论文撰写。
李 宁:数据分析。
参考文献
HOU G Y, CHEN S R, CHEN F. Framework of simulation-based vehicle safety performance assessment of highway system under hazardous driving conditions[J]. Transportation Research, Part C: Emerging Technologies, 2019, 105: 23. [百度学术]
ALONSO M, MANTARAS D A, LUQUE P. Toward a methodology to assess safety of a vehicle[J]. Safety Science, 2019, 119: 133. [百度学术]
韩天园, 李旋, 吕凯光, 等. 车载GPS数据驱动的危货运驾驶员安全绩效评价[J]. 中国安全科学学报, 2021, 31(7): 164. [百度学术]
HAN Tianyuan, LI Xuan, LÜ Kaiguang, et al. Safety performance evaluation of dangerous chemicals transport drivers based on vehicle GPS data[J]. China Safety Science Journal, 2021, 31(7): 164. [百度学术]
IMKAMON T, SAENSOM P, TANGAMCHIT P, et al. Detection of hazardous driving behavior using fuzzy logic [C] //5th International Conference on Electrical Engineering/Electronics, Computer, Telecommunications and Information Technology (ECTI-CON 2008). Krabi: [s.n.], 2008:657-660. [百度学术]
胡斌, 王生进, 丁晓青. 基于云模型的驾驶员驾驶状态评估方法[J]. 清华大学学报(自然科学版), 2009, 49(10): 1614. [百度学术]
HU Bin, WANG Shengjin, DING Xiaoqing. Estimation of driver’s driving state based on cloud model[J]. Journal of Tsinghua University (Science and Technology), 2009, 49(10): 1614. [百度学术]
MIYAJIMA C, UKAI H, NAITO A, et al. Driver risk evaluation based on acceleration, deceleration, and steering behavior [C] //2011 IEEE International Conference on Acoustics, Speech and Signal Processing. Piscataway: IEEE, 2011:1829-1832. [百度学术]
丁琛. 基于车辆动态监控数据的异常驾驶行为识别技术研究[D]. 北京: 北京交通大学, 2015. [百度学术]
DING Chen. The research of abnormal driving behavior recongnition technology based on vehicle dynamic monitoring data[D]. Beijing: Beijing Jiaotong University, 2015. [百度学术]
WANG D J, PEI X, LI L, et al. Risky driver recognition based on vehicle speed time series[J]. IEEE Transactions on Human-Machine Systems, 2018, 48(1): 63. [百度学术]
MESEGUER J E, CALAFATE C T, CANO J C, et al. Driving styles: a smartphone application to assess driver behavior[C] //2013 IEEE Symposium on Computers and Communications. Split: Institute of Electrical and Electronics Engineers, 2013:535-540. [百度学术]
王冠. 基于数据的乘车环境舒适度评价方法[D]. 北京: 北京交通大学, 2013. [百度学术]
WANG Guan. The data-based appraisal method of riding environmental comfort[D]. Beijing: Beijing Jiaotong University, 2013. [百度学术]
MANTOUKA E G, BARMPOUNAKIS E N, VLAHOGIANNI E I. Identifying driving safety profiles from smartphone data using unsupervised learning[J]. Safety Science, 2019, 119: 84. [百度学术]
TRIGUI R, JEANNERET B, VINOT E, et al. Eco-driving rules extraction from a model based optimization for a new generation EV [C] //2015 IEEE Vehicle Power and Propulsion Conference. Montreal: Institute of Electrical and Electronics Engineers, 2015:1-6. [百度学术]
云美萍, 王文. 基于智能手机的公交运行舒适性测度指标研究[J]. 同济大学学报(自然科学版), 2017, 45(8): 1143. [百度学术]
YUN Meiping, WANG Wen. Smartphone based research of measurement indexes related to bus riding comfort[J]. Journal of Tongji University (Natural Science), 2017, 45(8): 1143. [百度学术]
郭家琛, 姜衡, 雷世英, 等. 城市道路汽车行驶工况构建方法[J]. 交通运输工程学报, 2020, 20(6): 197. [百度学术]
GUO Jiachen, JIANG Heng, LEI Shiying, et al. Vehicle driving cycle construction method of urban roads[J]. Journal of Traffic and Transportation Engineering, 2020, 20(6): 197. [百度学术]
邵云飞, 许冲, 胡惠晴. 基于聚类分析的汽车行驶工况构建研究[J]. 软件导刊, 2021, 20(4): 129. [百度学术]
SHAO Yunfei, XU Chong, HU Huiqing. Research on the construction of driving cycle based on cluster analysis[J]. Software Guide, 2021, 20(4): 129. [百度学术]
罗志忠, 张丰焰. 主成分分析法在公路网节点重要度指标权重分析中的应用[J]. 交通运输系统工程与信息, 2005(6): 78. [百度学术]
LUO Zhizhong, ZHANG Fengyan. Application of principal component analysis method in calculating the weights of the indexes of the highway nodes’ importance[J]. Journal of Transportation Systems Engineering and Information Technology, 2005(6): 78. [百度学术]
LV Z H, QIAO L, CAI K, et al. Big Data analysis technology for electric vehicle networks in smart cities[J]. IEEE Transactions on Intelligent Transportation Systems, 2021, 22(3): 1807. [百度学术]
OPRICOVIC S, TZENG G H. Compromise solution by MCDM methods: a comparative analysis of VIKOR and TOPSIS[J]. European Journal of Operational Research, 2004, 156(2): 445. [百度学术]
PLOSKAS N, PAPATHANASIOU J. A decision support system for multiple criteria alternative ranking using TOPSIS and VIKOR in fuzzy and nonfuzzy environments[J]. Fuzzy Sets and Systems, 2019, 377: 1. [百度学术]
DIAKOULAKI D, MAVROTAS G, PAPAYANNAKIS L. Determining objective weights in multiple criteria problems: the critic method[J]. Computers & Operations Research, 1995, 22(7): 763. [百度学术]
SHANNON C E. Communication theory of secrecy systems[J]. Bell System Technical Journal, 1949, 28(4): 656. [百度学术]