摘要
换道决策是智能网联汽车的核心难题之一,其面临着高动态、复杂交通场景下需要综合考虑行驶安全及效率等目标的巨大挑战。提出一种多目标预测优化的换道决策方法,主要包括动力学矩阵建模及多目标预测优化问题解算。基于智能网联汽车的通讯大数据信息构建交通流矩阵模型,然后分别设计表征车辆换道安全、行驶效率的动力学模型,通过多目标综合预测优化方法,求解条件约束下预测优化问题从而优化出最优换道决策指令。结果表明,所提出的预测优化换道方法较其他方法提高了智能汽车的行驶安全性和效率。
智能网联汽车通过环境感知与网联、智能决策与控制以及底盘执行实现无人驾驶,有望极大地降低由于人为因素造成的交通事故,提高交通安全性以及交通效
智能汽车在高动态、复杂不确定的交通环境下,依赖智能决策模块为车辆提供安全、可行的包括直行、左转、右转等在内的动作指
由于强化学习算法可以处理时序优化问题并为长期目标寻找优化策略,该算法逐渐被应用到智能汽车决策问题的研究中,成为近年来的研究热点。强化学习算法可在现有策略和随机探索之间采取动作,然后与环境交互获得实时奖励,通过最大化累积奖励来获得最优策略。Wang
由于预测控制方法可估计系统未来动态行为而提升控制效果,近年来预测控制方法也逐渐被应用于变道决策控制问题
已有的各种文献针对智能汽车的决策技术均开展了深入研究,并且取得了积极进展。考虑到规则式决策策略适应性有待提高、基于代价函数优化的决策方法难以应对高复杂动态交通环境、基于神经网络的学习算法在训练中存在不确定性且可解释性较弱对智能汽车行驶安全带来隐患,本文提出一种多目标预测优化换道决策方法以为智能汽车提供在复杂交通流下安全、高效运行的决策指令。当前针对换道决策问题的预测方法多集中于通过分析车辆交通流轨迹数据,借助于神经网络模型学习轨迹特征对换道意图进行预测。概率模型输出结果存在不确定性。本文基于车辆动力学模型预测,通过多目标优化求解,可在保证车辆安全行驶的边界条件内优化车辆行驶效率。
本文提出的多目标预测优化换道决策方法总体架构如

图1 多目标预测优化换道决策方法总体架构
Fig. 1 Overall framework of multi-objective predictive optimization-based lane change decision-making method
高动态、复杂多变的真实交通场景给智能汽车决策带来了潜在风险,智能汽车能够在海量的网联交通大数据中精准筛选出与其决策控制密切相关的车辆动态信息是其进行安全、高效决策控制的基础。考虑如
(1) |
式中:为具有车辆动力学属性的类参数,其定义如
(2) |
式中:类参数分别为绝对坐标,绝对速度,车道序号,自车与他车之间的相对距离,相对速度以及相对加速度。

图2 经典结构化道路交通流建模示意图
Fig. 2 Traffic flow modeling of typical structure road
车辆运行过程中,算法根据网联交通大数据信息筛选出上述车辆类参数,动态构建出完备的交通流矩阵,保证了变道决策所需信息的正确输入。这样,才能实现安全、高效地变道决策。
安全性是换道决策策略最重要的性能,因此车辆在换道时必须避免与交通流矩阵中任意车辆发生碰撞。本文定义出换道安全的动力学数学边界表达,进一步地,在动力学边界限制下对换道决策进行预测优化。
为方便后续动力学安全边界和预测优化分析,本文构建交通流中车辆行驶距离‒时间(s-t)图和车道‒行驶距离()图模型,如
(3) |
式中:为两辆车之间的距离;为设定的常数,当两车之间的距离小于意味着碰撞发生。

图3 典型交通流与图
Fig. 3 Illustration of and of typical traffic flow
换道决策指令满足自车碰撞集为空集,即,则可以保证车辆换道决策的安全。因此,换道安全的动力学安全边界条件可以描述为
(4) |
式中:为换道动作;为换道指令动作集合。
考虑实际交通场景的高动态性、复杂性,动力学安全条件需要考虑车辆未来时刻的运动轨迹。本文根据车间动力学运动关系和
(5) |
式中:为当前采样时刻;为预测时域。
自车车辆在某一车道行驶时,主要根据摄像头或者毫米波雷达探测到的与前方车辆之间的运行关系,由自适应巡航跟车策略控制车辆纵向加速度,使得自车与前车保持一定的安全距离和车速行驶。但是在复杂、动态的交通流中,前方车辆可能长时间低速行驶,如果一直跟踪其后会导致自车行驶效率降低。此时,自车可以通过主动变道指令进行变道,避免在低速车辆后面跟车,以提高车辆行驶效率。因此,本文基于自适应巡航策略的车间运动动力学模型推导行驶效率数学表征。
自适应巡航控制策略目标是自车与前车以相同的速度保持期望距离[
(6) |
式中:为跟车时距;为距离常数;为自车车速。
巡航跟车控制策略根据速度偏差和距离偏差来调整自车加速度实现,其中,和计算公式如下:
(7) |
式中:为前车车速;为自车与前车距离。
考虑车辆动力系统特性,本文将自车纵向加速度与期望纵向加速度之间的关系描述为一阶惯性环节:
(8) |
式中:和均为常数。,其中和分别为相对速度和相对距离的增益值,均为常数。
因此,定义三维状态空间,可以推导出跟车系统模型如下:
(9) |
显然地,车辆行驶效率由车速决定,由相同时间内的行驶距离反映。因此,本文基于
(10) |
(11) |
式中:;;系统矩阵,和分别为
(12) |
考虑到预测优化问题以离散形式迭代计算,本文使用零阶保持离散化方法将变道决策系统离散化:
(13) |
基于换道决策的行驶效率数学表达和安全动力学边界条件,本节继续推导预测优化换道决策方法。自车换道动作不同直接决定了自车交通流动态矩阵变化,从而导致预测时域内换道决策系统的状态和碰撞集的变化。
由此,本文提出的预测优化换道决策即在预测时域时刻内在换道动力学安全边界条件约束下预测优化,使得变道决策系统状态中为最大,即可优化出最优预测换道指令。具体地,本文提出的预测优化换道数学描述为
(14) |
这样,根据网联交通大数据信息迭代求解
为了验证多目标预测优化换道决策方法的性能,使用典型三车道高速公路场景进行策略测试验证与分析,测试工况为自车在随机动态交通流中从起点行驶至终点,总长为2 000 m。同时,将本文提出的预测优化方法与基于规则式换道策略性能进行对比分析。设计测试场景中自车由本文提出的多目标预测换道策略控制。此外测试交通流中设置三类车辆:激进运动型、常规驾驶型、保守型。各个车辆使用测试软件平台模型根据交通流状况自主控制车辆运动,不同风格车辆的运动参数根据动力学响应特性具体配置如
车辆类型 | 最大加速度/() | 最大减速度/) | 最高车速/) | 最小间隙/ |
---|---|---|---|---|
激进运动型 | 5.5 | 5.5 | 30 | 1 |
常规驾驶型 | 3 | 2.5 | 25 | 2.5 |
保守型 | 3 | 2.5 | 20 | 2.5 |
自车 | 4 | 5.5 | 35 | 1.5 |
智能汽车换道安全性通过测试场景下发生碰撞的次数进行评价;行驶效率则主要通过自车从起点到终点总时长来对比分析。此外,换道次数也是评价换道决策方法的重要指标,通过比较分析不同策略在不同测试环境下的换道次数来分析其性能及适应性。测试中本文提出控制策略的主要参数如
参数 | 预测时域 | 跟车时距 | 距离常数 | 距离增益 | 速度增益 |
---|---|---|---|---|---|
数值 | 5 | 2.0 | 4.5 | 0.63 | 0.96 |
本小节给出对提出的预测优化换道决策方法进行验证的测试结果和分析。

图4 自车及周围车辆图
Fig. 4 diagram of ego vehicle and its neighbor cars

图5 自车及周围车辆的车速曲线
Fig. 5 Longitudinal speed of ego vehicle and its neighbor cars

图6 周围车辆与自车之间的相对速度和相对距离图
Fig. 6 Relative speed and distance between ego vehicle and its neighbor cars

图7 自车与图
Fig. 7 and of ego vehicle

图8 自车行驶速度图
Fig. 8 Longitudinal speed of ego vehicle
具体地,将
为了进一步验证本文提出方法的性能,设计了一组随机交通流测试场景对本文换道决策方法进行测试,并且与两个基于专家经验的规则换道策略和强化学习策略进行对比分析。本文使用的强化学习策略为近端策略优化算法(proximal policy optimization, PPO

图9 强化学习策略训练结果
Fig. 9 Training results of reinforcement learning-based strategy
通过分析不同策略的行驶车速、碰撞检测次数以及变道次数来比较各自性能。4种控制方法的各组交通流测试场景的测试结果统计如图

图10 不同策略下车速统计结果对比
Fig. 10 Comparison of vehicle speeds controlled by different strategies

图11 不同策略下碰撞次数统计结果对比
Fig. 11 Comparison of collision numbers controlled by different strategies

图12 不同策略下变道次数统计结果对比
Fig. 12 Comparison of lane change numbers controlled by different strategies
换道策略 | 行驶速度 /) | 碰撞检测次数 | 换道次数 |
---|---|---|---|
预测优化方法 | 17.600 70.615 0 | 0 | 2.533 30.915 5 |
强化学习策略 | 16.603 90.417 1 | 3.266 72.463 1 | 90.133 35.026 6 |
规则策略1 | 17.598 60.584 4 | 110.66718.546 0 | 9.635 318.533 3 |
规则策略2 | 17.482 40.644 5 | 0 | 2.200 01.146 4 |
更重要地,如
针对高动态、复杂交通场景下难以综合考虑行驶安全及效率等目标的问题,本文研究了一种多目标预测优化的换道决策方法。通过构建交通流矩阵模型分析交通流行驶距离‒时间以及车道‒行驶距离模型,设计出动力学安全边界约束和行驶效率数学表达,通过预测优化给出换道决策指令。
典型工况测试与分析结果表明,所设计的预测换道决策方法能在保证车辆不发生碰撞的同时给出合适的变道指令,以提升车辆行驶速度,提高行驶效率。通过对比,所提出方法比常规规则换道策略和强化学习策略安全性更高、行驶速度更高。
下一步工作考虑部署换道决策算法至试验车上进行实车道路测试。并且进一步考虑换道过程中局部路径规划问题,综合整车动力学性能,提升多目标预测换道决策算法性能。
作者贡献声明
程 硕:探索并设计了多目标预测优化换道方法,完成了算法设计分析与论文撰写。
夏 新:执行测试实验,处理并分析了试验数据。
NAKANO Kimihiko:指导了换道优化方法设计思路、设计实验步骤。
参考文献
SPIELBERG N A, BROWN M, KAPANIA N R, et al. Neural network vehicle models for high-performance automated driving[J/OL]. Science Robotics, 2019, 4(28): eaaw1975. https://doi.org/10.1126/scirobotics.aaw1975. [百度学术]
THANDAVARAYAN G, SEPULCRE M, GOZALVEZ J. Generation of cooperative perception messages for connected and automated vehicles[J/OL]. IEEE Transactions on Vehicular Technology, 2020, 69(12): 16336. https://doi.org/10.1109/TVT.2020.3036165. [百度学术]
CHENG S, LI L, MEI M M, et al. Multiple-objective adaptive cruise control system integrated with DYC[J/OL]. IEEE Transactions on Vehicular Technology, 2019, 68(5): 4550. https://doi.org/10.1109/TVT.2019.2905858. [百度学术]
TANG C, KHAJEPOUR A. Wheel modules with distributed controllers: a multi-agent approach to vehicular control[J/OL]. IEEE Transactions on Vehicular Technology, 2020, 69(10): 10879. https://doi.org/10.1109/TVT.2020.3019376. [百度学术]
LI L, WANG X, WANG K, et al. Parallel testing of vehicle intelligence via virtual-real interaction[J/OL]. Science Robotics, 2019, 4(28): eaaw4106. https://doi.org/10.1126/scirobotics.aaw4106. [百度学术]
FENG S, YAN X, SUN H, et al. Intelligent driving intelligence test for autonomous vehicles with naturalistic and adversarial environment[J/OL]. Nature Communications, 2021, 12(1): 748. https://doi.org/10.1038/s41467-021-21007-8. [百度学术]
NIEHAUS A, STENGEL R F. Probability-based decision making for automated highway driving[J/OL]. IEEE Transactions on Vehicular Technology, 1994, 43(3): 626. https://doi.org/10.1109/25.312814. [百度学术]
LI M, STRAUB F, KUNERT M, et al. A novel cost function for decision-making strategies in automotive collision avoidance systems[C/OL]//2018 IEEE International Conference on Vehicular Electronics and Safety (ICVES). 2018: 1-8. https://doi.org/10.1109/ICVES.2018.8519591. [百度学术]
BOJARSKI M, DEL TESTA D, DWORAKOWSKI D, et al. End to end learning for self-driving cars[R/OL]//arXiv e-prints. (2016-04-01)[2021-12-11]. https://ui.adsabs.harvard.edu/abs/2016arXiv160407316B. [百度学术]
XU X, ZUO L, LI X, et al. A reinforcement learning approach to autonomous decision making of intelligent vehicles on highways[J/OL]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2020, 50(10): 3884. https://doi.org/10.1109/TSMC.2018.2870983. [百度学术]
WEI J, DOLAN J M. A robust autonomous freeway driving algorithm[C/OL]//2009 IEEE Intelligent Vehicles Symposium. [S.l.]:IEEE,2009: 1015-1020. https://doi.org/10.1109/IVS.2009.5164420. [百度学术]
SEZER V. Intelligent decision making for overtaking maneuver using mixed observable Markov decision process[J/OL]. Journal of Intelligent Transportation Systems, 2018, 22(3): 201. https://doi.org/10.1080/15472450.2017.1334558. [百度学术]
WANG P, CHAN C Y. Formulation of deep reinforcement learning architecture toward autonomous driving for on-ramp merge[C/OL]//2017 IEEE 20th International Conference on Intelligent Transportation Systems (ITSC). [S.l.]:IEEE,2017: 1-6. https://doi.org/10.1109/ITSC.2017.8317735. [百度学术]
CHEN W, XIE G, JI W, et al. Decision making for overtaking of unmanned vehicle based on deep Q-learning[C/OL]//2021 IEEE 10th Data Driven Control and Learning Systems Conference (DDCLS). [S.l.]:IEEE,2021: 350-353. https://doi.org/10.1109/DDCLS52934.2021.9455523. [百度学术]
YOU C, LU J, FILEV D, et al. Highway traffic modeling and decision making for autonomous vehicle using reinforcement learning[C/OL]//2018 IEEE Intelligent Vehicles Symposium (IV). [S.l.]:IEEE,2018: 1227-1232. https://doi.org/10.1109/IVS.2018.8500675. [百度学术]
SUH J, CHAE H, YI K. Stochastic model-predictive control for lane change decision of automated driving vehicles[J/OL]. IEEE Transactions on Vehicular Technology, 2018, 67(6): 4771. https://doi.org/10.1109/TVT.2018.2804891. [百度学术]
刘启远, 孙剑, 田野, 等. 机非交互路段非机动车越线超车行为建模与仿真[J]. 同济大学学报(自然科学版), 2019, 47(11): 1585. [百度学术]
LIU Qiyuan, SUN Jian, TIAN Ye, et al. Modeling and simulation of non-motor vehicle overtaking behaviors on non-interactive road section[J]. Journal of Tongji University (Natural Science), 2019, 47(11):1585. [百度学术]
吕思雨. 车辆换道意图识别及换道轨迹预测[D]. 广州:广州大学, 2022. [百度学术]
LV Siyu. Lane change intention recognition and lane change trajectory prediction[D]. Guangzhou: Guangzhou University, 2022. [百度学术]
董俊一. 考虑驾驶风格的智能驾驶换道决策模型研究[D]. 长春:吉林大学, 2022. [百度学术]
DONG Junyi. Research on lane change decision model considering driving styles for autonomous driving[D]. Changchun: Jilin University, 2022. [百度学术]
FALCONE P, BORRELLI F, ASGARI J, et al. Predictive active steering control for autonomous vehicle systems[J]. IEEE Transactions on Control Systems Technology, 2007, 15(3): 566. [百度学术]
SZUMSKA E M, JURECKI R. The Effect of Aggressive Driving on Vehicle Parameters[J/OL]. Energies, 2020, 13(24): 6675. https://doi.org/10.3390/en13246675. [百度学术]
LI Y, MIYAJIMA C, KITAOKA N, et al. Evaluation method for aggressiveness of driving behavior using drive recorders[J/OL]. IEEJ Journal of Industry Applications, 2015, 4(1): 59. https://doi.org/10.1541/ieejjia.4.59. [百度学术]
SCHULMAN J, WOLSKI F, DHARIWAL P, et al. Proximal policy optimization algorithms[J/OL]. 2017.[2022-08-01]. https://arxiv.org/abs/1707.06347. [百度学术]