摘要
自动驾驶车辆需具备预测周围车辆轨迹的能力。诸多发展中国家普遍存在弱规则、强交互的混合交通流道路,高密度混合交通流的车辆轨迹预测是极具挑战性的任务。为了兼顾混合交通流道路环境下轨迹预测的高精度和可解释性,设计一个融合领域知识和经验的深度学习模型(DK-Conv-LSTM)实现车辆的长、短时轨迹预测。该模型采用卷积结构(Conv)提取交互特征,并将融合车辆历史信息的特征向量送入长短时记忆网络(LSTM)模型实现轨迹预测。知识经验通过嵌入损失函数的方式引导深度学习模型的训练。与基础的LSTM相比,仅添加卷积层结构的Conv-LSTM模型可提升终点轨迹误差(FDE)约30.46 %,提升平均轨迹误差(ADE)约34.78 %;而DK-Conv-LSTM模型可分别提升FDE 46.81 %和ADE 49.08 %;同时DK-Conv-LSTM模型可还原多前车跟驰、超车行为的驾驶轨迹。
车辆行驶过程中,驾驶员可以自然地完成对周围车的轨迹预判,并做出合理的驾驶决策。为了实现自动驾驶车辆与人类驾驶员的交互协
现有轨迹预测的思路主要有两类:一是基于机理建模的方
鉴于此,针对高密度混合交通流环境,本文提出一个领域知识引导的卷积‒长短时记忆网络模型(domain-knowledge-guided convolutional long short-term memory, DK-Conv-LSTM),模型输入全方位的环境信息以保证多交互对象的覆盖率,采用卷积结构(convolutional layer) 提取多维交互特征,综合本车时序轨迹信息后,采用长短时记忆网络(long short-term memory) 模型预测车辆轨迹;将领域知识写入损失函数中引导数据驱动模型的训练过程,提高轨迹长时预测精度和行为表现。
如前文所述,现有研究将驾驶过程视为不同行为的组合,基于个体间具有交互关系的前提假设,认为车辆行为是交互协同的结
数据驱动模型方面,借助先进的机器学习算法和海量数据集,通过数据训练自动地获得预测模
尽管数据驱动模型在精度上优于解析模型,但在建模过程仍有问题需要解决。在弱规则、强交互场景下,车辆运动受多重耦合因素影响,因此需要提取更多的特征作为模型输入,比如增加历史信息,考虑场景信息,增加交互车的数
总而言之,相比机理解析方法,数据驱动方法具有更高的预测精度,采取有效的特征处理方法能够进一步提高模型性能。
受限于数据驱动方法本身的局限性,数据驱动模型难以自动保证输入、输出以及内部状态变量之间结构化、可解释的联系,预测的结果可能与实际不
Willard
总的来说,领域知识与模型结合的关键在于有效编码领域知识并实现对学习过程本身的引导。
在亚洲的众多发展中国家,高密度混合交通流在城市道路中广泛存在,如

图1 研究路段场景与交互类型示意图
Fig. 1 Screenshots of study area and its schematic diagram
这类场景的典型特征是道路弱规则、对象强交互,具体表现为:道路上无车道分割,各种类型的车辆共享道路空间,道路使用者也多不受规则的约束、以占据前方任何的可行空间为原则行驶,出现了很多非典型的交通场景,比如
为了实现弱规则、强交互场景下混合交通流车辆的轨迹预测,提出DK-Conv-LSTM模型,如

图2 领域知识引导的卷积-长短时记忆网络模型
Fig. 2 High-level picture of DK-Conv-LSTM model
下面具体介绍模型的输入输出及长短时记忆网络模型(LSTM) 结构。
要实现对周围车的轨迹预测,需要考虑车辆间连续的交互,则模型输入应当同时包括被预测车辆历史向量和上下文环境历史向量。为了与损失函数的参数匹配,减少多重共线性的问题,选用速度向量表征被预测车的信息。上下文环境信息指的是影响车辆运动的众多外界因素,包括道路,交通规则,动态交互对象等,由于本研究场景道路规则简单,因此假设动态交互对象是最重要的影响因素,对检测空间内车辆的相互关系进行编码。检测空间指的是以车辆相对距离为指标划定的固定空间,假设该空间内包含所有的交互对象。根据周边视觉的相关研究,以视野半径的圆形与道路的交集为范围划定检测空间,以车辆为中心,以60°为界将检测空间划分5个空间(后方合并),如

图3 检测空间范围和交互车辆
Fig. 3 Detection zone and interactive vehicles
此外,为考虑驾驶行为的连续性和记忆效应,将持续时长的历史数据作为模型的输入,则输入变量表示为
(1) |
式中:表示被预测车辆的历史信息;表示上下文环境的历史信息;为历史时域(输入轨迹的长度)。具体而言,被预测车的历史信息包括,式中为预测车的速度;上下文环境信息包括检测空间内辆车的历史状态信息,表示为。除轨迹外,相对位置,相对速度等参数也是描述车辆行为及交互运动的常用参数,不同类型车辆的运动特征有显著差异,因此相对位置、相对速度和车辆类型被选为上下文环境信息的表征变量,表示为,式中,为车辆与被预测车辆的相对距离,为车辆与被预测车辆的相对速度,为车辆的类别编码。由于不同类型车辆的差异主要表现在车辆尺寸(车长,车宽)、动力性(质量),机动性(体积)等方面,且以对环境的影响程度为标准,几个指标近似地现正比关系,可简化地用车辆的尺寸乘积比为车辆类别编码,即,式中为车辆的长度,为车辆的宽度。
仅考虑上下文环境信息就包括辆车,超过的特征变量,这其中不可避免地包含与任务仅有微弱相关性的特征、冗余特征甚至是噪声,严重阻碍模型训练。采用1维卷积结构(1-D convolutional layer, Conv1D) 可以高效提取车辆间交互作用特
模型输出为结构相同、权重参数不同的两分支结构,与模型输入相对应,模型的输出为被预测车的速度,用表示预测时域,则输出表示为
(2) |
式中:;为垂直运动方向(横向运动方向)速度;为运动方向(纵向运动方向)速度。
LSTM网络模型作为一种特殊的循环神经网络模型,在序列预测任务中具备天然的优势。LSTM模型的关键是细胞状态,用来保存当前LSTM的状态信息并传递到下一时刻,细胞状态可通过三个不同的门结构添加或移除信息,即遗忘门,读取上一个细胞状态传递来的信息和输入,并决定丢弃什么信息;输入门,从输入中捕捉信息,并更新细胞状态;输出门,根据细胞状态确定输出信息。各门结构表示如下:
遗忘门
(3) |
输入门
(4) |
(5) |
输出门
(6) |
(7) |
式(
为了避免出现信息瓶颈和过拟合现象,LSTM模型后连接Dropout层,最后通过全连接层(fully connected layer, FC)将特征映射到输出空间。
为了实现知识经验对学习算法进行指导,做法是当算法沿着正确的方向挖掘规律时予以肯定、强化,反之则进行纠正、弱化。对应到数据驱动模型中,损失函数的作用是衡量模型的输出值与真实值之间的差距,因此,考虑驾驶的效率和舒适性的要求,将不符合驾驶行为规律的行为公式化,并添加到损失函数中作为先验知识,可以实现对模型优化方向的指导。
此外,由于车辆横向运动的幅度和可预测性都远低于纵向运动,在建模时往往被忽略。然而在混合多交互环境中,车辆的横向运动与超车、避让、随机波动等行为变化息息相
(1) 横向损失函数
速度是描述驾驶行为的重要指标,横向速度的方向变化可能是与交互对象交换决策的结果,也可能是交互对象变更的标
(8) |
(9) |
, |
(10) |
本研究采用Kanagaraj
在进行模型训练前,进行数据预处理工作。具体包括对于定性数据手动编码,根据车辆尺寸的乘积比为车辆类别编码,则摩托车、小汽车、公交车、货车、轻型商用车、机动三轮车的类型编码分别为0.014,0.100,0.449,0.203,0.186,0.048;对定量数据进行均值归一化,包括速度、相对速度、相对距离。其中,均值归一化指数据与均值的差值与数据最大值与最小值的差值的比例,将结果映射到,可以减小样本数据的波动,提高梯度下降的速度。
本研究开展对照实验探究DK-Conv-LSTM模型各部分性能。研究设置LSTM模型作为基准模型;设置只保留卷积层和LSTM结构的对照组1 (Conv-LSTM)用来验证卷积层的特征提取的性能;设置领域知识注入的模型作为对照组2 (DK-Conv-LSTM),用于验证领域知识对模型的改善作用。
本研究采用自动调参方法随机搜索方法确定模型超参数,最终参数设置如下:1维卷积的两层核数目分别为25和10,激活函数为Relu;与本车特征通过串联函数(concatenate)整合后通过两层LSTM层,神经元个数选择350,后通过全连接层(FC)输出,激活函数选择tanh;训练批次64,训练轮次200。为了避免出现信息瓶颈和过拟合现象,卷积层后接一层批标准化层(batch normalization);LSTM层后采用丢弃率0.2的Dropout层,的正则化系数,采用Adam优化器,学习率为1×1
选择终点轨迹误差(final displacement error, FDE)和平均轨迹误差(average displacement error, ADE)两个指标,对比以下三个模型在短时(1 s)预测的精度。选择均方根误差(root mean square error, RMSE)为指标,评估长时()预测的精度。
FDE指的是最终时间戳()处的预测位置与实际最终位置之间的欧式距离,见
(14) |
(15) |
式(
ADE/m | FDE/m | 训练时间/min | |
---|---|---|---|
LSTM | 0.615 | 0.798 | 4.60 |
Conv-LSTM | 0.401 | 0.555 | 19.55 |
DK-Conv-LSTM | 0.313 | 0.425 | 23.88 |
由于模型规模的加深加宽,模型的训练过程需要大量的时间和计算资源。实验平台是一台配置3.3GHz的Intel Core i9处理器,64 GB的内存和1块NVDIA RTX 2080显卡的主机,
为描述模型在长时预测上的表现,本研究以0.5 s为间隔,详细比较了预测时长为3 s时横、纵两个方向的轨迹误差。

图4 多时段模型均方根误差对比(单位:m)
Fig. 4 Comparison of RMSE at multiple intervals of different models (unit: m)
由
为进一步展示模型性能的改善,本文从运动方向一致性和轨迹精度两个维度评估3个模型的表现。

图5 车辆横向运动一致性(X坐标)与预测精度(Y坐标)关系的模型对比图
Fig. 5 Relationship between consistency in lateral direction and prediction accuracy
如第2节所述,混合交通流中存在非典型的跟驰行为,比如与前车错位寻求视野的交错跟驰行为(SF)、不只有一辆引导车的双前车跟驰行为(FB),为明确轨迹在实际场景中的表现,从测试集中选取一段有代表性的组合跟驰行为,评估模型预测精度。研究表
(16) |

图6 DK-Conv-LSTM模型预测跟驰行为对比图
Fig. 6 Comparison of predicted and observed car-following behavior trajectories
此外,超车行为也是混合交通流的典型场景,

图7 DK-Conv-LSTM模型预测超车行为对比图
Fig. 7 Comparison of predicted and observed overtaking trajectories
一些观点认为,神经网络鲁棒性的提升伴随准确率的下降。鲁棒性指在输入、参数、条件被微小改变时,模型保证正常运行能力的特征。现实中扰动可能来自于测量数据的误差或数据收集过程的随机性,研究通过随机噪声或对抗性攻击下维持预测不变性来评估模型的鲁棒性。本研究通过给输入添加的高斯噪声来评估模型的鲁棒性,在每种噪声程度下,模型分别运行5次,

图8 高斯扰动对模型精度的影响分析
Fig. 8 Analysis of the influence of Gaussian perturbation on model error
自动驾驶车辆应当具备预测周围车辆运动趋势的能力,从而合理做出规划决策行为,规避危险场景,提高驾驶安全性和舒适性。高密度混合交通流场景下,交通场景的复杂性、车辆交互的多样性、长时预测的不确定性,使得车辆的轨迹预测是一项具有挑战性的任务。为了混合交通流道路环境下轨迹的高精度预测,本文提出一个领域知识引导的深度学习模型DK-Conv-LSTM用于解决以上挑战,主要研究结论如下:
(1) 为学习弱规则、强交互环境中的车辆行驶轨迹,被预测车信息与周围车辆(含各种类型)的信息被同时输入到DK-Conv-LSTM模型中,模型通过一维卷积结构捕获上下文环境特征,通过LSTM结构预测车辆长、短时轨迹;
(2) 以决策一致性、舒适性和拟人化为目标建立知识函数,通过将领域知识嵌入损失函数的方法,有效地提高DK-Conv-LSTM模型预测精度并且显著降低与实际行为不一致的预测比例;
(3) 结果表明,相比基础的LSTM模型,DK-Conv-LSTM模型短时预测的FDE和ADE分别得到46.81 %和49.08 %的提升,长时预测分别降低横向RMSE 27.44 %,纵向RMSE 29.99 %,并且能够还原出诸如多前车跟驰、超车等非典型的连续性驾驶行为。
本文只对机动车轨迹预测进行了建模和分析验证,高密度混合交通流环境中,非机动车等慢行交通参与者轨迹预测需要进一步整合预测对象的位姿、体态乃至眼神等更多运动参数和特征参数,结合场景理解的知识与数据驱动的模型有望能应对上述挑战,这部分工作正在进行中。
作者贡献声明
刘 晗:模型构建,数据分析,写作。
孙 剑:总体框架,方法论构建,结果讨论。
参考文献
秦严严, 王昊, 王炜, 等. 自适应巡航控制车辆跟驰模型综述[J]. 交通运输工程学报, 2017, 17(3): 121. [百度学术]
QIN Yanyan, WANG Hao, WANG Wei, et al. Review of car-following models of adaptive cruise control[J]. Journal of Traffic and Transportation Engineering, 2017, 17(3): 121. [百度学术]
ASAITHAMBI G, BASHEER S. Analysis and modeling of vehicle following behavior in mixed traffic conditions[J]. Transportation Research Procedia, 2017, 25: 5094. [百度学术]
XIE G, GAO H, QIAN L, et al. Vehicle trajectory prediction by integrating physics- and maneuver-based approaches using interactive multiple models[J/OL]. IEEE Transactions on Industrial Electronics, 2018, 65(7): 5999. DOI:10.1109/TIE.2017.2782236. [百度学术]
ZHANG X, SUN J, QI X, et al. Simultaneous modeling of car-following and lane-changing behaviors using deep learning[J]. Transportation Research Part C: Emerging Technologies, 2019, 104: 287. [百度学术]
CHONG L, ABBAS M M, FLINTSCH A M, et al. A rule-based neural network approach to model driver naturalistic behavior in traffic[J]. Transportation Research Part C: Emerging Technologies, 2013, 32: 207. [百度学术]
PAPATHANASOPOULOU V, ANTONIOU C. Towards an integrated longitudinal and lateral movement data-driven model for mixed traffic[J/OL]. Transportation Research Procedia, 2019, 37: 489. DOI:10.1016/j.trpro.2018.12.214. [百度学术]
KARPATNE A, ATLURI G, FAGHMOUS J H, et al. Theory-guided data science: A new paradigm for scientific discovery from data[J]. IEEE Transactions on knowledge and Data Engineering, 2017, 29(10): 2318. [百度学术]
BAHARI M, NEJJAR I, ALAHI A. Injecting knowledge in data-driven vehicle trajectory predictors[J]. Transportation Research Part C: Emerging Technologies, 2021, 128: 103010. [百度学术]
LIU H, TIAN Y, SUN J, et al. An exploration of data-driven microscopic simulation for traffic system and case study of freeway[J/OL]. Transportmetrica B: Transport Dynamics, 2022. DOI:10.1080/21680566.2022.2064361. [百度学术]
LI X, YING X, CHUAH M C. GRIP: Graph-based interaction-aware trajectory prediction[C/OL]//2019 IEEE Intelligent Transportation SystemsConference (ITSC). 2019: 3960-3966. DOI:10.1109/ITSC.2019.8917228. [百度学术]
RAJU N, ARKATKAR S S, EASA S, et al. Addressing challenges of modeling mixed traffic through machine learning supported with vehicular trajectory data[C]//100th Transportation Research Board meeting. Washington D C, USA: [s.n.], 2020. https://annualmeeting.mytrb.org/OnlineProgram/Details/15864. [百度学术]
CHENG H, SESTER M. Mixed traffic trajectory prediction using lstm–based models in shared space[C]// IGeospatial Technologies for All. Cham: Springer International Publishing, 2018: 309-325. http://link.springer.com/10.1007/978-3-319-78208-9_16. DOI:10.1007/978-3-319-78208-9_16. [百度学术]
CHENG H, LIAO W, YANG M Y, et al. MCENET: multi-context encoder network for homogeneous agent trajectory prediction in mixed traffic[C]// 2020 IEEE 23rd International Conference on Intelligent Transportation Systems (ITSC), Rhodes, Greece:[s.n.], 2020: 1-8. [百度学术]
CHANDRA R, BHATTACHARYA U, BERA A, et al. TraPHic: trajectory prediction in dense and heterogeneous traffic using weighted interactions[C/OL]//2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Long Beach. CA, USA: IEEE, 2019: 8483-8492. https://ieeexplore.ieee.org/document/8954462/. DOI:10.1109/CVPR.2019.00868. [百度学术]
DEO N, TRIVEDI M M. Multi-modal trajectory prediction of surrounding vehicles with maneuver based lstms[C]// 2018 IEEE Intelligent Vehicles Symposium (IV). Changshu, China:[s.n.], 2018: 1179-1184. [百度学术]
DEO N, TRIVEDI M M. Convolutional social pooling for vehicle trajectory prediction[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Workshops. Salt Lake City, UT, USA:IEEE, 2018: 1468-1476. [百度学术]
XIE G, SHANGGUAN A, FEI R, et al. Motion trajectory prediction based on a CNN-LSTM sequential model[J]. Science China Information Sciences, 2020, 63(11): 212207. [百度学术]
WILLARD J, JIA X, XU S, et al. Integrating physics-based modeling with machine learning: A survey[EB/OL]. [2020-03-10]. https://arxiv.org/abs/2003.04919. [百度学术]
SHI R, MO Z, HUANG K, et al. Physics-informed deep learning for traffic state estimation[EB/OL]. [2021-01-17]. https://arxiv.org/abs/2101.06580. [百度学术]
MO Z, SHI R, DI X. A physics-informed deep learning paradigm for car-following models[J]. Transportation Research Part C: Emerging Technologies, 2021, 130: 103240. [百度学术]
BOULTON F A, GRIGORE E C, WOLFF E M. Motion prediction using trajectory sets and self-driving domain knowledge[EB/OL]. [2020-06-08]. https://arxiv.org/abs/2006.04767. [百度学术]
CHOI W, AHN C. Vehicle trajectory prediction with integrating a physics based method and a data-based method[C/OL]//2019 Australian & New Zealand Control Conference (ANZCC). [S.l.]:ANZCC, 2019: 203-203. DOI:10.1109/ANZCC47194.2019.8945695. [百度学术]
RAJU N, ARKATKAR S, EASA S, et al. Customizing the following behavior models to mimic the weak lane based mixed traffic conditions[J/OL]. Transportmetrica B: Transport Dynamics, 2022, 10(1): 20. DOI:10.1080/21680566.2021.1954562. [百度学术]
KANAGARAJ V, ASAITHAMBI G, TOLEDO T, et al. Trajectory data and flow characteristics of mixed traffic[J/OL]. Transportation Research Record, 2015, 2491: 1. DOI:10.3141/2491-01. [百度学术]