领域知识与数据驱动的混合交通流车辆轨迹预测

刘晗，孙剑; LIU Han; SUN Jian

网刊加载中。。。

使用Chrome浏览器效果最佳，继续浏览，你可能不会看到最佳的展示效果，

确定继续浏览么?

复制成功，请在其他浏览器进行阅读

摘要

自动驾驶车辆需具备预测周围车辆轨迹的能力。诸多发展中国家普遍存在弱规则、强交互的混合交通流道路，高密度混合交通流的车辆轨迹预测是极具挑战性的任务。为了兼顾混合交通流道路环境下轨迹预测的高精度和可解释性，设计一个融合领域知识和经验的深度学习模型（DK-Conv-LSTM）实现车辆的长、短时轨迹预测。该模型采用卷积结构（Conv）提取交互特征，并将融合车辆历史信息的特征向量送入长短时记忆网络（LSTM）模型实现轨迹预测。知识经验通过嵌入损失函数的方式引导深度学习模型的训练。与基础的LSTM相比，仅添加卷积层结构的Conv-LSTM模型可提升终点轨迹误差（FDE）约30.46 %，提升平均轨迹误差（ADE）约34.78 %；而DK-Conv-LSTM模型可分别提升FDE 46.81 %和ADE 49.08 %；同时DK-Conv-LSTM模型可还原多前车跟驰、超车行为的驾驶轨迹。

关键词

交通工程; 轨迹预测; 混合交通流; 深度学习模型; 知识

车辆行驶过程中，驾驶员可以自然地完成对周围车的轨迹预判，并做出合理的驾驶决策。为了实现自动驾驶车辆与人类驾驶员的交互协同^［

1］，自动驾驶车也应当具备预测周围车辆运动趋势的能力，从而规避危险场景，安全运行。然而，在高密度混合交通流环境下，车辆运动具有极高的不确定性。具体来说，在众多发展中国家存在大量无明确车道分割线（或即使有车道线但规则意识弱）的共享空间道路，不同类型的机动车与非机动车共享路权，表现出多车并行、多前车跟驰和交错前进等多样化的交通场景^{［参考文献 2

百度学术}2］，相关车辆组成一个相互依赖的整体，个体行为影响彼此的决策。另一方面，交通工程领域也存在跟驰、换道等行为的预测，不同的是，轨迹预测时间分辨率更高（如0.1~0.5 s）且预测范围更广（如3~5 s）。总的来说，在弱规则、强交互混合交通流场景下的车辆轨迹预测是一项具有挑战性的任务。

现有轨迹预测的思路主要有两类：一是基于机理建模的方法^［

3］，二是基于数据驱动的方法^{［参考文献 4-6}4-6］。由于车辆高度非线性的轨迹及车辆间复杂的交互模式，基于机理建模的解析模型精度有限，尤其是长时预测情况；而数据驱动方法难以自动保证输入、输出以及内部状态变量之间建立结构化、可解释的联系，模型预测的结果可能与已知的常识不符^{［参考文献 7

百度学术}7］，比如出现倒车、超出道路边界等情况。因此，研究人员开始探索采用机理分析与数据驱动相融合的科学研究范式，即在算法中融入知识经验对模型的学习过程进行引导。然而，领域知识需要具备以下特征：从驾驶行为中获得的基本规律或经验，能够模型化、数学化以及具有一定的鲁棒性。此外，领域知识与数据驱动模型的结合形式需要进一步研究：现有研究或采用模型串联组合的形式，如采用数据驱动模型完善解析模型的输出^{［参考文献 8

百度学术}8］，或采用假设的数据分布约束数据驱动模型的结果^{［参考文献 9

百度学术}9］等，要以实现在学习过程本身对样本训练进行引导为目标，结合具体内容确定结合形式。

鉴于此，针对高密度混合交通流环境，本文提出一个领域知识引导的卷积‒长短时记忆网络模型（domain-knowledge-guided convolutional long short-term memory， DK-Conv-LSTM），模型输入全方位的环境信息以保证多交互对象的覆盖率，采用卷积结构（convolutional layer）提取多维交互特征，综合本车时序轨迹信息后，采用长短时记忆网络（long short-term memory）模型预测车辆轨迹；将领域知识写入损失函数中引导数据驱动模型的训练过程，提高轨迹长时预测精度和行为表现。

1 研究综述

1.1　轨迹预测

如前文所述，现有研究将驾驶过程视为不同行为的组合，基于个体间具有交互关系的前提假设，认为车辆行为是交互协同的结果^［

10］。特别地，在混合交通流环境中，车辆间的存在各种复杂的交互模式，如多前车跟驰、交错跟驰、并排行驶等，面对车辆高度非线性的轨迹，解析模型通常难以取得令人满意的精度。

数据驱动模型方面，借助先进的机器学习算法和海量数据集，通过数据训练自动地获得预测模型^［

4］。然而，由于缺少广泛的混合交通流数据集，当前研究较少。Chong等^{［参考文献 5

百度学术}5］提出一种基于模糊规则的神经网络模型，能够很好地模拟车辆横、纵两个方向的动作；Raju等^{［参考文献 11

百度学术}11］选择三种机器学习模型和一种深度学习模型建模混合交通条件，深度学习模型在宏、微观表现上均取得最佳效果；Cheng等^{［参考文献 12

百度学术}12］考虑以不同的视野范围刻画不同类型的车辆，提出基于LSTM类的轨迹预测模型；Cheng等^{［参考文献 13

百度学术}13］提出一个多场景编码网络模型（multi-context encoder network， MCENET），编码过去和未来的场景、交互和运动信息，预测车辆的轨迹；Chandra等^{［参考文献 14

百度学术}14］提出卷积神经网络（convolutional neural networks， CNN）与LSTM的新型组合结构实现混合环境下的车辆轨迹预测。

尽管数据驱动模型在精度上优于解析模型，但在建模过程仍有问题需要解决。在弱规则、强交互场景下，车辆运动受多重耦合因素影响，因此需要提取更多的特征作为模型输入，比如增加历史信息，考虑场景信息，增加交互车的数量^［

15］，增加运动特征^{［参考文献 13

百度学术}13］等。但是，特征间存在潜在的多重共线性，高维度特征会增加模型训练的难度。已有的研究提出了各种方法识别关键特征，比如Raju等^{［参考文献 11

百度学术}11］提出训练前采用斯皮尔曼相关性分析的方法为横纵向运动各选取8个重要特征；然而这是一种基于统计的特征选择方法，可能会丢失数据上不显但具有重要物理意义的信息。还有一种通过组合属性间关系的降维方法，通常在机器学习模型的训练过程中同步实现，比如Deo等^{［参考文献 16

百度学术}16］提出社会池化层编码环境车的历史运动；Xie等^{［参考文献 17

百度学术}17］提出卷积长短时记忆网络（CNN-LSTM）模型结构预测NGSIM数据集轨迹，其中卷积神经网络（CNN）用于提取特征。经研究表明，后一种特征提取方式更有利于深度学习模型的训练。

总而言之，相比机理解析方法，数据驱动方法具有更高的预测精度，采取有效的特征处理方法能够进一步提高模型性能。

1.2　数据驱动模型与知识结合

受限于数据驱动方法本身的局限性，数据驱动模型难以自动保证输入、输出以及内部状态变量之间结构化、可解释的联系，预测的结果可能与实际不符^［

7］；另一方面，领域知识或经过严格数学论证，或在长期生产实践中形成，具有巨大的实际指导价值。因此，研究人员开始探索领域知识与数据驱动相融合的科学研究范式。

Willard等^［

18］以研究目标和研究方法为轴综述了这两类研究方法的融合实例，研究主要集中在物理和控制领域。在交通领域，Shi等^{［参考文献 19

百度学术}19］采用交叉技术实现了交通状态的估计；Mo等^{［参考文献 20

百度学术}20］通过以跟驰模型修改损失函数的方式实现了快速路上的短时（<1 s）轨迹预测；Bahari等^{［参考文献 8

百度学术}8］提出以对物理模型的残差建模以校正误差的结合方式，提高环形交叉口轨迹预测的精度；Boulton等^{［参考文献 21

百度学术}21］提出惩罚越界的辅助损失函数和获轨迹空间关系的加权交叉熵分类损失函数进行运动预测；Choi等^{［参考文献 22

百度学术}22］提出对不同的模型结果进行权重组合来提高长时预测的精度。尽管领域知识与数据驱动模型的融合方式已经有一些突破性的工作，但是领域知识的获取和编码还有待进一步探讨。这里的“知识”不简单指数据服从何种分布的假设，或者先验概率的假设，而是指驾驶行为的基本规律或在实践中获得的经验，可编码的知识、可感知的知识、暗知识以及常识性的知识，要求能够模型化、数学化，最重要的是对学习过程本身进行引导，能够推广应用且适应环境的变化。现阶段，解析类的混合交通流模型多为机动车模型的拓展，关注不同类型车辆行为的差异^{［参考文献 2

百度学术}2］或车辆的横向运动^{［参考文献 23

百度学术}23］，然而受限于数学公式本身有限的表达能力，其对于数据驱动模型的“改良”可靠性不足。

总的来说，领域知识与模型结合的关键在于有效编码领域知识并实现对学习过程本身的引导。

2 问题描述

在亚洲的众多发展中国家，高密度混合交通流在城市道路中广泛存在，如图1所示。本文只考虑机动车与非机动车的混合场景，行人运动不做考虑。

图1 研究路段场景与交互类型示意图

Fig. 1 Screenshots of study area and its schematic diagram

这类场景的典型特征是道路弱规则、对象强交互，具体表现为：道路上无车道分割，各种类型的车辆共享道路空间，道路使用者也多不受规则的约束、以占据前方任何的可行空间为原则行驶，出现了很多非典型的交通场景，比如图1中圈A所示的与前车错位寻求视野的交错跟驰（staggered following， SF），如图1中圈B所示的不只有一辆引导车的双前车跟驰（following between two vehicles， FB）和横向并排行驶（如图1中圈C所示）等。另一方面，不同类型的车辆在动力性和机动性上存在差异^［

24］：小汽车具有更高的动力性，而摩托车在机动性上表现更好，大尺寸车辆更容易受到周围车辆的限制。综上，该场景下车辆的运动是多重交互对象和弱规则道路环境共同影响的结果，不同类型交互对象进一步增加了车辆轨迹的不确定性，使得轨迹预测成为一项极具挑战的任务。

3 模型框架

为了实现弱规则、强交互场景下混合交通流车辆的轨迹预测，提出DK-Conv-LSTM模型，如图2所示：模型包含数据驱动和领域知识两部分：数据驱动部分又划分为两阶段，首先是卷积结构捕获车辆交互特征，后利用深度学习模型预测车辆轨迹，由于车辆运动方向（纵向）和垂直于车辆运动方向（横向）具有不同的运动参数分布和控制目标，模型采用分支结构分别预测两方向轨迹；领域知识通过嵌入损失函数的方式实现，横向以决策表现一致性为目标、纵向以驾驶舒适性及拟人化为目标设计知识损失，以帮助模型捕获通用的动态模式。

图2 领域知识引导的卷积-长短时记忆网络模型

Fig. 2 High-level picture of DK-Conv-LSTM model

3.1　数据驱动模型部分

下面具体介绍模型的输入输出及长短时记忆网络模型（LSTM）结构。

3.1.1　模型的输入输出

要实现对周围车的轨迹预测，需要考虑车辆间连续的交互，则模型输入应当同时包括被预测车辆历史向量和上下文环境历史向量。为了与损失函数的参数匹配，减少多重共线性的问题，选用速度向量表征被预测车的信息。上下文环境信息指的是影响车辆运动的众多外界因素，包括道路，交通规则，动态交互对象等，由于本研究场景道路规则简单，因此假设动态交互对象是最重要的影响因素，对检测空间内车辆的相互关系进行编码。检测空间指的是以车辆相对距离为指标划定的固定空间，假设该空间内包含所有的交互对象。根据周边视觉的相关研究，以视野半径 $R_{i}$ 的圆形与道路的交集为范围划定检测空间，以车辆为中心，以60°为界将检测空间划分5个空间（后方合并），如图3所示。由于混合交通流中存在诸多非典型跟驰行为，为保证多交互对象的覆盖度，因此在前、后三个空间（1，2，5）内各取 $2 n$ 辆车，在左右空间（3，4）内各取 $n$ 辆车。

图3 检测空间范围和交互车辆

Fig. 3 Detection zone and interactive vehicles

此外，为考虑驾驶行为的连续性和记忆效应，将持续 $T_{p}$ 时长的历史数据作为模型的输入，则输入变量表示为

I^{(t)} = \{S^{(t)}, E^{(t)}\}, t \in [T - T_{p}, \dots, T - 1, T]

（1）

式中： $S^{(t)}$ 表示被预测车辆的历史信息； $E^{(t)}$ 表示上下文环境的历史信息； $T_{p}$ 为历史时域（输入轨迹的长度）。具体而言，被预测车的历史信息包括 $S^{(t)} = \{v^{t}\}$ ，式中 $v^{t}$ 为预测车的速度；上下文环境信息包括检测空间内 $n$ 辆车的历史状态信息，表示为 $E^{(t)} = {S_{s 1}^{(t)}, S_{s 2}^{(t)}, \dots, S_{s n}^{(t)}}$ 。除轨迹外，相对位置，相对速度等参数也是描述车辆行为及交互运动的常用参数，不同类型车辆的运动特征有显著差异，因此相对位置、相对速度和车辆类型被选为上下文环境信息的表征变量，表示为 $S_{s i}^{(t)} = {∆ x_{i}^{(t)}, ∆ v_{i}^{(t)}, V_{t y}}$ ，式中， $∆ x_{i}^{(t)}$ 为车辆 $i$ 与被预测车辆的相对距离， $∆ v_{i}^{(t)}$ 为车辆 $i$ 与被预测车辆的相对速度， $V_{t y}$ 为车辆 $i$ 的类别编码。由于不同类型车辆的差异主要表现在车辆尺寸（车长 $l$ ，车宽 $d$ ）、动力性（质量 $m$ ），机动性（体积 $v o l$ ）等方面，且以对环境的影响程度为标准，几个指标近似地现正比关系，可简化地用车辆的尺寸乘积比为车辆类别编码，即 $V_{t y} = l_{i} \cdot d_{i} / \sum l_{i} \cdot d_{i}$ ，式中 $l_{i}$ 为车辆 $i$ 的长度， $d_{i}$ 为车辆 $i$ 的宽度。

仅考虑上下文环境信息就包括 $8 n$ 辆车，超过 $40 n$ 的特征变量，这其中不可避免地包含与任务仅有微弱相关性的特征、冗余特征甚至是噪声，严重阻碍模型训练。采用1维卷积结构（1-D convolutional layer， Conv1D）可以高效提取车辆间交互作用特征^［

17］，因此，模型首先将上下文环境向量

E^{(t)}

进行卷积计算，再与被预测车辆向量

S^{(t)}

整合送入擅长处理时间递归任务的LSTM中预测轨迹。

模型输出为结构相同、权重参数不同的两分支结构，与模型输入相对应，模型的输出为被预测车的速度，用 $T_{f}$ 表示预测时域，则输出表示为

O^{(t)} = \{v^{(t)}\}, t = (T + 1, \dots, T + T_{f})

（2）

式中： $v^{(t)} = {{v_{x}}^{(t)}, {v_{y}}^{(t)}}$ ； ${v_{x}}^{(t)}$ 为垂直运动方向（横向运动方向）速度； ${v_{y}}^{(t)}$ 为运动方向（纵向运动方向）速度。

3.1.2　长短时记忆网络模型（LSTM）

LSTM网络模型作为一种特殊的循环神经网络模型，在序列预测任务中具备天然的优势。LSTM模型的关键是细胞状态 $C_{t}$ ，用来保存当前LSTM的状态信息并传递到下一时刻，细胞状态可通过三个不同的门结构添加或移除信息，即遗忘门，读取上一个细胞状态传递来的信息 $h_{t - 1}$ 和输入 $X_{t}$ ，并决定丢弃什么信息；输入门，从输入 $X_{t}$ 中捕捉信息，并更新细胞状态；输出门，根据细胞状态确定输出信息 $h_{t}$ 。各门结构表示如下：

遗忘门

f_{t} = σ (W_{f x} X_{t} + W_{f h} h_{t} + b_{f})

（3）

输入门

i_{t} = σ (W_{i x} X_{t} + W_{i h} h_{t - 1}] + b_{i})

（4）

{\tilde{C}}_{t} = t a n h (W_{\tilde{C x}} X_{t} + W ̃_{\tilde{C h}} h_{t - 1} + b_{\tilde{C}})

（5）

输出门

o_{t} = σ (W_{o x} X_{t} + W_{o h} h_{t - 1} + b_{o})

（6）

h_{t} = o_{t} * t a n h (C_{t})

（7）

式（3）—（7）中： $X_{t}$ 是 $t$ 时刻的输入数据； $C_{t}$ 是 $t$ 时刻的隐藏状态。变量 $f, i, C$ 分别标记遗忘门，输入门和细胞状态变量。 $σ$ 代表标准逻辑 $s i g m o i d$ 函数；参数 $W_{j} (j = f x, f h, i x, i h, \tilde{C x}, \tilde{C h}, o x, o h)$ 代表每层的权重矩阵， $b_{j} (j = f, i, \tilde{c}, o)$ 为每个门结构的偏差。

为了避免出现信息瓶颈和过拟合现象，LSTM模型后连接Dropout层，最后通过全连接层（fully connected layer， FC）将特征映射到输出空间。

3.2　知识表示与嵌入

为了实现知识经验对学习算法进行指导，做法是当算法沿着正确的方向挖掘规律时予以肯定、强化，反之则进行纠正、弱化。对应到数据驱动模型中，损失函数的作用是衡量模型的输出值 $\hat{y}$ 与真实值 $y$ 之间的差距，因此，考虑驾驶的效率和舒适性的要求，将不符合驾驶行为规律的行为公式化，并添加到损失函数中作为先验知识，可以实现对模型优化方向的指导。

此外，由于车辆横向运动的幅度和可预测性都远低于纵向运动，在建模时往往被忽略。然而在混合多交互环境中，车辆的横向运动与超车、避让、随机波动等行为变化息息相关^［

11］，车辆间的交互同时体现在横、纵两个方向的轨迹上。因此，本文将分别讨论横、纵向运动的损失函数形式。

（1）横向损失函数

速度是描述驾驶行为的重要指标，横向速度的方向变化可能是与交互对象交换决策的结果，也可能是交互对象变更的标志^［

6］，因此，通过约束速度方向可在维护弱规则下车辆自由度的同时明确车辆的决策行为。本研究定义混合损失函数为经验误差和知识误差的加权和，见式（8）。其中经验误差为预测值与观察值的均方误差，见式（9）；知识误差表示为速度方向乘积的符号函数的均值，见式（10），目标是增加方向预测错误的样本损失值，以纠正模型优化方向。

a r g m i n γ_{0} L o s s_{e} (x, \hat{x}) + γ_{1} L o s s_{d} (x, \hat{x})

（8）

L o s s_{e} = \frac{1}{N} \sum_{i = 1}^{N} {(\hat{x} - x)}^{2}

（9）

L o s s_{d} = - \frac{1}{N} \sum_{i = 1}^{N} s i g n (\hat{x} \cdot x)

，

s i g n (x) = \{\begin{matrix} 1, x > 0 \\ 0, x = 0 \\ - 1, x < 0 \end{matrix}

（10）

式（8）—（10）中： $γ_{0}, γ_{1}$ 为权重系数； $\hat{x}$ 表示横向速度的模型预测值； $x$ 为横向速度观测值； $N$ 为样本数； $s i g n$ 为符号函数，输出变量的符号。

（2）纵向损失函数

纵向以速度表征运动效率，以加速度表征驾驶的舒适性。纵向速度的损失函数包括两部分，如式（11），第一部分经验误差为预测速度与观察速度的均方误差，即式（12）；第二部分，将超出加速度阈值的部分定义为异常加速度，则知识误差为异常加速度的均方误差，目标是通过提高异常加速度的误差部分样本权重，引导模型训练向大误差样本倾斜来提高误差下降效率。

a r g m i n γ_{0} L o s s_{e} (y, \hat{y}) + γ_{1} L o s s_{d} (y, \hat{y})

（11）

L o s s_{e} = \frac{1}{N} \sum_{i = 1}^{N} {(\hat{y} - y)}^{2}

（12）

L o s s_{d} = \{\begin{matrix} \frac{1}{M} \sum_{i = 1}^{M} {(\hat{y} - y)}^{2}, 若 |\hat{y} - y| > ∆ y \\ 0, 否则 \end{matrix}

（13）

式（11）—（13）中： $γ_{0}, γ_{1}$ 为权重系数； $\hat{y}$ 为纵向速度的模型预测值； $y$ 为纵向速度的观测值； $∆ y$ 为加速度阈值， $M$ 为符合条件的样本个数。

4 实验与结果分析

4.1　数据集及实验准备

本研究采用Kanagaraj等^［

24］公开的混合交通流数据集用于模型的训练、验证和测试。该路段宽约11.2 m，长245 m，全程无道路标线，包含摩托车、小汽车、公交车、货车、轻型商用车和机动三轮车在内的6种车型。数据集约30 min，采样频率20 Hz，数据集已完成平滑和异常值处理，对4 199（3.73 %）的碰撞记录执行删除操作，以小汽车为被预测对象，最终提取到27 450条序列。选取持续5 s的历史轨迹数据，预测未来3 s的速度，为最大限度利用数据，采用滑动时窗方法提取了18 650个样本。按照8：1：1的比例将数据集划分训练集、验证集和测试集。

在进行模型训练前，进行数据预处理工作。具体包括对于定性数据手动编码，根据车辆尺寸的乘积比为车辆类别编码，则摩托车、小汽车、公交车、货车、轻型商用车、机动三轮车的类型编码分别为0.014，0.100，0.449，0.203，0.186，0.048；对定量数据进行均值归一化，包括速度、相对速度、相对距离。其中，均值归一化指数据与均值的差值与数据最大值与最小值的差值的比例，将结果映射到 $[- 1, 1]$ ，可以减小样本数据的波动，提高梯度下降的速度。

4.2　模型训练

本研究开展对照实验探究DK-Conv-LSTM模型各部分性能。研究设置LSTM模型作为基准模型；设置只保留卷积层和LSTM结构的对照组1 （Conv-LSTM）用来验证卷积层的特征提取的性能；设置领域知识注入的模型作为对照组2 （DK-Conv-LSTM），用于验证领域知识对模型的改善作用。

本研究采用自动调参方法随机搜索方法确定模型超参数，最终参数设置如下：1维卷积的两层核数目分别为25和10，激活函数为Relu；与本车特征通过串联函数（concatenate）整合后通过两层LSTM层，神经元个数选择350，后通过全连接层（FC）输出，激活函数选择tanh；训练批次64，训练轮次200。为了避免出现信息瓶颈和过拟合现象，卷积层后接一层批标准化层（batch normalization）；LSTM层后采用丢弃率0.2的Dropout层， $L_{1} = 0.01, L_{2} = 0.001$ 的正则化系数，采用Adam优化器，学习率为1×10^-3。横向损失函数的权重系数取 $γ_{0} = 0.8, γ_{1} = 0.2$ ，纵向损失函数的权重系数取 $γ_{0} = 0.3, γ_{1} = 0.7$ ，加速度阈值范围为 $[- 4.37, 4.44] m \cdot s^{- 2}$ 。

4.3　轨迹预测精度分析

选择终点轨迹误差（final displacement error， FDE）和平均轨迹误差（average displacement error， ADE）两个指标，对比以下三个模型在短时（ $T_{f} =$ 1 s）预测的精度。选择均方根误差（root mean square error， RMSE）为指标，评估长时（ $T_{f} = 3 s$ ）预测的精度。

FDE指的是最终时间戳（ $t = T_{p}$ ）处的预测位置与实际最终位置之间的欧式距离，见式（14）；ADE指的是在所有预测范围内，预测轨迹与真实轨迹的平均欧式距离，见式（15）。

F D E = \frac{1}{N} \sum_{n \in N} {‖S_{t}^{(n)} - {\hat{S}}_{t}^{(n)}‖}_{2},

t = T_{p}

（14）

A D E = \frac{1}{N \cdot T} \sum_{n \in N} \sum_{t \in T} {‖S_{t}^{(n)} - {\hat{S}}_{t}^{(n)}‖}_{2}

（15）

式（14）—（15）中： $N$ 为样本数； $T$ 为预测时长； $S_{t}^{(n)}$ 、 ${\hat{S}}_{t}^{(n)}$ 分别为时间 $t$ 时刻 $n$ 个样本的真实位置和预测位置； $T_{p}$ 为最终预测位置对应时间。

表1展示三个模型在1 s短时预测时的模型误差。其中，LSTM模型的误差最高，归功于卷积层的特征提取功能，Conv-LSTM的误差只有为LSTM模型的65 %（ADE）和69 %（FDE）；进一步地，由于领域知识的融入，DK-Conv-LSTM模型误差进一步降低到LSTM模型的51 %（ADE）和53 %（FDE）。

表1 误差与训练时间对比表

Tab. 1 Comparison of errors and training time

	ADE/m	FDE/m	训练时间/min
LSTM	0.615	0.798	4.60
Conv-LSTM	0.401	0.555	19.55
DK-Conv-LSTM	0.313	0.425	23.88

由于模型规模的加深加宽，模型的训练过程需要大量的时间和计算资源。实验平台是一台配置3.3GHz的Intel Core i9处理器，64 GB的内存和1块NVDIA RTX 2080显卡的主机，表1展示的是经过5次训练后的平均训练时长。模型的训练时长随模型误差的降低而增加，是模型结构复杂度和参数数量导致的。和次优模型Conv-LSTM相比，DK-Conv-LSTM模型以训练时间22 %的增加，获得ADE约22 %的提升。尽管DK-Conv-LSTM模型当前的计算效率并不优秀，但是效率会随着算力及并行计算等技术的应用而有所改善。

为描述模型在长时预测上的表现，本研究以0.5 s为间隔，详细比较了预测时长为3 s时横、纵两个方向的轨迹误差。图4展示的是三个模型在横、纵两个运动方向的误差柱状对比图，横坐标表示预测时长，纵坐标为轨迹的RMSE值，柱上百分比表示相较于LSTM模型误差的下降比例。

图4 多时段模型均方根误差对比（单位：m）

Fig. 4 Comparison of RMSE at multiple intervals of different models （unit: m）

由图4a可知，随预测时长增加，模型误差增加，可见距离预判时间点越近，轨迹预测精度越高。通过Conv-LSTM和LSTM对比，卷积层结构对交互车信息的提取有利于模型学习和训练；在全时段DK-Conv-LSTM的误差值总是最小，可推测优化的损失函数进一步提高了模型精度。值得注意的是，DK-Conv-LSTM相比LSTM的误差下降比例随时间波动较小，这体现了DK-Conv-LSTM在轨迹的长时预测任务中的优越性。

图4b是纵向运动方向的误差柱状图，其基本规律与横向运动保持一致。尽管纵向运动的绝对误差约为横向运动的10倍，但是DK-Conv-LSTM模型的横、纵向误差下降比例几乎是一致的，即模型同时保证了横、纵两个方向的模拟，这是模型为横、纵两方向分别设立网络结构和损失函数的效果。

4.4　轨迹预测场景分析

为进一步展示模型性能的改善，本文从运动方向一致性和轨迹精度两个维度评估3个模型的表现。图5横坐标为横向速度方向与实际方向不一致的样本比例，纵坐标为轨迹的ADE。由图可见，DK-Conv-LSTM在两个指标下均取得最佳。Conv-LSTM的卷积结构旨在提高预测精度，间接提高了行为一致性；而DK-Conv-LSTM模型通过改进损失函数的方法明确降低轨迹的非一致性误差，进一步提高预测轨迹的精度。

图5 车辆横向运动一致性（X坐标）与预测精度（Y坐标）关系的模型对比图

Fig. 5 Relationship between consistency in lateral direction and prediction accuracy

如第2节所述，混合交通流中存在非典型的跟驰行为，比如与前车错位寻求视野的交错跟驰行为（SF）、不只有一辆引导车的双前车跟驰行为（FB），为明确轨迹在实际场景中的表现，从测试集中选取一段有代表性的组合跟驰行为，评估模型预测精度。研究表明^［

2］，前后车间的重叠程度可以用来辨别跟驰类型，当确认跟驰车辆对后，可以根据重叠率指标描述车辆的重叠程度，如式（16），重叠率（

R_{o v}

）定义为前后车横向重叠宽度（

W_{o v}

）与跟驰车宽度（

W_{d}

）的比值。若重叠率>50 %，两车为跟驰，否则为交错跟驰；若有两辆前车，则为双前车跟驰。

R_{o v} = \frac{W_{o v}}{W_{d}} \times 100 %

（16）

图6a展示了黑色轨迹车跟驰的场景，其中纵坐标为车辆运动方向，标记点处的数字为时间戳；结合图6b可根据跟驰车相对两前车的重叠率柱状图识别不同的跟驰阶段，图示黑色轨迹车在85 s前交错跟驰1号前车，85 s后跟驰1号、2号双前车。图6c为实际轨迹与预测轨迹的对比图，预测3.0 s误差ADE为0.105 m。得益于模型正前方视角划分两个空间检测4辆车的设计，模型能够捕捉到完整的多前车跟驰现象，同时对环境车辆的相对位置和类型的编码，也将车辆的重叠程度特征显式地输入到模型中；从DK-Conv-LSTM模型的预测结果来看，整体误差较小，能够较好地学习到驾驶行为规律，且模型具有一定的泛化性，能够适应不同场景下的车辆行为组合。

图6 DK-Conv-LSTM模型预测跟驰行为对比图

Fig. 6 Comparison of predicted and observed car-following behavior trajectories

此外，超车行为也是混合交通流的典型场景，图7为超车场景中两车的连续轨迹，图7a记录了黑色轨迹所在车从前车的左后方超越至右前方的完整过程；图7b为的实际轨迹与预测轨迹的对比图，预测时长3 s的误差ADE为0.116 m。归功于LSTM网络处理长时间序列的优势，DK-Conv-LSTM模型延续了车辆在历史轨迹中的横向偏移，又因为损失函数中知识误差的约束作用，模型准确预测到车辆纵向超越前车后横向返回原位置的趋势。

图7 DK-Conv-LSTM模型预测超车行为对比图

Fig. 7 Comparison of predicted and observed overtaking trajectories

4.5　模型鲁棒性分析

一些观点认为，神经网络鲁棒性的提升伴随准确率的下降。鲁棒性指在输入、参数、条件被微小改变时，模型保证正常运行能力的特征。现实中扰动可能来自于测量数据的误差或数据收集过程的随机性，研究通过随机噪声或对抗性攻击下维持预测不变性来评估模型的鲁棒性。本研究通过给输入添加 $μ = 0, σ \in [0.05, 0.5]$ 的高斯噪声来评估模型的鲁棒性，在每种噪声程度下，模型分别运行5次，图8展示了三种模型ADE的变化情况，其中用实线表示均值，浅色阴影表示在95 %置信水平下的误差范围。从图中可见，三条曲线几乎都是平的，仅有小幅度上升，说明高斯噪声对模型的精度影响有限；在同等干扰程度下，Conv-LSTM的误差上升程度和波动性都是最大的，而DK-Conv-LSTM实现了远高于LSTM的精度和近乎相当的鲁棒性。因此，融合领域知识的建模方式在维持模型鲁棒性的同时提升了模型精度。

图8 高斯扰动对模型精度的影响分析

Fig. 8 Analysis of the influence of Gaussian perturbation on model error

5 结论

自动驾驶车辆应当具备预测周围车辆运动趋势的能力，从而合理做出规划决策行为，规避危险场景，提高驾驶安全性和舒适性。高密度混合交通流场景下，交通场景的复杂性、车辆交互的多样性、长时预测的不确定性，使得车辆的轨迹预测是一项具有挑战性的任务。为了混合交通流道路环境下轨迹的高精度预测，本文提出一个领域知识引导的深度学习模型DK-Conv-LSTM用于解决以上挑战，主要研究结论如下：

（1）为学习弱规则、强交互环境中的车辆行驶轨迹，被预测车信息与周围车辆（含各种类型）的信息被同时输入到DK-Conv-LSTM模型中，模型通过一维卷积结构捕获上下文环境特征，通过LSTM结构预测车辆长、短时轨迹；

（2）以决策一致性、舒适性和拟人化为目标建立知识函数，通过将领域知识嵌入损失函数的方法，有效地提高DK-Conv-LSTM模型预测精度并且显著降低与实际行为不一致的预测比例；

（3）结果表明，相比基础的LSTM模型，DK-Conv-LSTM模型短时预测的FDE和ADE分别得到46.81 %和49.08 %的提升，长时预测分别降低横向RMSE 27.44 %，纵向RMSE 29.99 %，并且能够还原出诸如多前车跟驰、超车等非典型的连续性驾驶行为。

本文只对机动车轨迹预测进行了建模和分析验证，高密度混合交通流环境中，非机动车等慢行交通参与者轨迹预测需要进一步整合预测对象的位姿、体态乃至眼神等更多运动参数和特征参数，结合场景理解的知识与数据驱动的模型有望能应对上述挑战，这部分工作正在进行中。

作者贡献声明

刘晗：模型构建，数据分析，写作。

孙剑：总体框架，方法论构建，结果讨论。

参考文献

秦严严，王昊，王炜，等. 自适应巡航控制车辆跟驰模型综述［J］. 交通运输工程学报， 2017， 17（3）： 121. [百度学术]

QIN Yanyan， WANG Hao， WANG Wei， et al. Review of car-following models of adaptive cruise control［J］. Journal of Traffic and Transportation Engineering， 2017， 17（3）： 121. [百度学术]

ASAITHAMBI G， BASHEER S. Analysis and modeling of vehicle following behavior in mixed traffic conditions［J］. Transportation Research Procedia， 2017， 25： 5094. [百度学术]

XIE G， GAO H， QIAN L， et al. Vehicle trajectory prediction by integrating physics- and maneuver-based approaches using interactive multiple models［J/OL］. IEEE Transactions on Industrial Electronics， 2018， 65（7）： 5999. DOI：10.1109/TIE.2017.2782236. [百度学术]

ZHANG X， SUN J， QI X， et al. Simultaneous modeling of car-following and lane-changing behaviors using deep learning［J］. Transportation Research Part C： Emerging Technologies， 2019， 104： 287. [百度学术]

CHONG L， ABBAS M M， FLINTSCH A M， et al. A rule-based neural network approach to model driver naturalistic behavior in traffic［J］. Transportation Research Part C： Emerging Technologies， 2013， 32： 207. [百度学术]

PAPATHANASOPOULOU V， ANTONIOU C. Towards an integrated longitudinal and lateral movement data-driven model for mixed traffic［J/OL］. Transportation Research Procedia， 2019， 37： 489. DOI：10.1016/j.trpro.2018.12.214. [百度学术]

KARPATNE A， ATLURI G， FAGHMOUS J H， et al. Theory-guided data science： A new paradigm for scientific discovery from data［J］. IEEE Transactions on knowledge and Data Engineering， 2017， 29（10）： 2318. [百度学术]

BAHARI M， NEJJAR I， ALAHI A. Injecting knowledge in data-driven vehicle trajectory predictors［J］. Transportation Research Part C： Emerging Technologies， 2021， 128： 103010. [百度学术]

LIU H， TIAN Y， SUN J， et al. An exploration of data-driven microscopic simulation for traffic system and case study of freeway［J/OL］. Transportmetrica B： Transport Dynamics， 2022. DOI：10.1080/21680566.2022.2064361. [百度学术]

LI X， YING X， CHUAH M C. GRIP： Graph-based interaction-aware trajectory prediction［C/OL］//2019 IEEE Intelligent Transportation SystemsConference （ITSC）. 2019： 3960-3966. DOI：10.1109/ITSC.2019.8917228. [百度学术]

RAJU N， ARKATKAR S S， EASA S， et al. Addressing challenges of modeling mixed traffic through machine learning supported with vehicular trajectory data［C］//100th Transportation Research Board meeting. Washington D C， USA：［s.n.］， 2020. https：//annualmeeting.mytrb.org/OnlineProgram/Details/15864. [百度学术]

CHENG H， SESTER M. Mixed traffic trajectory prediction using lstm–based models in shared space［C］// IGeospatial Technologies for All. Cham： Springer International Publishing， 2018： 309-325. http：//link.springer.com/10.1007/978-3-319-78208-9_16. DOI：10.1007/978-3-319-78208-9_16. [百度学术]

CHENG H， LIAO W， YANG M Y， et al. MCENET： multi-context encoder network for homogeneous agent trajectory prediction in mixed traffic［C］// 2020 IEEE 23rd International Conference on Intelligent Transportation Systems （ITSC）， Rhodes， Greece：［s.n.］， 2020： 1-8. [百度学术]

CHANDRA R， BHATTACHARYA U， BERA A， et al. TraPHic： trajectory prediction in dense and heterogeneous traffic using weighted interactions［C/OL］//2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition （CVPR）. Long Beach. CA， USA： IEEE， 2019： 8483-8492. https：//ieeexplore.ieee.org/document/8954462/. DOI：10.1109/CVPR.2019.00868. [百度学术]

DEO N， TRIVEDI M M. Multi-modal trajectory prediction of surrounding vehicles with maneuver based lstms［C］// 2018 IEEE Intelligent Vehicles Symposium （IV）. Changshu， China：［s.n.］， 2018： 1179-1184. [百度学术]

DEO N， TRIVEDI M M. Convolutional social pooling for vehicle trajectory prediction［C］//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Workshops. Salt Lake City， UT， USA：IEEE， 2018： 1468-1476. [百度学术]

XIE G， SHANGGUAN A， FEI R， et al. Motion trajectory prediction based on a CNN-LSTM sequential model［J］. Science China Information Sciences， 2020， 63（11）： 212207. [百度学术]

WILLARD J, JIA X, XU S, et al. Integrating physics-based modeling with machine learning: A survey[EB/OL]. [2020-03-10]. https://arxiv.org/abs/2003.04919. [百度学术]

SHI R， MO Z， HUANG K， et al. Physics-informed deep learning for traffic state estimation［EB/OL］. [2021-01-17]. https://arxiv.org/abs/2101.06580. [百度学术]

MO Z， SHI R， DI X. A physics-informed deep learning paradigm for car-following models［J］. Transportation Research Part C： Emerging Technologies， 2021， 130： 103240. [百度学术]

BOULTON F A， GRIGORE E C， WOLFF E M. Motion prediction using trajectory sets and self-driving domain knowledge［EB/OL］. [2020-06-08]. https://arxiv.org/abs/2006.04767. [百度学术]

CHOI W， AHN C. Vehicle trajectory prediction with integrating a physics based method and a data-based method［C/OL］//2019 Australian & New Zealand Control Conference （ANZCC）. ［S.l.］：ANZCC， 2019： 203-203. DOI：10.1109/ANZCC47194.2019.8945695. [百度学术]

RAJU N， ARKATKAR S， EASA S， et al. Customizing the following behavior models to mimic the weak lane based mixed traffic conditions［J/OL］. Transportmetrica B： Transport Dynamics， 2022， 10（1）： 20. DOI：10.1080/21680566.2021.1954562. [百度学术]

KANAGARAJ V， ASAITHAMBI G， TOLEDO T， et al. Trajectory data and flow characteristics of mixed traffic［J/OL］. Transportation Research Record， 2015， 2491： 1. DOI：10.3141/2491-01. [百度学术]

领域知识与数据驱动的混合交通流车辆轨迹预测 PDF

摘要

关键词

1 研究综述

1.1 轨迹预测

1.2 数据驱动模型与知识结合

2 问题描述

3 模型框架

3.1 数据驱动模型部分

3.2 知识表示与嵌入