网刊加载中。。。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

基于深度学习的城市快速路交通拥堵点段车辆路径溯源  PDF

  • 张锋鑫 1,2
  • 陈思曲 3
  • 徐大林 4
  • 唐克双 1
  • 张政 4
1. 同济大学 道路与交通工程教育部重点实验室,上海201804; 2. 连云港杰瑞电子有限公司,江苏 连云港 222061; 3. 厦门市国土空间和交通研究中心 厦门规划展览馆,福建 厦门361012; 4. 江苏自动化研究所,江苏 连云港 222061

中图分类号: U491.1+11

最近更新:2025-03-21

DOI:10.11908/j.issn.0253-374x.23235

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
EN
目录contents

摘要

为突破既有研究将交通拥堵溯源问题简化为路径流量估计或拥堵关联分析的局限,构建一个更全面有效的城市快速路交通拥堵点段车辆路径溯源体系,以路径为基本分析单元,构建融合路径流量估计与拥堵关联分析的统一框架,并提出基于路径的可变形卷积长短期记忆神经网络(RSDC-LSTM)方法。该模型包含3个核心模块:基于历史路径流量数据与短时预测数据构建路径状态特征集;通过多路径卷积长短期记忆网络与软注意力机制的协同建模,量化各路径对交通拥堵的动态影响权重;采用可变形卷积神经网络捕捉拥堵点段的空间拓扑关联特征,实现时空双维度的路径重要性评估。实证研究表明,RSDC-LSTM 能有效识别交通拥堵关键路径并建立影响度排序。通过对前10%高影响路径实施调控,可实现行程速度峰值提升23.36%,停车次数与延误时间最大降幅分别达 29.41% 与 43.82%。RSDC-LSTM 方法为动态交通管控策略制定提供了可量化的决策依据,有助于提升城市快速路的交通运行效率。

随着我国城镇化和机动化进程的快速推进,城市交通供需矛盾日益突出。据百度地图发布的《2022中国主要城市交通报告》,城市居民一天在上下班交通中浪费的总时间高达10亿h,2022年全国百城单程平均通勤时耗均超过35min

1。快速路是城市道路的主要骨架和动脉,快速路系统以低于10%的道路资源占比承载了20%~50%的城市交通2,故缓解快速路交通拥堵是城市交通拥堵治理的重要一环。交通拥堵溯源是为了探究拥堵的成因与根源,现有溯源方法主要分为路径流量估计与拥堵关联性分析2类。

路径流量估计通过分析交通数据并建立模型预测道路上不同路径的交通流量,路径流量估计是流量预

3的一个重要组成部分,其方法进一步细分为解析类方法和机器学习类方4。解析类方法有Van Zuylen和Willumsen为了获取最贴近实际的出行起点—终点(origin—destination,OD)矩阵,首先根据路径流量生成初始OD矩阵,然后采用信息最小化和熵最大化方法更新OD矩5。曹6通过稀疏AVI轨迹数据提取路径,并考虑通过全样本AVI轨迹数据提取路径流量为路段流量溯源提供数据基础。孙剑7-8提出基于粒子波算法对OD进行估计,并利用修正后的O+D信息经过2次迭代得到更为精确的路径流量。姚佳蓉等提出以改进的广义最小二乘9的路径流量估计模型,将路径与流向进行关联分析,并通过梯度搜索算法获得路径流量估计10。解析类方法较为成熟且应用广泛,但仍受到检测器覆盖率、模型约束条件以及先验信息要求的限制。Jian11提出了一种采用DNN方法提取时空高维特征的DBT模型用于对OD路径进行溯源和行程时间计算。Tang12提出一种Conv3D深度神经网络来估计OD路径流量方法,该方法利用小样本迁移学习方法来提升预测模型的精度。机器学习类方法则主要采用人工智能技术,提升模型对高维时空关联优化问题的识别能力,机器学习类方法尤其适用于多源数据融合应用场13,可充分挖掘已有信息价值而带来信息增益,提升路径流量估计精度。路径流量的变化与拥堵状态动态相关,路径流量估计的结果能够用于提升拥堵溯源的准确性。

拥堵关联分析即定量分析交通拥堵与影响因素之间的关联关系。国内外学者通常采用静态的拥堵段关联性或动态的拥堵传播特征的角度进行研究。梁林

14基于关联规则挖掘理论,利用统计学方法计算各拥堵断面的强关联规则,并利用上海市高架路网线圈检测器数据进行验证。王美15在交通状态识别的基础上研究了拥堵区域之间的关联性,设计了相应的时空关联规则,并划分工作日、非工作日,将方法应用于天津市道路高峰期间的交通拥堵分析中。为了更好地解析交通拥堵传播规律,进行交通拥堵溯源,近年来该领域的研究主要针对如何挖掘并解析动态的交通拥堵传播规律。Nguyen16提出了一种基于时间与空间信息的因果树构造算法,用以揭示时空拥堵间的相互关联性,并发现交通网络设计中潜在的缺陷。Chen17采用时空拥堵子图的方法模拟交通拥堵的传播现象,基于网联车辆轨迹数据研究了上海市早高峰虹桥机场以及上海站区域的交通拥堵关联特征。陈美林18提出了基于因果关联的交通拥堵传播分析方法,以蜂窝网格为基本单元,根据交通拥堵的时空特征,推断蜂窝网格在时空层面的移动方向,进而定位出容易传播拥堵的关键源头。以上方法多将交通拥堵的传播过程建立在交通流理论的简化假设上,为提升模型的适应性,Luan19将贝叶斯推理集成到深度学习框架中,增强了模型对拥堵传播的分析能力,使其能够适应多种路网结构,并学习潜在的交通拥堵传播规则。

综上所述,路径流量估计研究方法聚焦于某一固定时段内拥堵点段车流路径的回溯和推断,难以从时间连续的角度来解析交通拥堵的形成和演化规律;拥堵关联分析方法则更加关注不同路网结构或交通需求条件下的交通拥堵演化规律解析,难以从空间连续的角度来解析交通拥堵的形成和演化规律。

1 研究对象和数据描述

选取上海市延安高架作为研究对象,高架全长约14.3km,西侧与外环的沪青平公路立交相连接,东侧延伸至延安东路隧道,主干道是单向3车道、双向6~8车道,全线限速80 km·h-1。该路段共包含35个线圈检测断面,平均间距约为400m,共113个车道线圈检测器,覆盖了高架北线主线以及14个上下匝道与延安东路和延安西路2个立交。

将原始线圈数据集计为5min间隔的断面检测数据,再根据线圈前后相同时段或相邻星期数据进行线性插值修补,删除集中出现异常或缺失值的日期、时段、线圈数据,再根据同一线圈前后线圈数据进行移动线性插值修补,得到预处理后的数据集。保留了214天的有效数据,每天去除早5:30之前的数据(该时段为线圈检测器的固定维修时间),并收集了25个主线线圈检测断面和11个匝道线圈检测断面的行程速度和流量信息。

2 RSDC-LSTM模型构建

2.1 问题描述

以路径为基本单元来解析快速路网交通拥堵形成和演化规律,研究场景如图 1所示。针对某一时空点位的拥堵情况(如某断面8:00—8:05产生严重拥堵),通过分析断面集计的行程速度与流量信息,评估了经过该断面的不同路径的影响程度:如7:40—7:45从A上匝道驶入、8:05—8:10从D下匝道驶出的车流状态对其影响程度为0.4;7:55—8:00从C上匝道驶入、8:10—8:15从E下匝道驶出的车流状态对其影响程度为0.3;以此类推可以得到各个经过拥堵点段路径的影响权重,从而得到相应的交通拥堵溯源结果。

图 1  交通拥堵溯源场景

Fig. 1  Traffic congestion tracing scenario

2.2 模型总体框架

提出了一种基于深度学习的城市快速路交通拥堵点段车辆路径溯源模型——RSDC-LSTM(Route-Based Deformable Convolutional Long-Short Term Memory Neural Network with Soft Attention),包括原始时空数据处理、可选路径状态集生成、路径与交通拥堵关联性挖掘(含多路径卷积长短期记忆网络(ConvLSTM

20、软注意力机212个单元)、可变形卷积神经网22等4个模块,模型的总体框架如图 2所示。

图 2  RSDC-LSTM的结构

Fig. 2  Structure of RSDC-LSTM

与传统的统计建模方

23相比,以上的模型架构可以同时提取交通网络中多个断面上复杂的时间和空间融合特征,实现端到端的特征学习与建模。虽然目前已经有基于深度学习的交通状态预测模型,像卷积神经网24、循环神经网25等,此类方法多数是将路网进行栅格化划分,无法真实表达路网的实际拓扑状态,而RSDC-LSTM模型采用可选路径状态集表达不同的路径集合,采用可变形卷积神经网络保留完整的道路拓扑结构信息,从而具有提取不同路网拓扑的真实交通状态的能力。

模块1:原始时空数据处理模块,针对线圈数据质量不高的问题,删除数据中出现异常和缺失值的日期或时段记录,并对相应数据进行线性插值修补,从而获得预处理后的数据集。

模块2:可选路径状态集生成模块,采用路径搜索算法Φi得到具有高维度张量结构的路径集合。

模块3:路径与交通拥堵关联性挖掘模块,包含多路径卷积长短期记忆网络和软注意力2个单元,完成交通拥堵特征分析预测和路径与交通拥堵的关联性分析功能。多路径卷积长短时记忆网络单元的输入的是上一步生成的路径集合,按照断面输入多路径ConvLSTM功能模块进行状态特征增维;软注意力机制单元是在执行多路径ConvLSTM过程中合并计算某一个断面所有路径的特征向量,并将该断面新的特征向量输出。

模块4:可变形卷积神经网络模块,运用偏移矩阵提取断面的空间拓扑关系并与上一步输出的新特征向量融合进行高维特征提取。

以上4个模块共同组成车辆溯源模型(Ψ),模型的输出是断面级行程速度与流量张量,通过减少其与实际观测值的偏差程度,提升模型的交通溯源能力,从而准确还原各个断面的交通状态,进而通过模型机理解析得到交通拥堵溯源结果,即各个路径状态的影响程度。

     HT=VT-Δt,ST-Δt,...,VT,ST,,VT+Δt,,      ST+Δt (1)
Sri=ΦiHT (2)
Sra=Sr1,Sr2,...,Srn (3)
VT,ST=ΨSra (4)

式中:HT为时间段T±Δt区间的交通状态矩阵;VT为时刻T各个断面的流量;ST为时刻T-1T各个断面的平均行程速度;Δt为设定的路径搜索时间阈值;Sri为第i个断面利用路径搜索算法得到的可选路径状态集,其中i为断面序号;Sra为路径搜索算法计算得来的全部路径集。

2.3 可选路径状态集生成模块

可选路径状态集生成模块的输入是原始的断面检测器数据,输出的是多个可选路径的集合。本模块依次对所有时空位置断面搜索经过该时空点位的完整路径时空轨迹,记录对应的行程速度与流量。可选路径集能体现完整的上、下匝道的路径轨迹,也包含行程速度和流量2种交通状态特征参数,可有效反映任意时段和断面的拥堵动态信息。

下面是单个时空断面的路径状态集生成过程,输入数据包括历史数据时长Δthistory,轨迹时间间隔Δtdecision,检测器检测频率Δtcollection,节点对应关系与距离Scorrelation,行程速度矩阵Vspeed时空点位置x,y,输出为路径状态搜索的轨迹点集合Sroute,其大小为与当前时空点x,y相关联的节点数量,记作Scorrelationy,算法步骤如下:

步骤1:初始化变量Sstart、路径轨迹缓存集合Sroute_tmp ,用于临时存储待添加到Sroute中的元素、采样频率转换变量c,设置Sstart=1,路径轨迹缓存集合Sroute_tmp为空集,c=ΔtcollectionΔtdecision

步骤2:检查Sstart 除以c的余数,若余数为零,则转步骤3增加轨迹点,否则转步骤4。

步骤3:更新当前时空点位置x,y,将x,y添加到路径轨迹缓存集合Sroute_tmp中,然后跳到步骤5。

步骤4:对所有相关节点ni计算di-Δtdecision×Vspeedx,ni,若存在小于零的距离,则选择距离最小的节点y=argminnidi-Δtdecision×Vspeedx,ni作为当前节点。对于未被选择的ni更新其距离为di=di-Δtdecision×Vspeedx,ni,转步骤5。

步骤5:Sstart=Sstart+1。判断是否达到历史数据时长要求,若Sstart>ΔthistoryΔtdecision,Sroute_tmp添加到路径轨迹集Sroute,判断是否完成所有节点的迭代,若Sroute=Scorrelationy,则停止迭代;否则,转步骤1。若Sstart<ΔthistoryΔtdecision ,转步骤2。

2.4 路径与交通拥堵关联性挖掘

路径与交通拥堵关联性挖掘模块是挖掘已生成的路径状态集与已发和即将发生的交通拥堵之间关联关系。传统的线性回归预测模型如自回归积分滑动平均模型(ARIMA

26以及变体(SARIMA27在处理非线性数据时有局限性,目前随着深度学习技术的发展,研究方法多采用神经网络。

2.4.1 断面级短时交通拥堵分析和预测

断面级短时交通拥堵分析和预测是RSDC-LSTM模型中重要的模块,其准确性、鲁棒性和特征的提取能力对RSDC-LSTM模型有着重要的影响,故对比了以上各类模型的综合性能。

模型的输入为35×6(35为线圈断面数量,6为时间步长,代表采用过去30min的历史数据),取数据中的27 875个样本,按照训练集、验证集、测试集样本数量0.8:0.1:0.1的比例对数据集进行划分训练,进行下一个5min的交通拥堵短时预测。

将平均绝对误差(mean absolute error, MAE)作为网络的损失函数,平均绝对百分比误差(mean absolute percentage error, MAPE)则作为网络训练时的评估指标,采用了平均绝对比例误差(mean absolute scaled error, MASE)与绝对比例误差中位数(medianabsolute scaled error, MdASE)以评价模型预测的准确性,对于MASE和MdASE指标,采用随机游走方法作为基础对比标

28。对比的结果见表1

表1  各类模型预测准确性对比
Tab. 1  Comparison of prediction accuracy of various models
模型MAE/(km·h-1MAPE/%MASEMdASE
ARIMA 3.57 5.83 0.413 0.257
RNN 2.49 4.07 0.290 0.185
CNN 2.54 4.12 0.295 0.187
ConvLSTM 2.42 3.94 0.281 0.177

可以看到神经网络方法的预测MAPE均在4%附近,即预测准确率为95%~96%,同时MASE与MdASE相较ARIMA模型远小于1,验证了神经网络模型相较传统模型具备高精度的特性,通过比较ConvLSTM相较其他网络模型有着较好的预测精度,所以本模块主要采用卷积长短期记忆网络搭建预测模型。

2.4.2 多路径卷积长短期记忆网络单元

多路径卷积长短期记忆网络模块的主体是卷积长短期记忆网络,其输入的是可选路径集,输出的是各个路径的高维的特征表达(包括行程速度与流量)。

卷积长短期记忆网络(ConvLSTM)用于挖掘路径状态中的时空关联特征。首先,输入门通过学习筛选出与交通拥堵相关的特征,忽略掉与拥堵无关的噪声,遗忘门根据ConvLSTM单元状态去除与当前时间步无关的历史信息并计算保留相关信息,同时进一步降低模型整体的复杂度,其次输入门更新ConvLSTM单元状态,最后输出门提供激活后的单元输出值,并将当前状态的交通特征映射到下一时刻的交通状态。提取交通数据时序和时空特征的隐藏层计算如式(5)—(10

29

Ct̃=tanhWc×ht-1,xt+bc (5)
ft=σWfht-1,xt+bf (6)
it=σWiht-1,xt+bi (7)
ot=σWoht-1,xt+bo (8)
Ct=ftCt-1+itCt̃ (9)
ht=ottanhCt (10)

式中:t为时间步;xt为在时间步t的输入数据;ht-1为上一个时间步t-1的隐藏状态;Wcbc分别为计算候选单元状态的权重矩阵和偏置向量;Wfbf分别为遗忘门的权重矩阵和偏置向量;Wibi分别为输入门的权重矩阵和偏置向量;Wobo分别输出门的权重矩阵和偏置向量,对应不同的门控和计算;σsigmoid激活函数,它将输入映射到0到1之间;tanh是双曲正切激活函数,将输入映射到-1和1之间;为卷积计算。

Ct̃为时间步t的候选单元状态,通过对前一状态ht-1和当前输入xt进行线性变换,再经过tanh激活函数得到。ft是遗忘门的输出,it是输入门的输出,ot是输出门的输出。Ct是时间步t的单元状态,由上一单元状态Ct-1按遗忘门ft的权重保留部分信息,加上按输入门it权重筛选后的候选单元状态Ct̃得出。ht是时间步t的隐藏状态,通过输入门ot控制,对单元状态Ct经tanh激活后加权得到。

以延安高架快速路北线数据为例,交通数据大小为35×6(35个断面,6个预测时间步长),可以采用大小为6的滑动窗口进行扫描,得到30×6×6(30个输入时间步长,6个断面,6个预测时间步长)的输入值,通过ConvLSTM中的特征提取单元,挖掘交通状态在不同输入时间步长中的演变特征关系,进一步提取多路径下时空关联特征。

对不同断面分别构建适合多个路径输入的神经网络模型,即为多路径ConvLSTM,模块结构如图3所示,其中,i表示断面,输入时间步长与断面节点的丰富程度有关。图3中输入模块的时间步长(路径数量)与断面的位置相关,前后连接节点的丰富程度越高,则时间步长跨度越大。如主线的起点与终点或第一个上匝道与最后一个上匝道的输入时间步长大小,应小于主线中段的某断面。多路径ConvLSTM能有效整合路径间的关联关系以及重构各个路径的特征维度,从行程速度与流量信息中提取出更高维的表征交通状态的抽象特征。

图 3  针对各断面的ConvLSTM

Fig. 3  ConvLSTM for each section

2.4.3 软注意力机制单元

多路径卷积模块将输出各个路径增维后的特征张量,由于每个路径对于拥堵的时空断面影响程度显然不同,因此采用软注意力机制模块计算注意力值来表征路径对断面拥堵的影响程度,计算如式(11)—(13

30

h^=i=1mαihi (11)
αi=softmaxfiwThi+bi (12)
softmaxxi=exic=1Cexc (13)

式中:hii=1,2,,m为特征向量,m为特征向量数量;αi为每条路径的影响程度;h^为加权后的输出特征向量;softmax为归一化函数;fi为全连接层的激活函数;wT权重矩阵w的转置;bi为偏置向量,xi为输入向量中的第i个元素;c为用于求和的索引变量;C为输入向量的维度,即参与softmax计算的元素个数。通过计算αi能分析得到基于不同路径状态重构的高维特征对于某一时空断面拥堵的影响程度,进而自适应地调节后续模型的输入参数,提升模型对于交通拥堵溯源任务的适应性。

2.5 可变形卷积神经网络模块

可变形卷积神经网络(DCNN)模块是为了提升本溯源模型对不同路网拓朴结构的适应性,具体的方式是采用了偏移矩阵对各断面之间的关联特征进行重构,模块的输入是路网拓扑结构和重构后的新特征向量,输出是断面级行程速度、流量和拥堵关联度张量。

以主线为25个断面、匝道为11个断面为例,当利用图像表征拓扑关系时如图4所示,大小分别为36×1、25×2以及6×6的图像可以用于表示断面和匝道之间关系,36×1的图像需要人工确定匝道与主线关系位置无法自动化生成;25×2的图像体现了一定的拓扑关系,然而需要大量的填充零值;而6×6正方形化的图像则更具一般性,更适合采用CNN类模型进行特征提取,并无需填充过多的零值。故采用了6×6的这一类思路,直接将图像重构为正方形结构,能有效提取不相邻点位的特征关联关系,模块计算计算过程如下:① 前向传播,将输入数据通过可变形卷积层进行前向传播,得到输出特征图。② 计算误差,将输出特征图与标签进行比较,计算误差。③ 反向传播,按照误差反向传播算法,将误差从输出端反向传递到输入层,并计算偏移量的梯度。④ 参数更新,根据梯度下降算法,根据偏移量的梯度大小和方向,调整偏移量的值,使得误差最小化。⑤ 重复迭代,重复以上步骤,直到达到预定的迭代次数或误差满足要求。

图 4  基于欧几里得结构的拓扑关系示意

Fig. 4  Topological relationship based on Euclidean structure

本模块应用于6×6的蕴含拓扑关系的图像上时,能有效地捕捉主线与主线、主线与匝道的相邻连接关系,优于传统CNN仅能根据所组织的数据结构固定地提取相应的关联特征。

3 RSDC-LSTM模型训练及优化

模型在配置为Tesla P100 GPU、16GB内存以及Tensorflow深度学习框架下采用Python编程语言进行训练。路径状态集的生成考虑过去30 min以及未来30 min的数据,采用工作日数据进行模型的构建、优化、验证以及仿真。每个样本包含大小为319×60×1×2的数据(319为路径轨迹的总数量,分别针对25个主线和11个匝道断面;60为以1 min为轨迹生成间隔,在60 min内生成的轨迹点数,其中到达边界条件后取值为零;2为2种交通状态特征参数,分别是行程速度与流量),以及大小为72的标签(72为36个断面的2种交通特征参数),每个样本涉及的时间跨度均为55 min(前30 min加上当前5 min,加上后30 min,减去重合的10 min)。故本模型是基于输入的总路径状态集合对输出的断面交通状态进行拟合,进而得到交通拥堵溯源结果。

训练集、验证集、测试集样本数量按0.8、0.1、0.1的比例进行数据划分,其中训练集大小为22 300个样本,验证集以及测试集大小均为2 700个样本,模型采用带正则化参数的函数为损失函数(式(14))。初始学习率为0.001,采用指数衰减方式,批处理大小为256,最大迭代次数为200,可变形卷积层采用0.004的L2正则化,采用He-normal初始化方法,Adam作为优化器,λ取值为10,即模型希望更准确地预测行程速度,因为在线圈检测器结果中,行程速度信息的准确性更高。

L=MMAEv+λMMAEs (14)

式中:L损失函数;MMAE平均绝对误差,计算预测值和真实值之间绝对误差平均值;v单位时间通过某路段的交通流量;s车辆在路段的行程速度;λ正则化参数调整模型对不同误差的影响程度。

最优的RSDC-LSTM模型结构如图 5所示,包含413万个参数,每秒浮点运算次数为745万次。对于输入的319个路径状态,分组输入多路径ConvLSTM模块,即分主线1—主线25、匝道1—匝道11,其中输入步长为对应断面的路径数量,在训练ConvLSTM时为避免多零值影响,故进行mask操作(屏蔽相应的零值,不参与训练),ConvLSTM模块的输出为各路径特征增维后的结果;Soft Attention同样分断面计算,在各个模块中对结果进行加权计算,得到每个断面的最终状态增维结果(长度为384的向量);在拼接层,把36×1的断面重构为6×6,并压缩特征维度至64维度,相当于对原始特征的压缩重构;在可变形卷积神经网络中,采用3×3的可变形卷积与正常的卷积算子依次提取高维特征,模型最终输出大小为72的向量,作为断面的行程速度与流量结果。模型的整体思路为基于原始数据划定时间范围生成路径状态集,分断面采用多路径ConvLSTM网络进行特征增维,分断面采用Soft Attention模块综合考虑各个路径的影响程度并加权输出,利用拼接层压缩特征维度并将图像重构为一般化结构,通过可变形卷积网络提取各断面的拓扑结果关系以及特征的时空关联特征,输出各个断面当前的行程速度与流量值,模型的拟合平均绝对误差(mean absolute error, MAE)达到0.623 km·h-1,为精准的拥堵溯源分析任务奠定了基础。

图 5  RSDC-LTSM最优结构

Fig. 5  Optimum structure of RSDC-LSTM

由于针对某一时空点的路径状态集生成过程,需要前后30 min的交通状态信息,考虑到RSDC-LSTM模型若应用于分析下一个5 min时段的交通拥堵溯源信息时,需要下一个30 min的交通状态信息,因此预测模块的输出设置为30 min的包含行程速度与流量信息的张量。采用132天的工作日数据,并将输入数据的时间跨度设置为1h,可以划分得到25 476个样本,每个样本包含大小为36×12×2的数据(36为主线及匝道断面数量,12为12个5 min时间段,2为2种交通状态参数),以及大小为36×6×2的标签(6为6个5min时间段)。在每次训练开始时,计算行程速度样本集的50%分位数,对包含50%分位数以下的样本赋予更高的权重(低速样本权重、其他样本权重之比为3:1),以此提升模型在交通拥堵情况下的预测准确性。

预测模块的模型结构如图 6所示(分别针对行程速度与流量进行预测,具体的网络权重参数不同,因此输入输出数据的维度减半),包含326万个参数。第1个卷积层的卷积核大小为5×3,数量为16,第2个卷积层的卷积核大小为5×3,步长为3×1,数量为32。在第1个初始模块中,共包含4种卷积或池化算子的组合:2个卷积层,分别有64个大小为3×5以及3×3的卷积核;1个卷积层,包含96个大小为3×3的卷积核;1个卷积层,包含64个大小为1×1的卷积核;1个卷积层与1个池化层,分别有64个大小为1×1的卷积核与大小为3×3的平均池化算子。在第2个初始模块中,共包含3种卷积或池化算子的组合:4个卷积层,分别有128个大小为1×3与3×1的卷积核;2个卷积层,分别有192个大小为1×3与3×1的卷积核;1个卷积层与1个池化层,分别有大小为2×2的平均池化算子与64个大小为3×3的卷积核。最后与输出相连的卷积层卷积核大小为3×1,数量为256,最大池化层的算子大小为2×2,全连接层的大小依次为1 024与256。

图 6  预测模块结构

Fig. 6  Structure of prediction module

行程速度预测的MAE为3.765km·h-1,平均绝对误差百分比(Mean Absolute Percentage Error, MAPE)为10.045%;针对流量,模型预测MAE为21.2 辆·h-1,MAPE为9.19%,二者的准确率均在90%左右。

4 RSDC-LSTM模型应用及评价

RSDC-LSTM可针对已发生的与将要发生的交通拥堵进行溯源,本节通过实证分析以及仿真实验分别说明模型的性能。

4.1 实证分析

以2011年1月10号(星期一)的数据为例,对拥堵溯源结果进行说明。

(1)早高峰8:15时第21个主线断面的拥堵溯源。第21个主线断面的实际位置为延安高架路近石门一路断面处,结果如表2所示。可以看到,8:15从匝道10驶入(南北高架入口)、8:20从匝道8驶出(华山路出口)的路径流量状态影响最大,是该断面潜在的拥堵致因。

表2  早高峰8:15时第21个主线断面的交通拥堵溯源 ( % )
Tab. 2  Traffic congestion source-tracing of the 21st main section at 8:15 in morning peak
路径路径拥堵影响权重路径路径拥堵影响权重
8:10主线25驶入,8:40驶向主线1 8.62 8:15匝道10驶入,8:40驶向主线1 8.19
8:10主线25驶入,8:35驶向匝道1 7.89 8:15匝道10驶入,8:35驶向匝道1 7.57
8:10主线25驶入,8:30驶向匝道4 7.26 8:15匝道10驶入,8:30驶向匝道4 7.01
8:10主线25驶入,8:30驶向匝道5 7.04 8:15匝道10驶入,8:30驶向匝道5 7.3
8:10主线25驶入,8:25驶向匝道7 8.13 8:15匝道10驶入,8:25驶向匝道7 9.25
8:10主线25驶入,8:20驶向匝道8 10.31 8:15匝道10驶入,8:20驶向匝道8 11.44

(2)早高峰8:15时第14个主线断面的拥堵溯源。第14个主线断面的实际位置为延安高架路近华东医院以及江苏路出口处,由于该断面位于高架中部,故所经过的路径集更加丰富,结果如表3所示。可以看到,18:25从匝道9驶入(茂名路入口)、18:30从匝道7驶出(江苏路出口)的路径流量状态影响最大。

表3  晚高峰18:30时第14个主线断面的交通拥堵溯源 ( % )
Tab. 3  Traffic congestion source-tracing of the 14th main section at 18:30 in evening peak
路径路径拥堵影响权重路径路径拥堵影响权重
18:15主线25 驶入,18:50驶向主线1 0.38 18:20匝道10驶入,18:50驶向主线1 0.42
18:25匝道9驶入,18:50驶向主线1 0.49 18:15主线25 驶入,18:45驶向匝道1 0.65
18:20匝道10驶入,18:45驶向匝道1 0.92 18:25匝道9驶入,18:45驶向匝道1 1.42
18:15主线25驶入,18:40驶向匝道4 2.42 18:20匝道10驶入,18:40驶向匝道4 4.47
18:25匝道9驶入,18:40驶向匝道4 7.84 18:15主线25 驶入,18:35驶向匝道5 11.57
18:25匝道9驶入,18:40驶向匝道4 13.30 18:25匝道9驶入,18:35驶向匝道5 13.46
18:15主线25 驶入,18:30驶向匝道7 13.23 18:20匝道10驶入,18:30驶向匝道7 14.00
18:25匝道9驶入,18:30驶向匝道7 15.41

综上,通过结合实证数据,RSDC-LSTM模型可有效捕捉城市快速路中与拥堵点段在时空层面最相关的路径,并定量化影响程度以及路径起讫点的具体时段和起始点。

4.2 仿真实验

交通拥堵溯源通过分析交通流量、道路网络等因素,确定导致拥堵的原因和根源,其分析结果为制定交通管控策略提供了依据,包括被动管控和主动管控2种策略。

管控流程如图7所示,并选取上海市延安高架25个主线断面,11个上、下匝道断面建立仿真路网进行方法验证。

图 7  交通拥堵溯溯源与管控逻辑图

Fig. 7  Logic of traffic congestion source-tracing and control

仿真选用数据源为2011年1月10日(星期一)的线圈检测器数据,时段为早高峰7:00—8:00数据,对8:00—9:00可能产生的交通拥堵进行溯源分析,进而采取相应的交通管理与控制手段。仿真模型设置了4 800 s的仿真时长,其中前600 s(10 min)作为预热阶段,0~1 200 s输入7:00—8:00的路径流量数据,1 200~4 800 s输入8:00—9:00的路径流量数据进行仿真实验。由于主线21断面在8:15—8:30之间的行程速度较低(8:15—8:30间为32.43 km·h-1,8:00—9:00间为47.12km·h-1),故针对8:15—8:30主线21断面的交通拥堵情况进行溯源,结果见表4

表4  拥堵溯源平均结果
Tab. 4  Average results of congestion source-tracing
路径路径拥堵影响权重路径路径拥堵影响权重
主线25驶入,驶向主线1 6.78 匝道10驶入,驶向主线1 6.73
主线25驶入,驶向匝道1 6.82 匝道10驶入,驶向匝道1 6.83
主线25驶入,驶向匝道4 6.91 匝道10驶入,驶向匝道4 7.39
主线25驶入,驶向匝道5 7.99 匝道10驶入,驶向匝道5 8.72
主线25驶入,驶向匝道7 9.43 匝道10驶入,驶向匝道7 10.17
主线25驶入,驶向匝道8 10.77 匝道10驶入,驶向匝道8 11.44

故在验证环节中,在仿真的1 800~2 700 s(拥堵发生前5 min,对应8:10—8:25)内采用4种不同的交通管控方案:溯源路径流量控制,降低从匝道10驶入匝道8驶出的车流量;驶入流量控制,控制从匝道10驶入的车流量;分流至其他出口,将从匝道8驶出的流量分流至匝道7(江苏路出口);其他路径流量控制,降低从匝道10驶入而从匝道5或匝道7驶出的车流量。

在以上各种流量控制环节中,以影响最大的路径流量为基准,分别调控10%、20%、30%、40%和50%的车流量。结果如表5所示,其中,不进行交通控制时,主线21断面的平均行程速度为29.2km·h-1、平均停车次数为1.7次、每辆车平均停车延误为5.66s。

表5  交通管控效果验证
Tab. 5  Verification of traffic control performance
仿真指标车流量调控比例/%检测数值变化/%
行程速度/(km.h-1停车次数/次延误/svvnsnsdd
溯源路径流量控制 10 29.62 1.72 5.08 1.44 1.18 -10.25
20 31.88 1.50 4.49 9.18 -11.76 -20.67
30 35.27 1.41 4.04 20.79 -17.06 -28.62
40 34.60 1.22 3.18 18.49 -28.24 -43.82
50 36.02 1.20 3.67 23.36 -29.41 -35.16
驶入流量控制 10 28.77 1.72 5.14 -1.47 1.18 -9.19
20 32.16 1.34 4.26 10.14 -21.18 -24.73
30 31.33 1.62 5.06 7.29 -4.71 -10.60
40 30.63 1.57 4.73 4.90 -7.65 -16.43
50 32.98 1.09 3.39 12.95 -35.88 -40.11
分流至其他出口 10 29.33 1.73 5.54 0.45 1.76 -2.12
20 30.52 1.66 5.62 4.52 -2.35 -0.71
30 29.68 1.84 5.32 1.64 8.24 -6.01
40 28.77 1.64 6.04 -1.47 -3.53 6.71
50 29.85 1.71 5.80 2.23 0.59 2.47
其他路径流量控制 10 29.92 1.75 5.03 2.47 2.94 -11.13
20 30.68 1.56 4.92 5.07 -8.24 -13.07
30 32.03 1.55 4.38 9.69 -8.82 -22.61
40 30.59 1.48 4.05 4.76 -12.94 -28.45
50 34.86 1.23 4.18 19.38 -27.65 -26.15

当控制的流量从10%上升至50%时,各控制手段的效益均呈现上升趋势,但分流至其他出口的效果相对不稳定。由于在仿真的分流路径流量至其他路口的处理较为简单,因此可能带来了其他交通拥堵问题,造成了行程速度的下降(-1.47%)、停车次数的上升(8.24%)以及延误的增加(6.71%);对驶入流量进行控制与对其他路径流量的控制效果相似,因为当统一控制驶入流量时,实际上是减少了各个路径的流量,包括影响程度大的与影响程度较小的路径;对影响程度最大的路径进行调控,效果提升均最为明显,行程速度最大可提升23.36%,停车次数最多减少29.41%,延误最多下降了43.82%。由此可见,通过预测模块得到交通状态信息,并基于RSDC-LSTM的交通拥堵溯源结果可制定得到更加有效有针对性的交通管控策略,即仿真验证了针对影响程度最大的路径进行调控,在资源有限的情况下尽可能地增加交通控制带来缓解交通拥堵的收益。

5 结论与展望

提出一种新的针对城市快速路交通拥堵溯源的深度学习方法——RSDC-LSTM,该方法用于解决城市快速路交通拥堵溯源问题,可以实现被动和主动2种形式的交通拥堵溯源分析。

采用实证案例定量分析和仿真实验验证不同的交通控制策略手段,结果表明,对拥堵影响程度大的路径进行管控效益最明显,可实现行程速度最大可提升23.36%,停车次数最多减少29.41%,延误最多下降了43.82%。

本研究仍存在一定的不足,研究所用数据源比较单一,仅考虑了行程速度和流量并未考虑交通事件、气象环境等数据。后续研究将进一步考虑多种潜在因素,进一步优化交通拥堵溯源分析的框架和方法。

作者贡献声明

张锋鑫:提出模型框架、撰写和修改论文。

陈思曲:处理实证数据、撰写论文。

徐大林:设计仿真框架、修改论文。

唐克双:提出研究思路、撰写和修改论文。

张 政:编写仿真代码、仿真验证、修改论文。

参考文献

1

百度地图.2022年度中国城市交通报告[R/OL].[2023-07-11].https://huiyan.baidu.com/boswebsite/jiaotong/cms/reports/traffic/2022/index.html. [百度学术] 

Baidu Map . 2022 annual report on urban transportation in China [R/OL].[2023-07-11].https://huiyan.baidu.com/boswebsite/jiaotong/cms/reports/traffic/2022/index.html [百度学术] 

2

徐铖铖.快速路交通事故风险实时辨识与主动控制[R].深圳中国智能交通产业联盟2018. [百度学术] 

XU Chengcheng. Real time identification and active control of expressway traffic accident risks [R]. ShenzhenChina ITS Industry Alliance2018. [百度学术] 

3

BORIS Medina-SalgadoEDDY Sánchez-DelaCruzPILAR Pozos-Parraet al. Urban traffic flow prediction techniques: a review [J]. sustainable computing: informatics and systems202235100739. [百度学术] 

4

邵虎卓越刘鹏杰.城市交通流量估计的运筹学方法[J].运筹学学报2023272):27. [百度学术] 

SHAO HuZHUO YueLIU Pengjieet al. Operations research methods for urban traffic flow estimation[J]. Journal of Operational Research Society2023272): 27. [百度学术] 

5

Van ZUYLEN H JWILLUMSEN L G. The most likely trip matrix estimated from traffic counts[J]. Transportation Research Part B: Methodological1980143): 281. [百度学术] 

6

曹奇. 基于准全样本轨迹数据的机动车出行链提取及路网状态估计[D].江苏 南京东南大学2021. [百度学术] 

CAO Qi. Extraction of motor vehicle travel chains and road network state estimation based on quasi-complete sample trajectory data [D]. Jiangsu NajingSoutheast University2021. [百度学术] 

7

孙剑冯羽. 自动识别环境下车辆的出行矩阵估计新方法[J].同济大学学报(自然科学版)20113912): 1800. [百度学术] 

SUN JianFENG Yu. A new method for estimating travel matrix of vehicles under automatic recognition environment[J]. Journal of Tongji University (Natural Science)20113912): 1800. [百度学术] 

8

孙剑冯羽. 基于车辆自动识别技术的动态 OD 矩阵估计新方法[J].同济大学学报(自然科学版)2013419): 1366. [百度学术] 

SUN JianFENG Yu. New method of dynamic od matrix estimation based on automatic vehicle recognition technology[J]. Journal of Tongji University (Natural Science)2013419): 1366. [百度学术] 

9

DIXON M PRILETT L R. Real-time od estimation using automatic vehicle identification and traffic count data[J]. Journal of Computer Aided Civil Infrastructure Engineering2002171) :7. [百度学术] 

10

姚佳蓉曹喻旻唐克双.基于抽样轨迹数据和改进最小二乘模型的信控路网路径流量估计方法[J].中国公路学报2022353):226. [百度学术] 

YAO JiarongCAO YumingTANG Keshuang. Path flow estimation method for signal-controlled road network based on sampled trajectory data and improved least squares model[J]. China Journal of Highway and Transport2022353): 226. [百度学术] 

11

JIAN YuanYU ChunhuiLING Wanget al. Driver back-tracing based on automated vehicle identification data[J]. Transportation Research Record201926736): 84. [百度学术] 

12

TANG KeshuangCAO YumingCHEN Canet al. Dynamic origin‐destination flow estimation using automatic vehicle identification data: A 3d convolutional neural network approach[J]. Computer-Aided Civil and Infrastructure Engineering2021361): 30. [百度学术] 

13

邢吉平. 基于多源数据融合的城市路网交通流量估计方法研究[D].南京东南大学2021. [百度学术] 

XING Jiping. Research on urban road network traffic flow estimation method based on multi-source data fusion [D]. NanjingSoutheast University2021. [百度学术] 

14

梁林林. 基于数据挖掘的城市快速路拥堵关联特征分析——以上海市为例[J]. 交通与运输(学术版)20141): 26. [百度学术] 

LIANG Linlin. Analysis of correlation characteristics of urban expressway congestion based on data mining: a case study of shanghai[J]. Transportation and Transport Science20141): 26. [百度学术] 

15

王美红. 基于实测数据的天津市交通拥堵时空关联性分析[D]. 北京北京交通大学2019. [百度学术] 

WANG M. Analysis of spatio-temporal correlation of traffic congestion in tianjin based on field data[D]. BeijingBeijing Jiaotong University2019. [百度学术] 

16

NGUYEN HLIU WeiCHEN Fang. Discovering congestion propagation patterns in spatio-temporal traffic data[J]. IEEE Transactions on Big Data201732): 169. [百度学术] 

17

CHEN ZhenhuaYANG YongjianHUANG Lipinget al. Discovering urban traffic congestion propagation patterns with taxi trajectory data[J]. IEEE Access2018669481. [百度学术] 

18

陈美林郑治豪郭宝. 基于因果关联的交通拥堵传播分析[J]. 中南大学学报(自然科学版)20205112): 3575. [百度学术] 

CHEN MeilinZHENG ZhihaoGUO Baoet al. Analysis of traffic congestion propagation based on causal association[J]. Journal of Central South University (Natural Science Edition)20205112): 3575. [百度学术] 

19

LUAN SKE RuiminZHOU Huanget al. Traffic congestion propagation inference using dynamic bayesian graph convolution network[J]. Transportation Research Part C: Emerging Technologies2022135103526. [百度学术] 

20

SHI XingjianCHEN ZhourongHAO Wanget al. Convolutional lstm network: a machine learning approach for precipitation nowcasting[C]//Proceedings of the 29th International Conference on Neural Information Processing Systems. MontrealMIT Press20151802. [百度学术] 

21

VASWANI ASHAZEER NPARMAR Net al. Attention is all you need[C]// Proceedings of the 31st International Conference on Neural Information Processing Systems. Long BeachCurran Associates Inc.20176000. [百度学术] 

22

DAI JifengQI HaozhiXIONG Yuwenet al. Deformable convolutional networks[C]//IEEE International Conference on Computer Vision. VeniceICCV2017764. [百度学术] 

23

CHEN HaiboGRANT-MULLEr SMUSSONE Let al. A study of hybrid neural network approaches and the effects of missing data on traffic forecasting[J]. Neural Computing and Applications2001103): 277. [百度学术] 

24

MA XiaoleiDAI ZhuangHE Zhengbinget al. Learning traffic as images: a deep convolutional neural network for large-scale transportation network speed prediction[J]. Sensors2017174): 818. [百度学术] 

25

FU RuiZHANG ZuoLI Li. Using lstm and gru neural network methods for traffic flow prediction[C]//2016 31st Youth Academic Annual Conference of Chinese Association of Automation (YAC). [s.l.]: IEEE2016324-328. [百度学术] 

26

AHMED M SCOOK A R. Analysis of freeway traffic time - series data by using box - jenkins techniques[J]. Transportation Research Record19791- 9): 722. [百度学术] 

27

WILLIAMSB MHOEL L A. Modeling and forecasting vehiculartraffic flow as a seasonal arima process: Theoretical basis and empirical results [J]. Journal of Transportation Engineering2003129664. [百度学术] 

28

HYNDMAN R JKOEHLER A B. Another look at measures of forecast accuracy[J]. International Journal of Forecasting2006224): 679. [百度学术] 

29

TANG KeshuangCHEN SiquCAO Yuminet al. Short-term travel speed prediction for urban expressways: hybrid convolutional neural network models[J]. IEEE Transactions on Intelligent Transportation Systems2022233): 1829. [百度学术] 

30

蔡晓. 基于知识图谱的城市交通拥塞预测和时空传播模式挖掘研究[D].长春吉林大学2021. [百度学术] 

CAI Xiao. Research on urban traffic congestion prediction and spatio-temporal propagation pattern mining based on knowledge graph[D]. ChangchunJilin University2021. [百度学术]