摘要
为了高效捕捉城市快速路复杂的交通拥堵特征,提升短时行程速度预测的准确性,以卷积神经网络为基础,结合Inception模块,构建行程速度短时预测模型。将行程速度信息按照时空关联关系组织为二维数据矩阵,以图像为特征学习对象,自动提取交通数据高维特征并学习多粒度复杂交通拥堵模式,通过系统的网络设计与测试训练得到模型最优结构参数和优化参数,结合回归分析方法与梯度幅度相似性偏差指标,综合评价模型性能。实证结果表明,模型提取行程速度数据时序特征和时空演化特征能力较强,预测准确性较高,可进一步应用于其他交通参数的短时预测。
近年来,伴随城市化进程的加速推进和经济社会的高速发展,我国机动车保有量和驾驶人数量持续增加,城市交通拥堵问题日益严重。根据高德地图发布的《2019中国主要城市交通分析报告》,2019年全国360个主要城市高峰时段总体处于拥堵和缓行状态的比例超过60
目前,交通状态预测模型基本上可以分为两大类:统计学模型和神经网络模
神经网络模型支持高维输入数据,优势在于可提取多维非线性特征,从而获得更高的模型预测精度与鲁棒
卷积神经网络(convolutional neural networks, CNN)可通过局部连接、权值共享与下采样等方法,尽可能保留重要的参数,舍去大量非关键参数,在图像识别任务上具有优势。因此,近年来CNN被广泛应用于图像识别、目标检测等领
上述混合CNN模型虽然可以通过同时考虑交通状态的时间序列特征和空间关联特征,提升传统CNN模型的预测性能,但是在CNN模型的计算部分依然采用固定的卷积核尺寸,大大限制了其对多尺度(交通拥堵的时间和空间范围动态变化)交通流特征的学习能力。此外,为提取多粒度条件下的特征,通常需要对输入数据进行集计与调整并构建多个子网络。考虑到高峰时段城市快速路的交通状态不仅受到路网拓扑结构和地面道路交通状态的影响,而且受到驾驶员动态路径选择行为和突发交通事件的影响,因此城市快速路交通拥堵模式复杂且拥堵的时空粒度范围多变。针对这样的预测任务,上述混合CNN模型存在一定局限性。
因此,本研究提出一种更加有效并能适应城市快速路复杂交通拥堵模式的行程速度短时预测模型——Inception-CNN模型。Inception-CNN模型将多粒度特征提取问题结合至模型中而非依赖于输入数据,使其更具有高效性、适应性,并更易于应用在如流量、占有率等其他交通流参数的预测任务中。其中,Inception模块是GoogleNet在2014年的ImageNet挑战赛中获胜的核心模
本研究以上海市高架快速路为研究对象,首先将线圈采集的行程速度数据组织为时空二维矩阵,并采用阈值法将数据矩阵转化为图像,以发挥CNN模型在图像识别上的优势;同时,在CNN的网络结构设计中融入Inception模块,构建了一种新的混合CNN模型框架,并通过系统的训练和测试,确定了最优结构参数和超参数。目前基于图像学习的交通流预测模型,大多仍采用传统的评价指标进行分析。为了更加科学准确地定义Inception-CNN模型对行程速度时间序列特征和时空演化特征的捕捉能力,本研究还引入了梯度幅度相似性偏差(gradient magnitude similarity deviation, GMSD
本研究以2011年全年上海市延安高架快速路的线圈检测器数据为数据源。研究范围包括延安高架快速路从四川中路到外环沪青平公路之间的路段,全长约14.3 km,含2个立体交叉以及14个上下匝道,如

图1 研究路段区位
Fig. 1 Location of the studied site
本研究首先将原始线圈检测数据处理为行程速度时空图像,作为模型的输入。以x轴为时间段,y轴为检测器布设段,得到行程速度时空矩阵S的表达式如下:
(1) |
式中:n为时间段总数;m为检测断面总数;vm,n为检测器断面m在第n个时间段的行程速度,km·

图2 行程速度时空图像
Fig. 2 Time-space travelling speed image
CNN主要由卷积层、池化层与全连接层组成,卷积层可有效提取目标特征,同时具有稀疏连接、参数共享的特点,其计算原理如下:
(2) |
式中:N为所在网络层的位置;为位于N位置卷积层的第i个卷积值;为卷积核i第j通道在(p,q)位置处的参数值;xpq为当前卷积核或池化算子在滑动计算时视野范围内在(p,q)位置处的上一网络层输入值;bij为偏置系数。卷积层所输出的特征图是基于卷积结果,通过非线性激活函数的变换所得:
(3) |
式中:g(x)为非线性激活函数;y为输出的特征图。本研究选取Sigmoid、tanh与ReLU(rectified linear unit)三种不同的激活函数进行模型的对比分析与结构优
(4) |
式中:max(x)为求最大元素值函数。最后将特征图展平为一维张量,并连接若干全连接层,输出预测结果,其基本结构见
(5) |
(6) |
式中:u为真实值;为预测值;n为样本量。

图3 卷积神经网络结构(LeNet-
Fig. 3 Structure of CNN (LeNet-5)
在基本的CNN中,为提取不同粒度的特征,通常需要输入对应尺寸(规模)的图像(行程速度时空图像),即不易直接有效学习不同规模的交通时空特征。此外,在设计基本CNN模型的卷积、池化算子的尺寸时,大多通过实验者较为主观地确定最佳搜索范围,并通过网格搜索或是随机搜索方式来确定最优的选择。考虑到交通演变规律的不确定性,即交通事件或交通拥堵影响范围的不确定性,在CNN的每个卷积层或池化层中采用一致的算子尺寸并非合适。因此,本研究将基于CNN,结合Inception模块建立更适应于城市快速路行程速度短时预测的深度学习模型(Inception-CNN模型)以解决上述问题。
Inception模块可将卷积核分解为尺寸更小的对称或非对称的卷积核,并通过一系列串行或并行的组合,保持每个模块输出特征图的尺寸一致。例如,

图4 将5×5卷积核替换为2个3×3卷积核的Inception模
Fig. 4 Inception modules where each 5×5 convolution is replaced by two 3×3 convolution
通过结合Inception模块,本研究搭建的模型可更准确地提取交通数据不同尺度的时序特征、空间特征以及时空特征。如

图5 Inception-CNN模型中的卷积核设计及其计算过程
Fig. 5 Design and computing process of convolutional kernels in Inception-CNN
总结而言,Inception-CNN模型对城市快速路的行程速度短时预测问题具有较好的适应性,其基本结构见

图6 Inception-CNN模型基本结构
Fig. 6 Basic structure of Inception-CNN
在本研究中,首先设计模型的结构参数,如神经网络层数,各层神经元数量等。其次,对模型的优化参数进行比选,包括:初始学习率与学习率变动计划、批处理大小、激活函数以及各类算子的尺寸与步长等。不同结构参数与优化参数的组合见
其中,数据集的大小为75 300组,选自上海市2011年349 d的延安高架快速路的线圈检测器数据。以训练集、验证集、测试集的比例为0.8:0.1:0.1划分数据集,即约选取60 300组作为训练集,7 500组作为验证集,7 500组作为测试集对模型进行训练。
本研究工作环境是内存为16 GB,GPU为Tesla P100的服务器,采用Tensorflow深度学习框架。所得到的最优Inception-CNN示意图见

图7 最优Inception-CNN结构
Fig. 7 Optimum structure of Inception-CNN
模型参数信息见
本研究选取了经典的统计学模型与浅层、深层神经网络对模型结果进行综合评价,包括不同输入时间步长下模型的稳定性,模型精度,以及模型时序、时空特征学习能力的分析。涉及的模型有:针对时间序列问题应用广泛的数理统计学模型 ARIMA;一定深度的人工神经网络(artificial neural network, ANN),具有3个隐藏层,各层神经元数量分别为512、512、256,共包含51.1万个待训练参数;对于序列数据有较好适应性的神经网络RNN,具有2个隐藏层(LSTM结构),各层神经元数量均为128,共包含135.7万个待训练参数;以及不包含Inception模块的基本CNN,具有两个卷积层、池化层与全连接层,各层神经元数量分别为: 256、512、1 024、512,共包含1 011.5万个待训练参数。其中,各神经网络结构见

图8 对比模型结构
Fig. 8 Architecture of comparison model
由于输入时间步长会影响到模型的预测精度与预测结果的稳定

图9 不同输入时间步长下模型结果
Fig. 9 Model results at different input time length
模型预测精度分析结果如
为进一步分析模型的精度,本文将数据集划分为工作日、非工作日以及所有时间三类。在此基础上,对模型进行训练并取得最优结构,结果见

图10 不同数据集下模型结果
Fig. 10 Model results in different dataset
由于交通数据具有较强的时序特征,故本小节对各个模型在该方面的提取能力进行分析。首先利用线性回归方法计算模型对每个线圈的预测值与真实值之间的差异,随后对35个线圈的计算值进行平均,见
为进一步说明上述结论,选取2011年1月3日的数据进行可视化展示,见

图11 行程速度预测时变曲线
Fig. 11 Time-varying curve of travelling speed prediction
根据

图12 行程速度预测时变曲线(早高峰时段)
Fig. 12 Time-varying curve of travelling speed prediction (morning rush hour)
根据
(7) |

图13 模型GMSD计算结果
Fig. 13 GMSD of models
行程速度时空图像与计算GMSD过程中得到的卷积特征图如

图14 行程速度时空图像对比
Fig. 14 Comparison of time-space travelling speed images
(1) 提出了一种新的针对城市快速路行程速度短时预测的混合CNN模型——Inception-CNN模型。该模型以交通数据生成的行程速度时空图像为特征学习对象,自动学习复杂交通拥堵模式及其演化特征,对时空等高维关联性进行多粒度特征提取,行程速度预测误差仅为2.45 km·
(2) 针对基于图像学习的交通流预测方法,引入了GMSD指标并结合回归分析方法定量评价了模型学习交通流时间序列特征和时空关联特征的能力,弥补了传统评价指标的不足,丰富了该类模型在交通流预测方面的评价方法。结果表明,Inception-CNN模型能有效提取交通数据的时间序列和时空关联特征,预测结果所生成的行程速度时空图像可准确反映交通拥堵在时空层面产生、延续、消散的过程。
(3) 对比分析了不同输入时间步长和预测场景下的模型预测性能。此外,本研究针对行程速度短时预测任务所建立的Inception-CNN模型和指标评价体系可应用于其他交通参数如流量、占有率的短时预测任务与定量结果分析中。
(4) 本研究的数据源单一且研究范围有限,后续研究可进一步结合交通事件和气象检测数据,并将研究范围扩大至拓扑结构更复杂的区域城市快速路网,以测试本研究所提出的Inception-CNN模型的有效性。
作者贡献声明
唐克双:提出研究思路、撰写和修改文稿;
陈思曲:处理实证数据、构建模型算法、撰写文稿;
曹喻旻:设计模型实验、修改文稿;
张锋鑫:提出模型框架、分析实验结果、修改文稿。
参考文献
高德地图. 2019年年度中国主要城市交通分析报告[R/OL]. [2020-02-25]. https://report.amap.com/share.do?id=8b04ff737067a78601707b2ba0542d72. [百度学术]
Amap. 2019 traffic analysis report of major cities in China[R/OL]. [2020-02-25]. https://report.amap.com/share.do?id=8b04ff737067a78601707b2ba0542d72. [百度学术]
KARLAFTIS M G, VLAHOGIANNI E I. Statistical methods versus neural networks in transportation research: differences, similarities and some insights[J]. Transportation Research Part C: Emerging Technologies, 2011, 19(3): 387. [百度学术]
刘静, 关伟. 交通流预测方法综述[J]. 公路交通科技, 2004, 21(3): 82. [百度学术]
LIU Jing, GUAN Wei. A summary of traffic flow forecasting methods[J]. Journal of Highway and Transportation Research and Development, 2004. 21(3): 82. [百度学术]
AHMED M S, COOK A R. Analysis of freeway traffic time-series data by using box-jenkins techniques[J]. Transportation Research Record: Journal of the Transportation Research Board, 1979(722): 1. [百度学术]
WILLIAMS B M, HOEL L A. Modeling and forecasting vehicular traffic flow as a seasonal ARIMA process: theoretical basis and empirical results[J]. Journal of Transportation Engineering, 2003, 129(6): 664. [百度学术]
OKUTANI I, STEPHANEDE Y J. Dynamic prediction of traffic volume through Kalman filtering theory[J]. Transportation Research Part B: Methodological, 1984, 18(1): 1. [百度学术]
XIA D, WANG B, LI H, et al. A distributed spatial-temporal weighted model on mapreduce for short-term traffic flow forecasting[J]. Neurocomputing, 2016, 179: 246. [百度学术]
杨兆升, 王媛, 管青. 基于支持向量机方法的短时交通流量预测方法[J]. 吉林大学学报(工学版), 2006, 36(6): 881. [百度学术]
YANG Zhaosheng, WANG Yuan, GUAN Qing. Short-term traffic flow prediction method based on SVM[J]. Journal of Jilin University (Engineering and Technology Edition), 2006, 36(6): 881. [百度学术]
HONG W C. Traffic flow forecasting by seasonal SVR with chaotic simulated annealing algorithm[J]. Neurocomputing, 2011, 74(12/13): 2096. [百度学术]
LIU D, TANG L, SHEN G, et al. Traffic speed prediction: an attention-based method[J]. Sensors, 2019, 19(18): 3836. [百度学术]
DO L N N, TAHERIFAR N, VU H L. Survey of neural network-based models for short-term traffic state prediction[J]. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 2019, 9(1): 1285. [百度学术]
SMITH B L, DEMETSKY M J. Short-term traffic flow prediction models-a comparison of neural network and nonparametric regression approaches[C] //Proceedings of IEEE International Conference on Systems, Man and Cybernetics. Los Angeles: IEEE, 1994: 1706-1709. [百度学术]
POLSON N G, SOKOLOV V O. Deep learning for short-term traffic flow prediction[J]. Transportation Research Part C: Emerging Technologies, 2017, 79: 1. [百度学术]
HUANG W, SONG G, HONG H, et al. Deep architecture for traffic flow prediction: deep belief networks with multitask learning[J]. IEEE Transactions on Intelligent Transportation Systems, 2014, 15(5): 2191. [百度学术]
KOESDWIADY A, SOUA R, KARRAY F. Improving traffic flow prediction with weather information in connected cars: a deep learning approach[J]. IEEE Transactions on Vehicular Technology, 2016, 65(12): 9508. [百度学术]
LV Y, DUAN Y, KANG W, et al. Traffic flow prediction with big data: a deep learning approach[J]. IEEE Transactions on Intelligent Transportation Systems, 2014, 16(2): 865. [百度学术]
LIN Y, DAI X, LI L, et al. Pattern sensitive prediction of traffic flow based on generative adversarial framework[J]. IEEE Transactions on Intelligent Transportation Systems, 2018, 20(6): 2395. [百度学术]
ZANG D, FANG Y, WEI Z, et al. Traffic flow data prediction using residual deconvolution based deep generative network[J]. IEEE Access, 2019, 7: 71311. [百度学术]
MA X, TAO Z, WANG Y, et al. Long short-term memory neural network for traffic speed prediction using remote microwave sensor data[J]. Transportation Research Part C: Emerging Technologies, 2015, 54: 187. [百度学术]
JIA Y, WU J, BEN-AKIVA M, et al. Rainfall-integrated traffic speed prediction using deep learning method[J]. IET Intelligent Transport Systems, 2017, 11(9): 531. [百度学术]
CUI Z, KE R, PU Z, et al. Deep bidirectional and unidirectional LSTM recurrent neural network for network-wide traffic speed prediction[J]. Doi:arXiv preprint arXiv:1801.02143, 2018. [百度学术]
WU T, CHEN F, WAN Y. Graph attention LSTM network: A new model for traffic flow forecasting[C] //2018 5th International Conference on Information Science and Control Engineering (ICISCE). Los Angeles: IEEE, 2018: 241-245. [百度学术]
TANG K, LI X, CHEN S, et al. Short-term travel speed prediction for urban expressways: graph attention network model[Z]. Washington D C:Transportation Research Board, 2020. [百度学术]
YU H, WU Z, WANG S, et al. Spatiotemporal recurrent convolutional networks for traffic prediction in transportation networks[J]. Sensors, 2017, 17(7): 1501. [百度学术]
GUO Y, LIU Y, OERLEMANS A, et al. Deep learning for visual understanding: a review[J]. Neurocomputing, 2016, 187: 27. [百度学术]
ISHAK S, KOTHA P, ALECSANDRU C. Optimization of dynamic neural network performance for short-term traffic prediction[J]. Transportation Research Record, 2003, 1836(1): 45. [百度学术]
MA X, YU H, WANG Y, et al. Large-scale transportation network congestion evolution prediction using deep learning theory[J]. PloS One, 2015, 10(3). DOI: https://doi.org/10.1371/journal.pone.0119044. [百度学术]
HE K, ZHANG X, REN S, et al. Deep residual learning for image recognition[C] //Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Los Angeles: IEEE, 2016: 770-778. [百度学术]
沙爱民, 童峥, 高杰. 基于卷积神经网络的路表病害识别与测量[J]. 中国公路学报, 2018, 31(1): 1. [百度学术]
SHA Aimin, TONG Zheng, GAO Jie. Recognition and measurement of pavement disasters based on convolutional neural networks[J]. China Journal of Highway and Transport, 2018, 31(1): 1. [百度学术]
丁松涛, 曲仕茹. 基于深度学习的交通目标感兴趣区域检测[J]. 中国公路学报, 2018, 31(9): 171. [百度学术]
DING Songtao, QU Shiru. Traffic object detection based on deep learning with region of interest selection[J]. China Journal of Highway and Transport, 2018, 31(9): 171. [百度学术]
MA X, DAI Z, HE Z, et al. Learning traffic as images: a deep convolutional neural network for large-scale transportation network speed prediction[J]. Sensors, 2017, 17(4): 818. [百度学术]
ZANG D, WANG D, CHENG J, et al. Traffic parameters prediction using a three-channel convolutional neural network[C] //International Conference on Intelligence Science. New York: Cham Springer, 2017: 363-371. [百度学术]
ZAND D, LING J, CHENG J, et al. Using convolutional neural network with asymmetrical kernels to predict speed of elevated highway[C] //International Conference on Intelligence Science. New York: Cham Springer, 2017: 212-221. [百度学术]
WU Y, TAN H, QIN L, et al. A hybrid deep learning based traffic flow prediction method and its understanding[J]. Transportation Research Part C: Emerging Technologies, 2018, 90: 166. [百度学术]
ZANG D, LING J, WEI Z, et al. Long-term traffic speed prediction based on multiscale spatio-temporal feature learning network[J]. IEEE Transactions on Intelligent Transportation Systems, 2018, 20(10): 3700. [百度学术]
GE L, LI H, LIU J, et al. Temporal graph convolutional networks for traffic speed prediction considering external factors[C] //2019 20th IEEE International Conference on Mobile Data Management (MDM). Los Angeles: IEEE, 2019: 234-242. [百度学术]
YU J J Q, GU J. Real-time traffic speed estimation with graph convolutional generative autoencoder[J]. IEEE Transactions on Intelligent Transportation Systems, 2019, 20(10): 3940. [百度学术]
SZEGEDY C, VANHOUCKE V, IOFFE S, et al. Rethinking the inception architecture for computer vision[C] //Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Los Angeles: IEEE, 2016: 2818-2826. [百度学术]
陈新宇, 金艳梅. 基于神经网络的交通标志检测方法[J]. 计算机与网络, 2020, 46(6): 66. [百度学术]
CHEN Xinyu, JIN Yanmei. Traffic sign detection method based on neural network[J]. Computer & Network, 2020, 46(6): 66. [百度学术]
向华荣, 曾敬. 基于卷积神经网络的汽车试验场外物入侵识别[J]. 重庆交通大学学报(自然科学版), 2020, 39(1): 8. [百度学术]
XIANG Huarong, ZENG Jing. Recognition on invaders into automobile proving ground based on convolution neural netwotk[J]. Journal of Chongqing Jiaotong University (Natural Science), 2020, 39(1): 8. [百度学术]
XUE W, ZHANG L, MOU X, et al. Gradient magnitude similarity deviation: a highly efficient perceptual image quality index[J]. IEEE Transactions on Image Processing, 2013, 23(2): 684. [百度学术]
张扬, 何承, 张祎, 等. 上海市道路交通状态指数简介及应用案例[J]. 交通与运输, 2016, 32(3):16. [百度学术]
ZHANG Yang, HE Cheng, ZHANG Wei, et al. Introduction and application cases of shanghai traffic state index[J]. Traffic & Transportation, 2016. 32(3): 16. [百度学术]
KRIZHEVSKY A, SUTSKEVER I, HINTON G E. Imagenet classification with deep convolutional neural networks[C] //Advances in Neural Information Processing Systems. New York: Curran Associates, 2012: 1097-1105. [百度学术]
LECUN Y, BOTTOU L, BENGIO Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278. [百度学术]