摘要
在路面表观损坏图像识别方法中,为了解决现有方法准确度与速度不高的问题,利用历史检测结果这一历史信息,提出一种基于历史信息的路面表观损坏图像识别方法。首先,搭建了面向历史信息应用的算法框架,引入利用历史信息创建损坏识别的初始约束条件的机制。其次,训练VGG-16网络用于提取损坏特征。最后,利用历史信息建立初始种群以及设计特征参数,从而改进遗传算法。实验结果表明,该方法相较不运用历史信息的识别方法,能在不降低识别准确度的前提下显著提升识别速度,最快可较不运用历史信息的算法提升141.71倍速度。
交通基础设施管理.E-mail: czy1620@263.net
准确、快速检测路面损坏是道路养护管理的基础。传统人工检测和半自动检测存在诸多不足,如准确率不高、效率低下、受主观因素影响等,难以做到对路面损坏进行客观评价。随着计算机技术的快速发展,现阶段自动检测中运用图像识别技术检测路面表观损坏已成为道路工程领域的研究热点。
早期的研究采用经典的图像识别方法,如阈值分割法、边缘检测法、频域识别法。许多边缘检测器如Roberts、Prewit
目前的识别方法大多基于深度学习技术,相较经典图像识别方法,能提取深度特征,一般认为,识别能力在很大程度上取决于训练模型。Zhang
人类的直觉和大脑皮层视觉神经的相应实验表明历史信息影响着视觉识别的整个过
本文基于历史信息创建损坏识别初始约束条件的设计理念,提出一种基于历史信息的路面表观损坏图像识别方法。首先搭建面向历史信息应用的总体算法框架,该框架主要包括图像预处理及改进的损坏检测算法。其次,以横缝识别为例,提出改进的损坏检测算法中的算法流程以及引入历史信息建立算法初始约束条件的方法。最后,通过损坏图像实例测试进行性能评价与分析。
历史信息是指路面表观损坏识别之前已经获得的经验和历史资料。针对路面表观损坏识别的历史信息分类如

图1 历史信息分类
Fig. 1 Prior information classification
经验主要为路面养护管理的一般常识,例如:路面在使用过程中,由于受到行车载荷和自然因素的影响,原有的表观损坏在其周围会出现不同程度的损坏发展,如裂缝宽度及长度扩展、坑槽面积增大;在路面养护维修后病害会减少;受重载交通作用,路面表观更易出现损坏等。
历史资料包括:历史图像及历史数据。路面损坏车载检测技术可以结合GPS对所采集图像位置进行定位,在下一次周期性检测中拍摄同一位置的图像;而随着摄像技术的发展,架设固定位置相机拍摄某一段路面从而监控损坏情况也成为可能。因此,可以追溯在同一位置过去所采集的路面表观历史图像。同时,随着路面养护管理的精细化水平提升,某一段路面的养护时间、维修措施等历史数据也能获得。
本文所提的基于历史信息的路面表观损坏识别算法框架如

图2 算法框架
Fig. 2 Algorithm framework
图像预处理:其为图像识别分析前的重要准备工作,原始路面表观图像由于受到光照等影响不能直接进行损坏识别,图像需要经过特征提取后,才能用于后续改进的损坏检测算法。
改进的损坏检测算法:人类的直觉和大脑皮层视觉神经的相应实验表明历史信息影响着视觉识别的整个过程,该理论为路面表观损坏识别方法提供了新的思路。传统的路面表观损坏识别方法初始约束条件往往随机生成,而损坏识别具有对初始约束条件敏感的特性,即初始约束条件很大程度上影响识别的准确度和速度。因此,引入基于历史信息建立初始约束条件的机制从而改进损坏检测算法是本研究的关键。
如
原始图像由2个车载相机所拍图像拼接而成,每个相机拍摄的图像尺寸为1 000像素×1 024像素,灰度值范围为0~255。图像预处理的目的是将原始图像转化为可以进行损坏检测的特征图,方法分为2步:①直方图均衡化,②建立并训练VGG-16网络模型。
由于路面图片的采集时间以及周边环境的差异,路面光照条件不尽相同,一部分图像像素的灰度值可能较小,而另一部分图像像素的灰度值可能较大,即图像灰度标准不统一,而且当光照偏暗的时候难以识别裂缝等损坏。
为解决上述问题,首先将图像进行裁剪,使每张图像中仅有一种损坏,其次采用直方图均衡化方法对图像进行处理。直方图均衡化即建立一个映射关系,对图像中像素点的灰度值进行转换,使灰度值分布更为均匀,从而消除光照以及环境不同的影响。直方图均衡化处理后的图像与相应的累计直方图如

图3 直方图均衡化前后图像对比
Fig. 3 Comparison before and after histogram equalization
经过直方图均衡化的图像数据集样本数量统计如
VGG-16(Visual Geometry Group Network-16)网络是卷积神经网络中性能优秀的网络模
具体的网络示意图如

图4 VGG-16示意图
Fig. 4 Structure and parameters of VGG-16 convolution neural network model
VGG-16网络在测试集上的准确率与训练步数之间的关系如

图5 VGG-16训练过程
Fig. 5 Training process of VGG-16
VGG-16网络训练结束后,需要选取后续研究所用的特征通道,其选取方法为:首先,选择100张存在横缝损坏的图像,并人工采用黑色矩形框标记图像中横缝的区域,据此得到特征图上的相应损坏区域,标记方法如

图6 损坏区域标记
Fig. 6 Marking of distress area
针对每张图像最终输出的64个特征图,计算损坏区域与背景区域的特征值差异度,计算结果为18号特征通道所输出的特征图的平均差异度(5.13)最高,其输出效果如

图7 特征图输出效果
Fig. 7 Visualization of feature map
如何引入基于历史信息建立初始约束条件的机制从而改进损坏检测算法是本研究的关键。遗传算法(GA)是一种借鉴生物进化的特征、模拟生物的自然选择和遗传机制的全局优化搜索算法,从初始种群出发,通过不断遗传和变异逐步改善当前解,对图像的识别区域进行开发,最终获得问题的最优解。在遗传算法中,初始种群及特征参数可以视为初始约束条件,而遗传算法的特征是能够基于历史信息创建初始种群并且设计特征参数,这是本文选择遗传算法的原因所在。
基于历史信息的遗传算法流程如

图8 基于历史信息的遗传算法流程
Fig. 8 Flowchart of genetic algorithm based on prior information
标准遗传算法其初始种群随机产生,同时,其适应度函数中的全部特征参数都需要优化,因此会出现收敛速度较慢和误检的问题,导致算法的适用性不强。
本文假设了路面表观损坏的历史信息:①待检测图像中仅有一处损坏,②历史图像中仅有横缝损坏,③随着时间推移,待检测图像中的横缝有可能会较历史图像中的横缝有所发展。根据该假设,待检测图像中的损坏区域与历史图像中的损坏区域位置相近。因此在算法中,可将历史图像中的损坏区域设置为待检测图像识别的初始感兴趣区域,即将过去的检测结果(曾经的最优解)作为改进的损坏检测算法的初始种群,使初始感兴趣区域与待检测图像实际的损坏区域相近,个体尽可能生成在最优解可能存在的范围内。该算法相较于随机创建初始种群(初始感兴趣区域),能提高初始种群的质量,从而减少搜索空间,其初始感兴趣区域设置方法如

图9 初始感兴趣区域设置方法
Fig. 9 Initial region of interest setting method
在遗传算法程序运行中,需要为横缝设计特征参数,如

图10 横缝特征参数
Fig. 10 Characteristic parameters of transverse crack
历史图像中的横缝损坏出现在图像左(右)边缘时,假设横缝损坏可能会有所发展,则待检测图像中的横缝左(右)端点与历史图像中的横缝左(右)端点位置相同。当历史图像中的横缝损坏出现在图像中间时,可以假设待检测图像中的横缝中点与历史图像中的横缝中点相近,通过上述推理,可以减少算法中需要优化的特征参数。以下为具体特征参数设计方法:
参考
横缝仅向右侧发展的情况下(历史图像中横缝位于图像左边缘),仅需优化w和k 这2个特征参数,x和y可以直接使用x0和y0赋值,如
(1) |
横缝仅向左侧发展的情况下(历史图像中横缝位于图像右边缘),仅需优化w和k 这2个特征参数,x和y可以通过右端点不变的约束条件计算得到,如
(2) |
横缝往两侧发展的情况下(历史图像中横缝位于图像中间),需要优化x、k和w这3个特征参数,y可以通过经过特定点的约束条件计算得到,如
(3) |
在
首先设计损坏检测框,该检测框中包含横缝中心区域(宽度为9个元素,特征值分布为20 ~ 10)、横缝两侧区域(宽度各为4个元素,特征值分布为1 ~ 0),如

图11 区域划分方法
Fig. 11 Method of regional division
其次根据
(4) |
式中:m为特征图上位于中心区域的元素数量;n为特征图上位于两侧区域的元素数量;Vi为第i个位于中心区域的元素的特征值;Vj为第j个位于两侧区域的元素的特征值;α为修正参数,计算方法为8m/(9n);β为修正参数,取0.227。
由于横缝中心区域宽度为9个元素、横缝两侧宽度共为8个元素,因此需要引入α参数进行修正,从而保证中心区域与两侧区域的元素权重相等,α的计算方法为8m/(9n);由于背景区域的特征值分布在1 ~ 0之间,因此需要引入参数β,使得背景区域元素的特征值加上β后为正数,而处于横缝区域元素的特征值加上β仍为负数,从而保证T值最大时,横缝处于检测框中心,在本研究中β参数的取值为100张横缝特征图中背景区域元素特征值的中位数绝对值0.227。
用于性能评价的实验数据采用3组横缝图像,如
设计3个实验方法,如
方法1:不运用本文所提的基于历史信息的图像识别算法框架,随机创建初始约束条件。
方法2:运用本文所提的基于历史信息的图像识别算法框架,基于历史信息建立初始种群,即以先前横缝损坏识别的最优解作为遗传算法的初始种群(见3.2节)。
方法3:运用本文所提的基于历史信息的图像识别算法框架,不仅基于历史信息建立初始种群,而且基于历史信息设计特征参数,减少需要优化的特征参数数量(见3.2、3.3节)。
由于3种方法均能100%准确识别损坏,所以主要对检测速度进行比较,如
从
如

图12 平均检测时间
Fig. 12 Average detection time
分析原因为:方法1不使用本文所提的算法框架,随机创建初始约束条件,所以检测时间较长,且由于随机性,所需检测时间也不稳定;方法2及方法3都运用了本文所提的算法框架,基于历史信息创建了初始约束条件,而损坏识别具有对初始约束条件敏感的特性,即初始约束条件的设定能显著影响检测时间,所以2种方法都相较方法1大幅提升了检测速度;方法2以历史图像损坏识别的最优解作为遗传算法的初始种群,而初始种群与最优解距离较近,因此不仅相比方法1提升了检测速度,而且其检测时间在不同实验中也相对稳定;方法3不仅以历史图像损坏识别的最优解作为遗传算法的初始种群,而且减少需要优化的特征参数,通过在算法中增加了历史信息,则进一步减少了算法的复杂度,从而相较方法2大幅提升了检测速度;在方法3中,横缝向左侧发展和向右侧发展时的平均检测时间相近(0.31s和0.33s),且显著低于横缝向两侧发展的平均检测时间(2.21s),原因在于根据3.3节的设计方法共有4个特征参数,横缝向两侧发展时初始约束条件只确定了1个参数,而横缝向左侧发展或向右侧发展时初始约束条件确定了2个参数,进一步说明了在算法的初始约束条件中确定更多的历史信息能大幅提升检测速度。
(1)历史信息影响着视觉识别的整个过程,现有的路面表观损坏图像识别方法都没有考虑到利用识别前已有的历史信息,而本文的基于历史信息建立路面表观损坏图像识别的方法,通过利用历史信息创建损坏识别的初始约束条件,提升了识别准确率与速率。
(2)提出了一种基于历史信息的路面表观损坏图像识别算法框架,该框架主要分为图像预处理及改进的损坏检测算法2个部分。实验证明,随着在改进的损坏检测中增加更多的历史信息用于创建初始约束条件能显著减少算法收敛时间,在不降低识别准确度的前提下提升识别速度,最快可较不运用历史信息的算法提升141.71倍速度。
(3)本文识别沥青路面横缝损坏,以历史图像、养护经验作为历史信息进行实验设计并进行性能评价与分析,尚未考虑不同损坏、不同历史信息在该识别方法中的具体应用,这些研究将在后续工作中展开。本文重在阐述基于历史信息改进路面表观损坏图像识别方法的思路与框架,以期为今后的识别方法设计提供新思路。
(4)现阶段车载流动检测的方式难以采集某一固定位置的沥青路面图像,即难以获得本研究中所指的历史图像。然而随着固定摄像技术的发展,历史图像的获取方法变得简易,则本研究所提方法的适用性将更广。
作者贡献声明
徐婷怡:设计框架、实验研究及论文撰写。
姜振天:数据采集及实验研究。
梁远路:实验研究及论文撰写
陈 长:技术指导及论文审定。
孙立军:技术指导及论文审定。
参考文献
LI G, HE Y A. Novel image detection and classification for pavement crack under non-uniform illumination[J]. Acta Photonica Sinica, 2010, 39(8):1405. DOI: 10.3788/gzxb20103908.1405. [百度学术]
李晋惠. 用图像处理的方法检测公路路面裂缝类病害[J]. 长安大学学报 (自然科学版), 2004, 24(3): 24. DOI: 10.3321/j.issn:1671-8879.2004.03.007. [百度学术]
LI Jinhui. Pavement crack diseases detecting by image processing algorithm[J]. Journal of Chang'an University(Natural Science Edition), 2004, 24(3): 24. DOI: 10.3321/j.issn:1671-8879.2004.03.007. [百度学术]
夏德深, 傅德胜. 现代图像处理技术与应用[M]. 南京: 东南大学出版社, 1997. [百度学术]
XIA Deshen, FU Desheng. Modern image processing technology and application[M]. Nanjing: Southeast University Press, 1997. [百度学术]
ZHOU J, HUANG P S, CHIANG F P. Wavelet-aided pavement distress image processing[J]. Proceedings of SPIE - The International Society for Optical Engineering, 2003, 5207(2): 728. DOI: 10.1117/12.509670. [百度学术]
DO M N, VETTERLI M. The finite ridgelet transform for image representation [J]. IEEE Transactions on Image Processing, 2003,12(1): 16. [百度学术]
ZHANG Lei, YANG Fan, ZHANG Daniel, et al. Road crack detection using deep convolutional neural network[C]// IEEE International Conference on Image Processing (ICIP 2016). Piscataway: IEEE, 2016:3708-3712. [百度学术]
李楠. 基于深度学习框架Caffe的路面裂缝识别研究[J]. 工程技术研究, 2017(3): 20. DOI:10.3969/j.issn.1671-3818.2017.03.009. [百度学术]
LI Nan. Research on pavement crack recognition based on deep learning framework Caffe[J]. Engineering technology research, 2017(3): 20. DOI:10.3969/j.issn.1671-3818.2017.03.009. [百度学术]
车艳丽. 基于深度学习的路面裂缝分类与识别技术研究与实现[D]. 西安: 长安大学, 2018. [百度学术]
CHE Yanli. Research and implementation of pavement crack classification and recognition technology based on deep learning[D]. Xi’an: Chang'an University, 2018. [百度学术]
袁亚超. 基于深度学习的路面裂缝检查及全面质量管理方法研究[D]. 重庆: 重庆大学, 2017. [百度学术]
YUAN Yachao. Research on pavement crack inspection and total quality management method based on deep learning[D]. Chongqing: Chongqing University, 2017. [百度学术]
李伟. 基于深度卷积网络的路面裂缝分割方法[C]//2019世界交通运输大会论文集(下). 北京: 中国公路学会, 2019: 346-356. [百度学术]
LI Wei. Pavement crack segmentation method based on deep convolution network [C]// Proceedings of world transportation Congress 2019 (Part 2). Beijing: China Highway Society, 2019: 346-356. [百度学术]
张宁. 基于Faster R-CNN的公路路面病害检测算法的研究[D]. 南昌: 华东交通大学, 2019. [百度学术]
ZHANG Ning. Research on highway pavement disease detection algorithm based on Faster R-CNN [D]. Nanchang: East China Jiaotong University, 2019. [百度学术]
孙朝云,裴莉莉,李伟,等.基于改进Faster R-CNN的路面灌封裂缝检测方法[J].华南理工大学学报(自然科学版), 2020, 48(2): 84. DOI: CNKI:SUN:HNLG.0.2020-02-011. [百度学术]
SUN Chaoyun, PEI Lili, LI Wei, et al. Detection method of pavement filling cracks based on improved Faster R-CNN [J]. Journal of South China University of Technology (Natural Science Edition), 2020, 48 (2): 84. DOI: CNKI:SUN:HNLG.0.2020-02-011. [百度学术]
DU Yuchuan, PAN Ning, XU Zihao, et al. Pavement distress detection and classification based on YOLO network[J]. International Journal of Pavement Engineering, 2020(1): 1. DOI: 10.1080/10298436.2020.1714047. [百度学术]
LI W, PIECH V, GILBERT C D. Perceptual learning and top-down influences in primary visual cortex[J]. Nature Neuroscience, 2004, 7(6):651. DOI: 10.1038/nn1255. [百度学术]
LAN R, ZHOU Y, LIU Z, et al. Prior knowledge-based probabilistic collaborative representation for visual recognition[J]. IEEE Transactions on Cybernetics, 2018, 50(4): 1. DOI: 10.1109/TCYB.2018.2880290. [百度学术]
GAO Q, WANG X, XIE G. License plate recognition based on prior knowledge[C]//Proceedings of the IEEE International Conference on Automation and Logistics. Piscataway: IEEE, 2007: 2964-2968. [百度学术]
WANG Y, MAO L, YU M A, et al. Automatic recognition of parathyroid nodules in ultrasound images based on fused prior pathological knowledge features[J]. IEEE Access, 2021(9): 69626. DOI:10.1109/ACCESS.2021.3075226. [百度学术]
DING X, LUO Y, LI Q, et al. Prior knowledge-based deep learning method for indoor object recognition and application[J]. Systems Science & Control Engineering, 2018, 6(1): 249. DOI: 10.1080/21642583.2018.1482477. [百度学术]
MANUEL L A, RUBEN G O, NICOLAI P. Appearance-invariant place recognition by discriminatively training a convolutional neural network[J]. Pattern Recognition Letters, 2017, 92:89. DOI: 10.1016/j.patrec.2017.04.017 [百度学术]