摘要
针对探地雷达(GPR)数据解译依赖于人工经验,存在费时费力和主观偏差的问题,提出了基于极限梯度提升(XGBoost)和GPR时频特征的水泥路面脱空识别方法。采用正演模拟、室内试验和现场试验获得了脱空病害数据源,建立含有标签的脱空GPR数据集;通过重采样方法统一GPR数据采样频率,并对预处理后的GPR数据进行时频域特征提取,建立了包含18个时域和12个频域特征的数据集。以时频域特征为输入,是否存在脱空病害为输出,采用XGBoost算法构建脱空识别模型,并与随机森林(RF)和人工神经网络(ANN)算法进行对比。结果表明,模型的识别准确率排序为XGBoost(98.10%)>ANN(95.10%)>RF(93.17%),XGBoost模型识别精度最高,并能在实际路面上准确定位脱空区域。
水泥路面具有强度高、耐久性好的特点,但存在水泥路面层与基层刚度不匹配问题。在温度和车辆荷载的重复作用下,面层底部出现脱空区域并逐步扩展,最终导致路面出现断板。脱空区域的横向尺寸是影响路面结构承载力的重要参
探地雷达(GPR)是利用高频电磁波在介质中的反射和散射来实现浅层成像和定位的高分辨率深层无损探测技术,通过路面电磁特性变化定性或定量地识别地下目标体,因此被广泛应用于地下空
相比图谱识别,基于A‒scan信号特征的病害识别在横向尺寸上获得更高的精度,目前常见的建模方法有支持向量机(SVM
以水泥路面脱空病害为研究对象,采用正演模拟、室内模型和现场试验相结合的方法建立了标准脱空数据集,其中包含10 732条脱空数据和10 251条正常数据。针对GPR天线频率和采样参数不一致的问题,提出用重采样和标准化方法统一数据采样信息和幅值范围。在时频特征提取方
在实际服役中水泥路面受到温度荷载和车辆荷载的耦合作用,出现由板底塑性变形导致的板底脱空,最终形成断板。板底脱空包括充气脱空和含水脱空,充气脱空是板底脱空的早期形态。

图1 水泥路面板底脱空
Fig.1 Void under cement pavement slab
以板底充气脱空为例,简化充气脱空的形状,使用16~300 mm不等的矩形脱空和圆形脱空进行室内试验和正演模拟,并综合现场试验数据构建脱空数据集。正演模拟和室内试验提供标准脱空特征,并为现场判断脱空提供依据,现场试验数据用于模型训练和验证模型的准确性。脱空数据集构成如

图2 脱空数据集构建
Fig.2 Void dataset construction
gprMax正演模拟是以时域有限差分为基础的雷达信号仿真算法,被广泛应用于GPR的病害模拟,以获得病害区域的信号特

图3 正演脱空模型(单位:mm)
Fig.3 Simulated void model(unit:mm)
参数 | 数值 |
---|---|
模型尺寸/(mm×mm) | 1 000×5 100 |
线中心频率/MHz | 800/900 |
网格尺寸/mm | |
时窗/ns | 16 |
采样频率/GHz | 42.66 |
天线间距/m | 0.14 |
激励源类型 | Ricker |

图4 正演脱空模型的B-scan结果
Fig.4 B-scan results of simulated void model
从仿真结果可知,脱空形状并不影响脱空特征。为此,室内模型仅考虑不同尺寸的矩形脱空,构建了横向尺寸分别为100、90、80、70、60、50、40、30、25、16 mm的10个矩形脱空区域A1~A10,脱空区域的中心深度和中心间隔分别为200 mm和150 mm。模型材料为型号C30的水泥混凝土,尺寸为,如

图5 室内试验水泥板模型
Fig.5 Model of lab test
雷达系统 | 天线中心频率/MHz | 采样频率/GHz | A‒scan采 样点数 | 采样间距/mm |
---|---|---|---|---|
RIS雷达 | 900 | 16 | 471 | 2 |
US雷达 | 1 000 | 40 | 467 | 10 |

图6 室内模型雷达实测剖面图谱
Fig.6 GPR results of lab model
探地雷达的纵向分辨率与雷达天线的频率有关,具体关系如下所示:
(1) |
式中:为探地雷达的纵向分辨率;为探地雷达波在介质中传播的波长。
以波速0.1 m·n
对广西桂林永福县永鹿路部分路面进行数据采集,部分路面已经出现断板(见

图7 现场试验
Fig.7 Field test

图8 现场路面B‒scan图谱
Fig.8 B-scan results of field test
采用以上3种试验方法,共获取60万道A‒scan数据,正演模拟5万道,室内模型5万道,现场检测50万道。使用ReflexW软件对上述数据进行分析,并对数据集中的脱空区域数据给出“1”的真值标签,正常区域数据给出“0”的真值标签。经过人工筛选后,选择20 983道A‒scan数据作为数据集,其中10 623道为室内和现场数据(脱空6 745道,正常3 878道),10 360道为正演数据(脱空3 987道,正常6 373道),合计脱空数据10 732道,正常数据10 251道。
对正反演GPR数据进行分析,如

图9 正演模拟、室内和现场试验的A‒scan数据对比
Fig.9 Comparison of GPR signal among simulation, lab and field tests
通过对比,确定了如

图10 雷达数据预处理流程
Fig.10 Flow chart of radar data preprocessing
不同天线频率以及数据源差异均导致电磁波幅值差异,因此采用标准化处理方法,将GPR数据处理成均值为0和标准差为1的数据,具体方法如下所示:
(2) |
式中:为探地雷达采集的数据矩阵;为标准化后的数据矩阵;为整体数据方差;为整体数据均值。
参照水损害的特征提取方
(3) |
(4) |
(5) |
式中:为该道A‒scan第i个采样点数据,=1,2,…,,是每条A‒scan的采样点数。对提取的30个时频域特征采用

图11 30个时频域特征值对比
Fig.11 Comparison of 30 time-frequency domain feature values
为了实现脱空识别,对数据集的20 983道数据进行时域和频域特征的提取,提取的时频域特征组成一个()的特征数据集矩阵。将1.2节中给出的对应每一条A‒scan数据的真值标签移植到时频域特征数据集中,构成含有真值标签的特征数据集,这个数据集用于后续模型训练。
对提取的30个时频域特征进行特征重要性分析,选择最小的特征子集,可加快模型训练速度和提升识别性能。特征重要性分析常用的方法有卡方检验、互信息、基于树模型和费希尔信息的方法。由于各种特征分析方法存在评价指标的差异,因此采用基于多种方法融合的分析方法来选取重要特征。特征重要性分析流程如

图12 特征重要性分析流程
Fig.12 Flow chart of feature significance analysis
由于4种特征重要性分析方法的评价得分范围存在差异,单纯地将得分相加不能得到客观的最终得分,因此对4种分析方法的得分进行归一化处理,归一化结果相加得到最终的重要性评价得分。4种分析方法归一化和相加的最终得分如

图13 特征重要性得分归一化结果
Fig.13 Normalization results of feature significance score

图14 特征重要性得分排序
Fig.14 Ranking of feature significance
选取综合得分大于1的21个时频域特征作为识别模型的输入。进一步地去除数据集中非重要的特征,得到含有真值标签的数据集,用于识别模型的训练。
对于XGBoost算法,为避免模型过拟合,加快训练速度,提升拟合及预测精度,损失函数应用了二阶泰勒展开,在目标函数中加入正则项。将含有个样本个特征的数据集分为2类,数据集
(6) |
建立二分类模型,样本在第轮预测值的表达式如下所示:
(7) |
式中:K表示模型中总的决策树数;表示回归树空间;表示回归树叶子节点权重;表示回归树结构,把每个样本节点映射到对应叶子节点的索引;表示样本所在的叶子节点;表示叶子节点数。
XGBoost算法的目标函数包括损失函数和正则项两部分,定义如下:
(8) |
(9) |
式中:为损失函数项;为目标函数的正则项,由叶子节点数和叶子节点权重表示对模型复杂度的惩罚,防止模型过拟合;和为模型超参数。在第轮迭代时,加入新的模型,对
(10) |
式中:为损失函数的一阶梯度统计;为损失函数的二阶梯度统计。迭代获得模型的最小O值时表示模型训练完成。当模型预测结果大于0.5时,将预测结果置为1,否则结果置为0。
GPR检测过程中存在噪声、干扰和天线跳动问题,连续的GPR数据中存在单道或者连续几道的干扰信号,致使识别模型对此类数据给出错误的识别结果。小尺寸的脱空病害也会对识别结果产生干扰,降低识别结构的可读性。采用如

图15 高斯权重系数曲线
Fig. 15 Gaussian weight coefficient curve
将GPR信号数据集通过特征提取和归一化后构建特征数据集,并分为训练集和测试集,训练集用于XGBoost模型训练,测试集用于模型的识别性能测试。预测模型建立流程如

图16 XGBoost模型训练流程
Fig.16 Flow chart of XGBoost model training
(1) 将含有真值标签的时频特征数据集()随机抽取70%作为XGBoost模型训练集样本,30%作为模型测试集样本。
(2) 将训练集样本输入算法模型中进行训练,并采用交叉验证和网格搜索方法调整模型的max_depth(最大树深)和n_estimators(子学习器个数)等超参数,获得最优的预测模型。
(3) 将测试集样本输入预测模型,检验模型的预测准确率,并存储预测模型。训练后获得的最优模型将用于后续路面脱空病害识别。
为提高模型的准确率,采用五折交叉验证和网格搜索方法调优模型的关键参

图17 参数调优曲线
Fig.17 Parameter tuning curve
参数名称 | 含义 | 设置值 |
---|---|---|
max_depth | 最大树深 | 11 |
learning_rate | 学习率 | 0.01 |
n_estimators | 子学习器个数 | 1 000 |
subsample | 样本采样率 | 0.6 |
reg_lambda | L2正则化系数 | 1 |
模型 | /% | |||
---|---|---|---|---|
XGBoost | 1.000 0 | 0.990 0 | 0.990 0 | 99.63 |
ANN | 0.990 0 | 0.990 0 | 0.990 0 | 99.30 |
RF | 0.990 0 | 0.980 0 | 0.980 0 | 99.28 |
模型 | 脱空识别准确率/% | 预测时间/s |
---|---|---|
XGBoost | 98.10 | 0.141 |
ANN | 95.10 | 0.203 |
RF | 93.17 | 0.196 |
使用
为了确定所提方法的有效性,在测试数据集(950道数据)上进行对比,结果如

图18 XGBoost、RF和ANN模型识别结果
Fig.18 Performance of XGBoost, RF and ANN models
将

图19 XGBoost正演模型雷达数据预测结果
Fig.19 Prediction results of XGBoost on forward model

图20 脱空横向尺寸对比
Fig.20 Comparison of lateral dimension
任取2段存在脱空区域的数据,考虑单个脱空和多处脱空的状态,现场检测GPR结果如

图21 实际路面脱空病害识别
Fig.21 Identification of actual pavement void disease
(1) XGBoost模型给出连续的“1”的识别结果比孤立的“1”的识别结果更能说明此处路面脱空病害的存在,在对路面脱空病害尺度的评估中占有更大权重。
(2) XGBoost模型识别结果中存在稀疏的孤立“1”的结果,可能不是由路面脱空病害造成的,如数据集不全面;在进行雷达数据采集时存在干扰造成的雷达信号波动;存在早期的脱空病害(横向尺寸小于2 cm),但尺寸过小难以验证。
实际项目中主要关注大范围脱空区域,为减少孤立点对识别结果的干扰,引入识别结果的后处理方法。当一条A‒scan的XGBoost模型识别结果为“1”,左右相邻的连续10条雷达数据的识别结果与高斯判断系数相乘并相加的和等于或大于5时,此条A‒scan识别结果才为“1”。此外,如果一个测试段(10条A‒scan)雷达数据中有90%的A‒scan都被XGBoost模型识别为“1”,整个测试段就被视为一个连续的脱空区域,XGBoost模型的结果都修改为“1”。
对XGBoost模型识别结果进行后处理,得到如
上述验证结果表明,所构建的模型可有效地确定路面脱空区域。为进一步验证模型的准确性,在封闭交通的条件下,对模型识别出脱空的位置(见

图22 取芯验证
Fig.22 Verification by coring
(1)分析了GPR在脱空和正常区域的时域和频域响应差异,提出了18个时域和12个频域的时频域特征,用以表征脱空和正常区域的GPR数据。通过正演模拟、室内试验和现场试验构建脱空数据集来训练XGBoost模型,实现了脱空病害的自动识别。
(2) 提出了重采样和标准化的GPR数据处理方法,统一不同GPR数据的采样频率,解决了不同采样频率和不同天线频率对识别模型的影响,可以解决不同源的数据使用和识别问题。
(3) 对比了XGBoost、RF和ANN的模型, XGBoost模型最优,脱空识别准确率达到了98.10%,高于ANN(95.10%)和RF(93.17%)。
作者贡献声明
张 军:论文构思,论文撰写和修改。
姜文涛:模型构建,程序设计,论文撰写及修改。
张 云:开展室内和现场试验。
罗婷倚:开展现场试验和数据分析。
余秋琴:试验数据分析。
杨 哲:孤立点的权重系数设计。
参考文献
王春和,胡通海,崔海涛, 等. 探地雷达技术用于地下空洞塌陷灾害探测的创新与实践[J]. 测绘通报, 2013(S1): 13. [百度学术]
WANG Chunhe,HU Tonghai,CUI Haitao,et al. The innovation and practice of ground penetrating radar technology used for disasters investigation especially for underground cavity or collapse detection[J].Bulletin of Surveying and Mapping,2013(S1): 13. [百度学术]
刘迎春,覃晖. 隧道壁后空洞检测的探地雷达试验[J]. 实验室研究与探索, 2022, 41(1): 53. [百度学术]
LIU Yingchun, QIN Hui. Model test of tunnel lining void detection using ground penetrating radar [J]. Research and Exploration in Laboratory, 2022, 41(1): 53. [百度学术]
栗宝鹃,张美多,王志豪, 等. 水工混凝土结构钢筋分布及锈蚀检测[J]. 工程地球物理学报, 2021, 18(2): 257. [百度学术]
LI Baojuan, ZHANG Meiduo, WANG Zhihao,et al. Steel bar distribution and corrosion detection of hydraulic concrete stucture [J]. Chinese Journal of Engineering Geophysics, 2021, 18(2): 257. [百度学术]
彭建,杨泽帆,白洁, 等. 基于探地雷达的地下管线埋深估计方法[J]. 雷达科学与技术, 2022, 20(1): 79. [百度学术]
PENG Jian, YANG Zefan, BAI Jie, et al. Depth estimation of underground pipeline using ground penetrating radar [J]. Radar Science and Technology, 2022, 20(1): 79. [百度学术]
朱兆荣,赵守全,秦欣, 等. 探地雷达在铁路隧道衬砌质量无损检测中的应用研究[J]. 工程地球物理学报, 2021, 18(5): 703. [百度学术]
ZHU Zhaorong, ZHAO Shouquan, QIN Xin, et al. Application of ground penetrating radar in nondestructive testing of railway tunnel lining quality [J]. Chinese Journal of Engineering Geophysics, 2021, 18(5): 703. [百度学术]
ZHANG J,LU Y M,YANG Z, et al. Recognition of void defects in airport runways using ground-penetrating radar and shallow CNN[J]. Automation in Construction, 2022, 138: 104260. [百度学术]
ZHANG J,ZHANG C,LU Y M, et al. In-situ recognition of moisture damage in bridge deck asphalt pavement with time-frequency features of GPR signal[J]. Construction and Building Materials, 2020, 244: 118295. [百度学术]
王辉,欧阳缮,廖可非, 等. 基于深度学习的GPR B‒SCAN图像双曲线检测方法[J]. 电子学报, 2021, 49(5): 953. [百度学术]
WANG Hui, OUYANG Shan, LIAO Kefei, et al. GPR B-SCAN image hyperbola detection method based on deep learning[J]. Acta Electronica Sinica, 2021, 49(5): 953. [百度学术]
XIANG Z,RASHIDI A,OU G. An improved convolutional neural network system for automatically detecting rebar in GPR data [C]//Computing in Civil Engineering 2019: Data, Sensing, and Analytics. Reston: American Society of Civil Engineers, 2019: 422-429. [百度学术]
张东昊,覃晖. 基于探地雷达和深度学习的隧道初期支护检测方法[J]. 现代隧道技术, 2020, 57(S1): 174. [百度学术]
ZHANG Donghao, QIN Hui. Tunnel primary support detection using ground penetrating radar and deep learning [J]. Modern Tunnelling Technology, 2020, 57(S1): 174. [百度学术]
KO H-Y,KIM N-G. Performance analysis of detecting buried pipelines in GPR images using faster R-CNN[J]. Journal of Convergence for Information Technology, 2019, 9(5): 21. [百度学术]
DINH K,GUCUNSKI N,ZAYED T. Automated visualization of concrete bridge deck condition from GPR data[J]. NDT & E International, 2019, 102: 120. [百度学术]
LI S,GU X,XU X, et al. Detection of concealed cracks from ground penetrating radar images based on deep learning algorithm[J]. Construction and Building Materials, 2021, 273: 121949. [百度学术]
王辉,欧阳缮,刘庆华, 等. 基于深度学习的探地雷达二维剖面图像结构特征检测方法[J]. 电子与信息学报, 2022, 44(4): 1284. [百度学术]
WANG Hui, OUYANG Shan, LIU Qinghua, et al. Structure feature detection method for ground penetrating radar two-dimensional profile image based on deep learning [J]. Journal of Electronics & Information Technology, 2022, 44(4): 1284. [百度学术]
XIE X Y,QIN H,YU C, et al. An automatic recognition algorithm for GPR images of RC structure voids[J]. Journal of Applied Geophysics, 2013, 99: 125. [百度学术]
郑艾辰,赵浩然,谭冰心, 等. 基于SVM的隧道衬砌空洞填充物雷达图像识别研究[J]. 现代隧道技术, 2022, 59(2): 45. [百度学术]
ZHENG Aichen, ZHAO Haoran, TAN Bingxin, et al. Radar image recognition of tunnel lining cavity fillings based on SVM [J]. Modern Tunnelling Technology, 2022, 59(2): 45. [百度学术]
BREIMAN L. Random forests[J]. Machine Learning, 2001, 45(1): 5. [百度学术]
CHEN T Q,GUESTRIN C. XGBoost: a scalable tree boosting system[C]//Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco: ACM, 2016: 785-794. [百度学术]
杜豫川,都州扬,刘成龙. 基于极限梯度提升的公路深层病害雷达识别[J]. 同济大学学报(自然科学版), 2020, 48(12): 1742. [百度学术]
DU Yuchuan, DU Zhouyang, LIU Chenglong. Road diseases recognition of ground penetrating radar based on extreme gradient boosting [J]. Journal of Tongji University(Natural Science), 2020, 48(12): 1742. [百度学术]
覃晖,唐玉,谢雄耀, 等. 基于支持向量机的隧道衬砌空洞机器识别方法[J]. 现代隧道技术, 2020, 57(2): 13. [百度学术]
QIN Hui, TANG Yu, XIE Xiongyao, et al. Machine recognition method of tunnel lining voids based on SVM algorithm [J]. Modern Tunnelling Technology, 2020, 57(2): 13. [百度学术]
周辉林,姜玉玲,徐立红, 等. 基于SVM的高速公路路基病害自动检测算法[J]. 中国公路学报, 2013, 26(2): 42. [百度学术]
ZHOU Huilin, JIANG Yuling, XU Lihong, et al. Automatic detection algorithm for expressway subgrade diseases based on SVM [J]. China Journal of Highway and Transport, 2013, 26(2): 42. [百度学术]
张军,张超,陶君, 等. 一种基于探地雷达信号时频统计特征的水损害识别方法: 中国,CN109782274A[P]. 2019-05-21. [百度学术]
ZHANG Jun, ZHANG Chao, TAO Jun, et al. A method of moisture damage identification based on the time-frequency statistical characteristics of GPR signal: China,CN109782274A[P]. 2019-05-21. [百度学术]
孙忠辉,刘金坤,张新平, 等. 基于GprMax的隧道衬砌地质雷达检测正演模拟与实测数据分析[J]. 工程地球物理学报, 2013, 10(5): 730. [百度学术]
SUN Zhonghui, LIU Jinkun, ZHANG Xinping, et al. The tunnel lining detection forward numeral simulation and measured data analysis based on GprMax[J]. Chinese Journal of Engineering Geophysics, 2013, 10(5): 730. [百度学术]
ZHAO L,ZHANG J,JIAO S, et al. Ground surface detection method using ground penetrating radar signal for sugarcane harvester base-cutter control[J]. Biosystems Engineering, 2022, 219: 103. [百度学术]
PEI L L,SUN Z Y,YU T, et al. Pavement aggregate shape classification based on extreme gradient boosting[J]. Construction and Building Materials, 2020, 256: 119356. [百度学术]