摘要
为提高黏结集料图像的分割精度,提出了基于Inception网络与残差连接优化的黏结集料图像分割模型(Multi-ResUnet模型)。利用实验室自主研发的集料三维特性分析系统V3.0对黏结集料图像进行采集,并建立图像分割模型样本集,然后采用图像分割模型对样本集进行训练。结果表明:相较于分水岭算法和Unet模型,该图像分割模型的精确率分别提升了30.46%和2.11%,召回率分别提升了4.68%和1.85%,准确率分别提升了25.95%和2.47%。
集料在沥青路面中起关键性的骨架与填充作用,对于集料生产企业,传送带上集料粒径检测的准确与否对于集料的生产效率及生产质量的评价起着决定性作
国内外学者对黏结集料图像分析进行了广泛研究,但黏结集料图像的分割效果还有待进一步提
分水岭算法、自适应阈值分割算法、基于集料边缘的分割算法等虽然能够实现对黏结集料图像的基本分割,但是不能满足复杂环境下的精细分割需求。同时,这些算法还存在参数复杂度较高或需指定分割阈值等问题。因此,提出了Multi-ResUnet模型,实现对黏结集料较为准确的分割。
Unet模型是一种基于全卷积神经网络(FCN)的改进的网络模

图 1 Unet模型网络结构
Fig. 1 Structure of Unet network
Unet模型通过数据增强应对可用训练数据集较少的情况,而数据增强主要通过随机弹性变形对训练样本进行增广,因此Unet模型不需要在图像标签集中应用随机弹性变形。对于集料形态的多样性以及相互遮挡情况下集料的复杂性,随机弹性变形可以有效模拟集料形态的真实变化,因此可将Unet模型应用于黏结集料图像分割。此外,Unet模型网络结构使用加权loss函数,可以给黏结集料背景部分的loss函数赋以更大的权重,将复杂的黏结集料图像与背景准确分割,实现对图像中集料部分和背景部分的精确区分。
Unet模型中,同一级别编码器和解码器通过跳层连接进行特征的融合,如在第1次池化操作之前第1个跳层连接将编码器与最后一个反卷积操作之后的解码器桥接在一起,使网络能够将池化操作期间丢失的空间特征信息从收缩路径传播到扩展路径。然而,这种结构也有弊端。编码器提取的特征是在网络的较低层进行计算的,而解码器提取的特征是在网络的较深层中进行计算的,简单地合并2组特征可能会产生语义鸿沟,因此对来自底层网络结构的特征进行更多的处理来解决语义鸿沟问题。
Szegedy
集料形状通常是不规则的且尺寸大小也不尽相同。形状大致可分为角形、立方形、细长形、片形、细长片形和不规则形6

图 2 不同形状集料二值化图
Fig. 2 Binarization images of aggregates in different shapes

图 3 不同尺寸集料二值化图
Fig. 3 Binarization images of aggregates in different sizes
Unet模型的网络结构中,每个收缩路径的池化层和扩展路径的转置卷积层后都有2个33的卷积层,实际上类似于一个55的卷积运算。基于Inception网络思想,可以使用多分辨率分析功能增强来优化Unet模型的网络结构。具体做法是将33、55与77卷积运算并行进行,从而使网络能够从不同比例的图像中学习到特征。Inception网络的计算原理如

图 4 Inception块计算原理示意图
Fig. 4 Schematic diagram of Inception block calculation principle
Multi-ResUnet模型使用一系列更轻量的33卷积块对更复杂的55和77卷积块进行分解重构,如

图 5 Inception块重构
Fig. 5 Inception block refactoring
在网络中加入一个残差连接可使网络能够学习到多个空间维度的特征,最终构建的网络结构如

图 6 MultiRes块
Fig. 6 MultiRes block
通常,在深度学习中网络拓扑越深,可从图像中提取出的特征就越具代表性,但一味地增加网络深度也会导致梯度消失与梯度爆炸。使用残差学习替代原始数据学习可以有效地防止这个问题。一般情况下的残差结构如

图 7 残差结构示意图
Fig. 7 Schematic diagram of residual structure
对于Unet模型中的语义鸿沟问题,可以在跳层连接中加入一些卷积层(即残差连接)以提高跳层连接前编码器提取特征的复杂度,在特征上附加的非线性变换能够在一定程度上平衡语义鸿沟。因此,残差连接可以使网络更加容易地学习到图像特征。残差连接结构如

图 8 残差连接
Fig. 8 Residual connection
在
采用Inception网络和残差连接对Unet模型进行优化,得到Multi-ResUnet模型,即将卷积层的2个卷积计算替换为基于Inception网络的MultiRes块,而Unet模型中的4个跳层连接被替换为基于残差结构的Res 路径,Multi-ResUnet模型的网络结构如

图 9 Multi-ResUnet模型的网络结构
Fig. 9 Network structure of Multi-ResUnet model
使用三维数据采集设备Gocator 3110采集4.75、9.50、13.20、16.00 mm四档共2 550个黏结集料的三维点云图像,采集设备如

图 10 黏结集料图像采集设备
Fig. 10 Image acquisition equipment for cohesive aggregates

图 11 黏结集料图像样本及其标签示例
Fig. 11 Sample image and label example of cohesive aggregates
试验在Windows 10系统下进行,网络模型的架构通过基于后台的Keras环境实现,训练环境的CPU为Intel core i7‒8700,GPU为NVIDIA 2080Ti,RAM为32 GB。网络超参数的设置为:根据图片尺寸选择的输入维度为(256,256),选择下降速度最快、效果最好的自适应矩估计(Adam)优化器,综合考虑模型的分割精度和显卡性能,选择每次训练的样本数(batch-size)为10,选取修正线性单元Relu作为激活函数(见

图 12 Relu激活函数
Fig. 12 Activation function Relu
(1) |
式中:为样本数量;为样本的标签;为个样本都为正的预测概率。
从精确率(precision)、召回率(recall)和准确率(accuracy)3个性能指标表达黏结集料图像分割精度,从而对模型性能进行客观评
(2) |
R | (3) |
A | (4) |
式中:P表示精确率;R表示召回率;A表示准确率;表示预测像素与真实像素均为1的像素点数;表示预测像素为1但真实像素为0的像素点数;表示预测像素为0但真实像素为1的像素点数;表示预测像素与真实像素均为0的像素点数。
Multi-ResUnet模型训练和测试过程中的损失函数曲线和准确率曲线如图

图 13 损失函数曲线
Fig. 13 Loss function curve

图 14 准确率曲线
Fig. 14 Accuracy curve
从Multi-ResUnet模型的损失曲线可以看出,在训练后期模型达到了较为稳定的状态。由
batch-size对模型的训练结果有重要影响,主要体现在每轮的训练时长和每次迭代的平滑度上,每轮迭代次数由全量样本和batch-size决定。batch-size设置过小会导致迭代梯度不平滑,模型训练的损失值发生振荡,不利于模型的收敛。小的batch-size可以更好地获得个体差异性,因此具有更高的精度。batch-size过大则容易陷入局部最优,不能准确地收敛于最小值,而且容易忽视数据中的个体差异性,使模型的训练精度下降。模型的学习率决定了寻找最优参数的快慢,较大的学习率使得网络训练的速度更快,但可能无法找到最优解,达不到最优效果。较小的学习率则会导致网络训练速度变慢,还可能使网络陷入局部最优解,找不到全局最优解。在模型训练中常常会出现过拟合和欠拟合的情况,训练轮数过小会导致模型训练欠拟合,得不到最优解,训练轮数过大则容易产生过拟合问题,在训练集上得到的模型无法在测试集上达到相近的测试效果,使模型的泛化能力变差。从图
为进一步验证Multi-ResUnet模型的性能,选取Unet模型和基于形态学的分水岭算法在10张测试集上进行对比试验,并通过精确率、召回率、准确率指标来评估分割效果,各模型的分割结果如

图 15 各模型分割结果
Fig. 15 Segmentation results of different models
从工程指标上分析,对测试集中的10张黏结集料图像进行了处理,共265颗集料,Multi-ResUnet模型可以将其中253颗集料的边缘分割出来,准确率达到95.47%。基于形态学的分水岭算法可以将黏结集料与背景进行有效分割,但在分割时需对算法的开闭结构要素大小进行不断调整以找到最优值,而且易将黏结的多个集料分割为一个颗粒。从

图 16 各模型在测试集上的性能表现
Fig. 16 Performance of models on test set
由
提出了基于Inception块与残差连接优化的Multi-ResUnet模型。采用Multi-ResUnet模型对黏结集料图像进行分割,并与Unet模型和分水岭算法的分割结果进行对比。结果表明, Multi-ResUnet模型可以更加准确地将黏结集料的边缘进行分割,并且可以有效抑制集料边缘不连续与过分割。同时,Multi-ResUnet模型在3个性能指标上的表现也最优,分割精确率可以达到0.933 6,证明了该模型的优越性。
作者贡献声明
郝雪丽:提出研究方案,设计论文框架,审阅论文,提供技术及经费支持。
李玉峰:调研及文献整理,参与数据预处理及程序编写,起草并修订论文。
裴莉莉:调研及文献整理,参与算法开发及方法验证,修订论文。
李 伟:指导研究方案,审阅论文,提供技术及经费支持。
石 丽:实施现场试验,构建数据集,参与数据分析和处理,验证算法。
曹 磊:实施现场试验,参与算法设计实现,模型训练,论文写作及修订。
参考文献
丛林,谭乐,吴敏,等.基于集料特性的沥青混合料长期抗滑性能衰减模型[J].同济大学学报(自然科学版),2019,47(5):668. [百度学术]
CONG Lin, TAN Le, WU Min,et al. Long-term anti-sliding performance attenuation model of asphalt mixture based on aggregate characteristics[J]. Journal of Tongji University(Natural Science),2019,47(5):668. [百度学术]
SU D, YAN W M. Quantification of angularity of general-shape particles by using Fourier series and a gradient-based approach[J]. Construction and Building Materials, 2018, 161: 547. [百度学术]
ARAUJO S, BICALHO V, TRISTAO A. Use of digital image analysis combined with fractal theory to determine particle morphology and surface texture of quartz sands[J]. Journal of Rock Mechanics and Geotechnical Engineering, 2017, 9(6): 1131. [百度学术]
丁旭东, 耿超, 崔珊珊. 基于结构光的粗集料颗粒粒径计算方法研究[J]. 现代交通技术, 2018, 15(3): 9. [百度学术]
DING Xudong,GENG Chao,CUI Shanshan.Research on coarse aggregate size computation based on structured light [J]. Modern Transportation Technology, 2018, 15(3): 9. [百度学术]
裴莉莉,孙朝云,户媛姣.基于多特征因子的路用集料粒径计算神经网络模型[J].华南理工大学学报(自然科学版), 2020, 48(6): 77. [百度学术]
PEI Lili, SUN Zhaoyun, HU Yuanjiao. Neural network model for road aggregate size calculation based on multiple features[J]. Journal of South China University of Technology (Natural Science Edition),2020, 48(6): 77. [百度学术]
ZHANG Guoying, LIU Guanzhou, ZHU Hong. Segmentation algorithm of complex ore images based on templates transformation and reconstruction[J]. International Journal of Minerals, Metallurgy, and Materials, 2011, 18(4): 385. [百度学术]
AMANKWAH A, ALDRICH C. Automatic ore image segmentation using mean shift and Watershed transform[C]//Proceedings of the 21st International Conference on Radioelektronika 2011. Brno: IEEE, 2011: 978-981. [百度学术]
MALLADI S R S P, RAM S, RODRIGUEZ J J. Superpixels using morphology for rock image segmentation[C]//2014 IEEE Southwest Symposium on Image Analysis and Interpretation. San Diego:[s.n.], 2014: 145-148. [百度学术]
SULAIMAN M, SINNAKAUDAN S K, NG S F, et al. Application of automated grain sizing technique (AGS) for bed load samples at Rasil River: a case study for supply limited channel[J]. Catena,2014,121: 330. [百度学术]
XU Yazhi, ZHENG Chuanfeng, FENG Yupeng, et al. Low-temperature cohesive and adhesive strength testing of contact surface between bitumen and mineral aggregates by image analysis[J]. Construction and Building Materials, 2018, 183: 95. [百度学术]
WANG R, ZHANG W, SHAO L. Research of ore particle size detection based on image processing[C]//Chinese Intelligent Systems Conference. Singapore: Springer, 2018: 505-514. [百度学术]
LI Y, DUAN Y Y. Intelligent computing methodologies[M]. Berlin:Springer, 2018. [百度学术]
满新耀, 易强, 邹晓明. 基于数字图像处理技术的沥青混合料内部粗集料接触状态分析[J]. 西部交通科技, 2020(2): 5. [百度学术]
MAN Xinyao, YI Qiang, ZOU Xiaoming. Analysis of contact state of coarse aggregates inside asphalt mixes based on digital image processing technology[J].Western Traffic Technology,2020(2): 55. [百度学术]
RAJAN B, SINGH D. Quantify effects of stage crushing on dimensional distribution of basaltic aggregates using image technique[J]. International Journal of Pavement Research and Technology, 2019, 12(5): 497. [百度学术]
MA Xiqi, ZHANG Pengyu, MAN Xiaofei, et al. A new belt ore image segmentation method based on the convolutional neural network and the image-processing technology[J]. Minerals, 2020, 10(12): 1115. [百度学术]
RONNEBERGER O, FISCHER P, BROX T. U-Net: convolutional networks for biomedical image segmentation[M]. Berlin:Springer, 2015. [百度学术]
SZEGEDY C, LIU W, JIA Y Q, et al. Going deeper with convolutions[C]//2015 IEEE Conference on Computer Vision and Pattern Recognition. Boston: IEEE, 2015: 1-9. [百度学术]
郝雪丽,孙朝云,耿方圆. 基于三维点云数据的集料颗粒棱角性量化评价[J]. 华南理工大学学报(自然科学版), 2021, 49(1): 142. [百度学术]
HAO Xueli, SUN Zhaoyun, GENG Fangyuan. Quantitative evaluation for aggregate particle angularity based on 3D point cloud data [J]. Journal of South China University of Technology (Natural Science Edition), 2021, 49(1): 142. [百度学术]
PEI L, SUN Z, YU T, et al. Pavement aggregate shape classification based on extreme gradient boosting[J]. Construction and Building Materials, 2020, 256:119356. [百度学术]
LIU Hanye, SUN Zhaoyun, LI Wei, et al. Evaluating angularity of coarse aggregates using the virtual cutting method based on 3D point cloud images[J]. IEEE Access, 2020, 8:143241. [百度学术]