摘要
为实现对制动噪声的智能化识别,研究了一种小波散射结合深度序列神经网络的识别方法。采用3层小波散射变换构造出制动噪声相应卡钳振动信号的小波散射多维特征向量。首先,以单层一维卷积神经网络(1DCNN)和单层双向长短时记忆网络(BiLSTM)为基础,将小波散射特征以序列形式和分别输入方式进行训练和测试;结果显示,与短时能量和短时平均过零率这类一维序列输入相比,小波散射变换多维特征输入能够大幅提高分类准确率。其次,针对网络欠拟合状况,建立的4层深度1DCNN与3层深度BiLSTM网络相比,其基础网络具有更强的特征捕捉能力,均进一步提高了制动噪声分类准确率。根据分类性能指标F1,4层1DCNN的整体性能均超过3层BiLSTM网络,并且具有训练参数数量较少的优越性。
制动噪声通常指的是汽车刹车时的啸叫声、刷盘声或咯吱声等。当制动噪声过大时,用户会对制动系统的可靠性产生担忧。如何利用采集的信号快速准确地识别制动噪声类型是一项有意义的研究内容。
深度学习方法可取代传统的浅层的分类器,显著提高分类识别准确率。信号在输入前的特征提取是深度学习分类系统的关键,可采用短时能
开展车辆道路制动试验的车辆四轮均为盘式制动结构。在制动过程中采集驾驶员耳旁噪声与四轮卡钳振动信号,传声器与加速度计布置如


图1 驾驶员耳旁传声器与卡钳振动加速度计布置
Fig.1 Microphone and accelerometer arrangement
本文根据SAE-J2521制动噪声试验标准并结合所关注的噪声类型选取了3类试验中主要出现的制动噪声作为分类对象,分别为啸叫声(Squeal)、多频段噪声(KG)以及咯吱声(Squish),3类噪声以外的背景噪声以及无噪声归为其他(Others)类。4种类型噪声信号的时域波形如

图 2 四类制动卡钳振动时域波形
Fig.2 Time domain waveform from four types of brake caliper vibration
由
一次小波散射变换包含小波卷积、取模非线性化和池化平均3步过程,其表达式为:
(1) |
式中:为小波函数;表示小波变换后的高频信息;表示尺度函数。
信号经小波散射变换后,小波特征系数的区分度被降
(2) |

图3 信号经小波散射分层传播
Fig.3 Signal propagating through wavelet scattering layers
信号依次分层迭代,形成一系列散射系数特征。
对制动时卡钳振动加速度信号进行小波散射分层特征提取,框架如

图4 小波散射分层特征提取框架
Fig.4 Hierarchical feature extraction framework of wavelet scattering
由3层散射系数提取出的制动振动信号组成的多维系数向量矩阵包含了该型号的小波散射特征。其中,第1层特征为一维向量,其余为多维向量。

图5 第1层小波散射1维特征
Fig.5 First layer 1D features from wavelet scattering

图6 第2层小波散射94维特征
Fig.6 Second layer 94-dimension features from wavelet scattering

图7 第3层小波散射402维特征
Fig.7 Third layer 402-dimension features from wavelet scattering
卡钳振动信号通过小波散射变换提取的多维散射特征中每一维都为序列数据,且根据信号时长不同表现为不定长序列。因此需采用不定长输入的序列神经网络模型进行分类。
一维CNN常被用于处理不定长的序列信息。

图8 一维卷积计算过程
Figure 8 1D convolution computation of multi-dimensional sequences

图9 基础一维CNN Conv-1结构
Fig.9 1D CNN Conv-1 architecture
LSTM网络是一种处理序列数据的循环神经网络(RNN),通过一系列“门”操作,学习长期依赖信息。在此基础上发展出的双向长短时记忆网络(Bi-directional LSTM, BiLSTM

图10 BiLSTM单元结构
Fig.10 BiLSTM unit structure
信号的小波散射特征以数组序列格式通过输入层输入BiLSTM网络层,本文建立的网络结构BiLSTM-1采用100个BiLSTM单元。
Conv-1与BiLSTM-1网络的卷积层与BiLSTM层在提取小波散射特征后通过正向传播预测分类并计算与真实分类的误差,误差反向传播对网络参数如权值和偏置进行更新。单个样本误差损失函数定义为交叉熵形式:
(3) |
整体损失函数为:
(4) |
式中:为真实概率;为分类预测概率; 代表网络中待迭代更新的权值和偏置参数;N和K分别为样本与分类数量。
网络训练获取使整体损失函数J最小化的网络参数,为求解该迭代优化问题,采用自适应动量估计算法(adaptive moment estimation,Adam
项目 | 参数 | 数值 |
---|---|---|
Conv–1网络相关 | 卷积核大小 | 32×3 |
BiLSTM–1网络相关 | BiLSTM单元数 | 100 |
样本相关 | 训练集数量 | 12,000 |
训练集/验证集比例 | 80%/20% | |
测试集数量 | 2,200 | |
训练相关 | 小批量大小 | 64 |
最大迭代次数 | 1 800 | |
学习率α | 0.001 | |
学习率衰减率β0 | 0.99 | |
梯度衰减因子β1 | 0.9 | |
Adam算法相关 | 平方梯度衰减因子β2 | 0.999 |
小偏置ε |
1×1 |
特征类型 | Conv-1 | BiLSTM-1 |
---|---|---|
小波散射 | 91.83% | 78.00% |
短时能量 | 77.46% | 27.88% |
短时平均过零率 | 57.96% | 74.50% |

a Conv-1

b BiLSTM-1
图11 测试集结果混淆矩阵
Fig.11 Confusion matrix of test set
造成神经网络欠拟合的原因主要是由于浅层网络捕捉多维输入特征的能力不足,深度神经网络具有捕捉更细致特征的能力,对Conv-1和BiLSTM-1的改进应从加深网络深度着手。
增加Conv-1网络的卷积层数量至4层,每层中卷积核通道大小依次扩大一倍以增大感受野,分别为32、64、128、256,后续结构与Conv-1一致,新网络命名为Conv-4。
由于每层BiLSTM的单元数较多,过深的网络使训练参数量过大进而增大耗时。因此,对BiLSTM-1增加两层BiLSTM层,并调整单元数,命名为BiLSTM-4。
结构超参数 | Conv-1 | Conv-4 |
---|---|---|
卷积层数 | 1 | 4 |
卷积核大小 | 32×3 | 32×3,64×3, 128×3, 256×3 |
网络训练参数量 | 约3 000 | 约84 000 |
结构超参数 | BiLSTM⁃1 | BiLSTM⁃3 |
BiLSTM层数 | 1 | 3 |
BiLSTM单元数 | 100 | 300,200,100 |
网络训练参数量 | 约107 000 | 约2 482 000 |
由于多层卷积的深度网络提高了多维特征的处理能力,改进后两网络在测试集上的总体识别率进一步提高,改进前后网络在各类别分类整体性能F1指

图12 测试评价指标F1
Fig.12 Evaluation index F1 of test set
本文基于卡制动钳振动信号的小波散射变换多维特征序列结合深度序列神经网络对制动噪声的多分类预测开展了研究,形成的结论如下:
(1) 小波散射变换可提取信号的多维序列特征,相比于一维序列具有更丰富的结构化特征信息,特征维度与信号时长相关,小波散射特征结合浅层的神经网络即可大幅提高识别准确率。
(2) 一维CNN和BiLSTM网络可输入不定长特征序列,深度网络对改善BiLSTM网络的欠拟合问题效果显著,但分类性能低于一维CNN。相比于深度BiLSTM网络,深度一维CNN具有分类准确度高、训练参数量少等优点,符合工程实用条件。
参考文献
李云峰,高云鹏,蔡星月,等. 自适应辛几何模态分解和短时能量差分因子在电能质量扰动检测中的应用[J]. 电工技术学报: 2022(17): 136. [百度学术]
LI Yunfeng, GAO Yunpeng, CAI Xingyue, et al. Application of adaptive symplectic geometry modal decomposition and short-time energy difference factor in power quality disturbance detection[J]. Transactions of China Electrotechnical Society, 2022(17): 136. [百度学术]
梁鑫, 张著洪. 基于短时能量与LSTM的油井动液面深度研究[J]. 计算机与现代化, 2021(4): 15. [百度学术]
LIANG Xin, ZHANG Zhuhong. Research on depth of oil well moving liquid surface based on short-term energy and LSTM[J]. Computer and Modernization, 2021(4): 15. [百度学术]
王阳, 窦甲臣, 费春国,等. 基于短时能量时延估计的地震动目标定位方法[J]. 振动与冲击, 2020, 39(24): 164. [百度学术]
WANG Yang, DOU Jiachen, FEI Guochun, et al. A seismic target localization method based on short-time energy time delay estimation[J]. Journal of Vibration and Shock, 2020, 39(24): 164. [百度学术]
刘晓明,徐叶飞,刘婷,等. 基于电流信号短时过零率的电弧故障检测[J].电工技术学报, 2015, 30(13): 125. [百度学术]
LIU Xiaoming, XU Yefei, LIU Ting, et al. The arc fault detection based on the current signal short time zero crossing rate[J]. Transactions of China Electrotechnical Society, 2015, 30(13): 125. [百度学术]
纪振发, 杨晖, 李然,等. 基于短时自相关及过零率的语音端点检测算法[J]. 电子科技, 2016, 29(9): 52. [百度学术]
JI Zhenfa, YANG Hui, LI Ran, et al. Speech endpoint detection algorithm based on short time autocorrelation and short-time zero crossing rate[J]. Electronic Science and Technology, 2016, 29(9): 52. [百度学术]
蔡萍. 一种结合短时过零率的快速语音端点检测算法[J]. 厦门理工学院学报, 2013, 21(2): 48. [百度学术]
CAI Ping. A fast algorithm of speech end-point detection combined with short-time zero crossing rate[J]. Journal of Xiamen University of Technology. 2013, 21(2): 48. [百度学术]
JP A, JM A, HK B, et al. Identification of different manifestations of nonlinear stick⁃slip phenomena during creep groan braking noise by using the unsupervised learning algorithms k-means and self-organizing map[J]. Mechanical Systems and Signal Processing, 2022, 166: 108349. [百度学术]
LIU Z, YAO G, ZHANG Q, et al. Wavelet scattering transform for ECG beat classification[J]. Computational and Mathematical Methods in Medicine, 2020(7): 1. [百度学术]
BA J L, KIROS J R, HINTON G E. Layer normalization[J]. arXiv, 2016: 1607.06450. [百度学术]
TAN M, SANTOS C D, XIANG B, et al. LSTM-based deep learning models for non-factoid answer selection[J]. arXiv,2015:1511.04108. [百度学术]
DA K. A method for stochastic optimization[J]. arXiv,2014:1412.6980. [百度学术]