网刊加载中。。。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

基于小波散射深度序列神经网络的制动噪声分类识别  PDF

  • 姜天宇
  • 靳畅
  • 李天舒
  • 李阳
同济大学 汽车学院,上海 201804

中图分类号: U461.3

最近更新:2024-03-04

DOI:10.11908/j.issn.0253-374x.23703

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
EN
目录contents

摘要

为实现对制动噪声的智能化识别,研究了一种小波散射结合深度序列神经网络的识别方法。采用3层小波散射变换构造出制动噪声相应卡钳振动信号的小波散射多维特征向量。首先,以单层一维卷积神经网络(1DCNN)和单层双向长短时记忆网络(BiLSTM)为基础,将小波散射特征以序列形式和分别输入方式进行训练和测试;结果显示,与短时能量和短时平均过零率这类一维序列输入相比,小波散射变换多维特征输入能够大幅提高分类准确率。其次,针对网络欠拟合状况,建立的4层深度1DCNN与3层深度BiLSTM网络相比,其基础网络具有更强的特征捕捉能力,均进一步提高了制动噪声分类准确率。根据分类性能指标F1,4层1DCNN的整体性能均超过3层BiLSTM网络,并且具有训练参数数量较少的优越性。

制动噪声通常指的是汽车刹车时的啸叫声、刷盘声或咯吱声等。当制动噪声过大时,用户会对制动系统的可靠性产生担忧。如何利用采集的信号快速准确地识别制动噪声类型是一项有意义的研究内容。

深度学习方法可取代传统的浅层的分类器,显著提高分类识别准确率。信号在输入前的特征提取是深度学习分类系统的关键,可采用短时能

1-3以及短时平均过零4-6等一维特征序列,而小波散射变换以其对信号提取特征的多维丰富性以及可以最大程度地减少类内差异。本文基于小波散射变换提取制动噪声信号的多维序列特征,分别结合两种序列输入的深度神经网络,一维卷积神经网络(1DCNN)和双向长短时记忆网络(BiLSTM),对制动噪声信号数据进行训练与测试,验证该方法的分类效果。

1 制动噪声样本的采集

开展车辆道路制动试验的车辆四轮均为盘式制动结构。在制动过程中采集驾驶员耳旁噪声与四轮卡钳振动信号,传声器与加速度计布置如图1所示。卡钳振动信号由于具有较高信噪比及更大的样本量将作为制动噪声分类的输入信

7,试验中以踩下和抬起制动踏板为信号采集开始和停止的触发条件,采样频率为48kHz。

  

  

图1  驾驶员耳旁传声器与卡钳振动加速度计布置

Fig.1  Microphone and accelerometer arrangement

本文根据SAE-J2521制动噪声试验标准并结合所关注的噪声类型选取了3类试验中主要出现的制动噪声作为分类对象,分别为啸叫声(Squeal)、多频段噪声(KG)以及咯吱声(Squish),3类噪声以外的背景噪声以及无噪声归为其他(Others)类。4种类型噪声信号的时域波形如图2所示。

图 2  四类制动卡钳振动时域波形

Fig.2  Time domain waveform from four types of brake caliper vibration

2 小波散射变换特征提取

图2可以看出,引发制动噪声的卡钳振动信号属于非稳态瞬变信号,小波散射变换会在提取低频特征后利用小波变换模恢复丢失的高频信号。采用小波散射变换来提取制动噪声信号更复杂的特征,还在一定程度上实现数据维度缩减,同时保留各个类之间的可区分性。

2.1 小波散射变换原理

一次小波散射变换包含小波卷积、取模非线性化和池化平均3步过程,其表达式为:

SJλf=f*ψλx*ϕJ (1)

式中:ψλx为小波函数;f*ψλx表示小波变换后的高频信息;ϕJ表示尺度函数。

信号经小波散射变换后,小波特征系数的区分度被降

8,通过继续进行模运算和低通滤波来达到特征系数的稳定。信号的分层散射过程可用图3表示。下一层的输入小波变换模,记作Uλf,以恢复丢失的高频信息,小波散射的传播算子即为输出:

Uλf¯=Uλf,SJλf={f*ψλx,f*ψλx*ϕJ} (2)

图3  信号经小波散射分层传播

Fig.3  Signal propagating through wavelet scattering layers

信号依次分层迭代,形成一系列散射系数特征S0,S1,,S(n)

2.2 卡钳振动信号小波散射特征提取

对制动时卡钳振动加速度信号进行小波散射分层特征提取,框架如图4所示,散射网络可以包含3层及以上,但是实际运用中随着层数的增加每次迭代都会耗散振动信号的能量,因此 3层小波散射网络足以提取本文振动信号的散射特征。

图4  小波散射分层特征提取框架

Fig.4  Hierarchical feature extraction framework of wavelet scattering

由3层散射系数提取出的制动振动信号组成的多维系数向量矩阵包含了该型号的小波散射特征。其中,第1层特征为一维向量,其余为多维向量。图5图7为4类信号1—3层特征可视化图。4类不同时长的信号按照采样频率的数据维度分别为1×176 880、1×126 192、1×92 784及1×110 064,而经小波散射变换后提取出的3层总特征维度分别为497×22、497×16、497×12和497×14。数据维度缩减为原信号的1/10,有效减少了数据处理量。

图5  第1层小波散射1维特征

Fig.5  First layer 1D features from wavelet scattering

图6  第2层小波散射94维特征

Fig.6  Second layer 94-dimension features from wavelet scattering

图7  第3层小波散射402维特征

Fig.7  Third layer 402-dimension features from wavelet scattering

3 序列神经网络模型

卡钳振动信号通过小波散射变换提取的多维散射特征中每一维都为序列数据,且根据信号时长不同表现为不定长序列。因此需采用不定长输入的序列神经网络模型进行分类。

3.1 一维CNN结构

一维CNN常被用于处理不定长的序列信息。图8显示了多维序列的一维卷积过程。本文建立的基础一维CNN Conv-1网络结构如图9所示,一维卷积核、层归一

9以及ReLu函数组成了卷积层,网络最后的输出由Softmax函数将不同类别预测结果以概率分布输出。

图8  一维卷积计算过程

Figure 8  1D convolution computation of multi-dimensional sequences

图9  基础一维CNN Conv-1结构

Fig.9  1D CNN Conv-1 architecture

3.2 BiLSTM网络结构

LSTM网络是一种处理序列数据的循环神经网络(RNN),通过一系列“门”操作,学习长期依赖信息。在此基础上发展出的双向长短时记忆网络(Bi-directional LSTM, BiLSTM

10实现了信息的双向传递。BiLSTM单元结构如图10所示, hh'分别为前向层与反向层输出。

图10  BiLSTM单元结构

Fig.10  BiLSTM unit structure

信号的小波散射特征以数组序列格式通过输入层输入BiLSTM网络层,本文建立的网络结构BiLSTM-1采用100个BiLSTM单元。

3.3 网络训练与测试

Conv-1与BiLSTM-1网络的卷积层与BiLSTM层在提取小波散射特征后通过正向传播预测分类并计算与真实分类的误差,误差反向传播对网络参数如权值和偏置进行更新。单个样本误差损失函数定义为交叉熵形式:

Lj=-i=1Kyiln(y^i) (3)

整体损失函数为:

J(Θ)=j=1NLj (4)

式中:yi为真实概率;y^i为分类预测概率; Θ代表网络中待迭代更新的权值和偏置参数;NK分别为样本与分类数量。

网络训练获取使整体损失函数J最小化的网络参数Θ,为求解该迭代优化问题,采用自适应动量估计算法(adaptive moment estimation,Adam

11进行自适应寻优。超参数如表1所示。两网络的训练结果如表2所示,小波散射特征的结果大幅优于短时能量和短时平均过零率特征结果。模型在测试集上预测的准确率混淆矩阵如图11所示。Conv-1的总体识别率接近93%,对Squeal与KG噪声的辨识率相对偏低。BiLSTM-1的总体识别率低于78%,Squeal和Squish信号的分辨较差,结合训练结果判断整体欠拟合,需进一步调整网络结构与超参数。

表1  Conv-1和BiLSTM-1网络超参数
Tab.1  Hyperparameters of Conv-1 and BiLSTM-1 network
项目参数数值
Conv–1网络相关 卷积核大小 32×3
BiLSTM–1网络相关 BiLSTM单元数 100

样本相关

训练集数量 12,000
训练集/验证集比例 80%/20%
测试集数量 2,200

训练相关

小批量大小 64
最大迭代次数 1 800
学习率α 0.001
学习率衰减率β0 0.99
梯度衰减因子β1 0.9
Adam算法相关 平方梯度衰减因子β2 0.999
小偏置ε 1×10-8
表2  不同特征输入的网络验证准确率
Tab.2  validation accuracy of two networks with different feature inputs
特征类型Conv-1BiLSTM-1
小波散射 91.83% 78.00%
短时能量 77.46% 27.88%
短时平均过零率 57.96% 74.50%

a  Conv-1

b  BiLSTM-1

图11  测试集结果混淆矩阵

Fig.11  Confusion matrix of test set

4 改进的深度序列神经网络结构

造成神经网络欠拟合的原因主要是由于浅层网络捕捉多维输入特征的能力不足,深度神经网络具有捕捉更细致特征的能力,对Conv-1和BiLSTM-1的改进应从加深网络深度着手。

4.1 网络结构改进

增加Conv-1网络的卷积层数量至4层,每层中卷积核通道大小依次扩大一倍以增大感受野,分别为32、64、128、256,后续结构与Conv-1一致,新网络命名为Conv-4。

由于每层BiLSTM的单元数较多,过深的网络使训练参数量过大进而增大耗时。因此,对BiLSTM-1增加两层BiLSTM层,并调整单元数,命名为BiLSTM-4。表3列出了改进前后两网络结构超参数以及训练参数量对比。

表3  改进前后网络超参数与训练参数量
Tab.3  Hyperparameters and training parameters before and after modifying
结构超参数Conv-1Conv-4
卷积层数 1 4
卷积核大小 32×3 32×3,64×3, 128×3, 256×3
网络训练参数量 约3 000 约84 000
结构超参数 BiLSTM⁃1 BiLSTM⁃3
BiLSTM层数 1 3
BiLSTM单元数 100 300,200,100
网络训练参数量 约107 000 约2 482 000

4.2 结果分析

由于多层卷积的深度网络提高了多维特征的处理能力,改进后两网络在测试集上的总体识别率进一步提高,改进前后网络在各类别分类整体性能F1

12图12所示。BiLSTM网络在改进后对Squeal和Squish分类识别的性能提高了26.6%和19.2%,加深的多层网络起到了关键作用,但整体分类性能仍低于由一维卷积网络,其原因可能是由于小波散射特征序列的前后依赖性不强以及双向记忆单元的优势不明显导致。

图12  测试评价指标F1

Fig.12  Evaluation index F1 of test set

5 结论

本文基于卡制动钳振动信号的小波散射变换多维特征序列结合深度序列神经网络对制动噪声的多分类预测开展了研究,形成的结论如下:

(1) 小波散射变换可提取信号的多维序列特征,相比于一维序列具有更丰富的结构化特征信息,特征维度与信号时长相关,小波散射特征结合浅层的神经网络即可大幅提高识别准确率。

(2) 一维CNN和BiLSTM网络可输入不定长特征序列,深度网络对改善BiLSTM网络的欠拟合问题效果显著,但分类性能低于一维CNN。相比于深度BiLSTM网络,深度一维CNN具有分类准确度高、训练参数量少等优点,符合工程实用条件。

参考文献

1

李云峰高云鹏蔡星月. 自适应辛几何模态分解和短时能量差分因子在电能质量扰动检测中的应用[J]. 电工技术学报: 202217): 136. [百度学术] 

LI YunfengGAO YunpengCAI Xingyueet al. Application of adaptive symplectic geometry modal decomposition and short-time energy difference factor in power quality disturbance detection[J]. Transactions of China Electrotechnical Society202217): 136. [百度学术] 

2

梁鑫张著洪. 基于短时能量与LSTM的油井动液面深度研究[J]. 计算机与现代化20214): 15. [百度学术] 

LIANG XinZHANG Zhuhong. Research on depth of oil well moving liquid surface based on short-term energy and LSTM[J]. Computer and Modernization20214): 15. [百度学术] 

3

王阳窦甲臣费春国. 基于短时能量时延估计的地震动目标定位方法[J]. 振动与冲击20203924): 164. [百度学术] 

WANG YangDOU JiachenFEI Guochunet al. A seismic target localization method based on short-time energy time delay estimation[J]. Journal of Vibration and Shock20203924): 164. [百度学术] 

4

刘晓明徐叶飞刘婷. 基于电流信号短时过零率的电弧故障检测[J].电工技术学报20153013): 125. [百度学术] 

LIU XiaomingXU YefeiLIU Tinget al. The arc fault detection based on the current signal short time zero crossing rate[J]. Transactions of China Electrotechnical Society20153013): 125. [百度学术] 

5

纪振发杨晖李然. 基于短时自相关及过零率的语音端点检测算法[J]. 电子科技2016299): 52. [百度学术] 

JI ZhenfaYANG HuiLI Ranet al. Speech endpoint detection algorithm based on short time autocorrelation and short-time zero crossing rate[J]. Electronic Science and Technology2016299): 52. [百度学术] 

6

蔡萍. 一种结合短时过零率的快速语音端点检测算法[J]. 厦门理工学院学报2013212): 48. [百度学术] 

CAI Ping. A fast algorithm of speech end-point detection combined with short-time zero crossing rate[J]. Journal of Xiamen University of Technology. 2013212): 48. [百度学术] 

7

JP AJM AHK Bet al. Identification of different manifestations of nonlinear stick⁃slip phenomena during creep groan braking noise by using the unsupervised learning algorithms k-means and self-organizing map[J]. Mechanical Systems and Signal Processing2022166108349. [百度学术] 

8

LIU ZYAO GZHANG Qet al. Wavelet scattering transform for ECG beat classification[J]. Computational and Mathematical Methods in Medicine20207): 1. [百度学术] 

9

BA J LKIROS J RHINTON G E. Layer normalization[J]. arXiv20161607.06450. [百度学术] 

10

TAN MSANTOS C DXIANG Bet al. LSTM-based deep learning models for non-factoid answer selection[J]. arXiv20151511.04108. [百度学术] 

11

DA K. A method for stochastic optimization[J]. arXiv20141412.6980. [百度学术] 

12

梁冠群赵通王岩. 基于LSTM网络的路面不平度辨识方法[J].汽车工程2021434): 509. [百度学术] 

LIANG GuanqunZHAO TongWANG Yanet al. Road unevenness identification based on LSTM network [J]. Automotive Engineering. 2021434): 509. [百度学术]