梁小康
(陜西能源馮家塔礦業(yè)運營有限責任公司,陜西 西安 710021)
轉(zhuǎn)子與靜子之間的碰摩是機械中常見的故障,該類故障一旦發(fā)生,輕則影響機器正常運行,嚴重的話有可能會發(fā)生生產(chǎn)事故,造成無法挽回的損失。開展針對機械故障檢測的研究具有較強的實踐意義。聲發(fā)射檢測是一種基于聲發(fā)射信號來評定材料性能的無損檢測技術(shù),采用基于聲發(fā)射信號的故障檢測,可以實現(xiàn)不影響機組運行前提下,完成設備檢測。當前,有許多學者從不同領(lǐng)域?qū)诼暟l(fā)射檢測技術(shù)進行了深入的研究,考慮到特征對識別的重要影響,如何提取有效的特征,受到了學者的諸多關(guān)注。例如,2010 年,鄧艾東等人[1]提出了一種基于時延神經(jīng)網(wǎng)絡(Time-Delay Neural Network,TDNN) 和高斯混合模型(Gaussian Mixed Model,GMM)的聲發(fā)射信號分類方法,取得良好的效果。近些年,隨著機器學習技術(shù)的發(fā)展,深度學習受到了廣泛的關(guān)注。
卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)是一類包含卷積計算的前饋神經(jīng)網(wǎng)絡,20 世紀80 年代至90 年代,LeCun Yann 等人[2]就提出了LeNet-5 網(wǎng)絡,在手寫字識別上取得了顯著的結(jié)果。隨著計算機性能的快速提升,卷積神經(jīng)網(wǎng)絡得以迅速發(fā)展,2012 年Hinton 和Alex Krizhevsky 所設計的AlexNet[3]卷積神經(jīng)網(wǎng)絡,以壓倒性的優(yōu)勢獲得了ImageNet 分類比賽的冠軍,展現(xiàn)出了卷積神經(jīng)網(wǎng)絡的優(yōu)勢及所蘊含的巨大潛力,目前CNN 已經(jīng)在圖像分割[4]、手寫字識別[5-6]、圖像分類等場景中有諸多應用。當前,已有部分學者開展了基于CNN 故障檢測相關(guān)技術(shù)的探索,并取得了部分成果,推動了故障診斷水平的提升。
長短時記憶網(wǎng)絡(Long Short-Term Memory,LSTM)[7]作為是一種時間循環(huán)網(wǎng)絡,廣泛應用于時序數(shù)據(jù)的建模中;由前向LSTM 和后向LSTM 組成的BiLSTM 網(wǎng)絡,可以編碼從后向前的信息,受到了廣泛的關(guān)注。
本文提出一種基于譜圖和聲學特征的旋轉(zhuǎn)機械聲發(fā)射識別方法。CNN 網(wǎng)絡中輸入聲發(fā)射信號譜圖,得到聲發(fā)射信號的全局特征;短時能量、過零率、峭度等信息輸入BiLSTM 網(wǎng)絡中,提取發(fā)射信號的聲學特征,最后將CNN 網(wǎng)絡和BiLSTM 網(wǎng)絡提取到的特征融合起來,采用Softmax 實現(xiàn)信號識別,通過實驗驗證了此模型的有效性。
(1)幅度譜
旋轉(zhuǎn)機械轉(zhuǎn)子聲發(fā)射(Acoustic Emission,AE)信號具有與自然語言相似的聲學特性,因此,借鑒語音識別的方法對AE 信號進行分析和識別。假設碰摩AE 信號是短時平穩(wěn)信號,對于任意時刻n,可以對n時刻附近的小范圍信號進行頻譜分析,從而得到AE 信號的二維幅度頻譜圖像。
鑒于CNN 具有強大學習能力,且AE 信號具有良好的動態(tài)特性,除了原始的二維幅度頻譜圖像外,同時提取幅度譜沿時間軸的一階差分譜、幅度譜沿頻率軸的一階差分譜,3 個圖組成3D 譜圖輸入CNN網(wǎng)絡中。
(2)群時延相位譜
群延時[8]包含了豐富的動態(tài)信息,它是信號在某個頻率相位信息相對于頻率的變化率;本文選用修正群延時相位譜作為譜圖的另一種生成方式,其中修正群延時函數(shù)可以定義為:

提取AE 信號的群延時相位譜,并提取譜沿時間軸的一階差分譜、譜沿頻率軸的一階差分譜,共同組成3D 譜圖。
最后,將兩種譜圖組合在一起,構(gòu)成幅度-相位譜圖。
如圖1 所示,展示了本文所采用的CNN 的網(wǎng)絡結(jié)構(gòu)圖。網(wǎng)絡的輸入數(shù)據(jù)是幀重疊率為50%的碰摩AE 信號幅度-相位譜圖。

圖1 CNN 網(wǎng)絡結(jié)構(gòu)
首先卷積核尺寸為1×1 的卷積層被用來對輸入數(shù)據(jù)進行非線性變換,然后采用池化操作將前一層輸入的矩形圖進行規(guī)整。卷積操作如式(2)所示:

引入Inception 結(jié)構(gòu)提取網(wǎng)絡各層級的特征。
最后采用平均池化代替?zhèn)鹘y(tǒng)卷積神經(jīng)網(wǎng)絡中的全連接層,以減輕網(wǎng)絡發(fā)生過擬合。
經(jīng)典的RNN 網(wǎng)絡在t時刻的狀態(tài)只能從過去時刻的輸入序列以及當前時刻的輸入x(t)中求取。BiRNN (Bi-directional Recurrent Nerual Network,BiRNN)是Schuster 等人在1997 年提出的一種雙向網(wǎng)絡,有效地解決了傳統(tǒng)RNN 當前時刻狀態(tài)只能由當前時刻輸入和過去時刻輸入決定的問題。BiRNN包含了兩個方向的RNN 網(wǎng)絡,一個是從序列起點開始移動的RNN,另一個是從序列終點開始移動的RNN,兩個RNN 組合在一起可以有效獲取上下文信息,當采用LSTM 替代RNN 時,就構(gòu)成了BiLSTM(Bi-directional Long Short-Term Memory,BiLSTM)。

表1 CNN 網(wǎng)絡結(jié)構(gòu)
提取AE 信號每一幀的幀級特征作為BiLSTM網(wǎng)絡的輸入,提取到的特征包括短時能量、過零率、峭度、頻譜通量等。

表2 所用統(tǒng)計特征
本節(jié)構(gòu)建了一個BiLSTM 與卷積神經(jīng)網(wǎng)絡CNN進行特征融合的轉(zhuǎn)子AE 信號識別模型。算法的整體架構(gòu)思路如圖2 所示。

圖2 BiLSTM-CNN 原理架構(gòu)圖
將所提取的聲學特征輸入BiLSTM 網(wǎng)絡中,將AE 信號轉(zhuǎn)化為幅度-相位譜圖輸入到CNN 網(wǎng)絡中,最終經(jīng)過2 個網(wǎng)絡訓練后得到的特征融合在一起,采用SOFTMAX 分類器進行分類識別。
本文使用轉(zhuǎn)速為600 rad/s 的轉(zhuǎn)子AE 信號進行實驗。采用漢寧窗對離散AE 信號進行加窗分幀。CNN 網(wǎng)絡采用ReLU 激活函數(shù),本實驗使用Adam 優(yōu)化算法來進行訓練。

3.2.1 識別性能分析
表3 展示了本文所提算法對600 rad/s 的碰摩聲發(fā)射信號分類的混淆矩陣。從混淆矩陣可以看出,所提識別方法對正常、軸承裂紋、主軸碰摩三種類型的AE 信號均具有85%以上的識別率,分類效果優(yōu)良。

表3 600 rad/s 轉(zhuǎn)速條件下所提算法識別性能混淆矩陣 單位:%
3.2.2 與其他算法對比試驗
為了進一步探究本文提出模型的有效性,現(xiàn)將其與其他聲發(fā)射信號識別方法進行對比實驗,表4展示了不同分類器在碰摩AE 信號分類上的性能。

表4 600 rad/s 轉(zhuǎn)速下不同分類器識別性能比較 單位:%
從表4 中可以看出,在3 種不同的的條件下,所提識別方法的識別準確率均是最高,分別為85.87%、92.13%、86.54%,且平均識別率比SVM 高出了17.95%,比DNN 高了19.31%,比KNN 高了32.21%。
與同樣作為神經(jīng)網(wǎng)絡的DNN 相比,由于網(wǎng)絡分別采用CNN 和BiLSTM 從譜圖和聲學特征中提取到更多有效的特征,因此,取得了更高的識別結(jié)果。
本文提出一種基于譜圖和聲學特征的旋轉(zhuǎn)機械聲發(fā)射識別方法。CNN 網(wǎng)絡中輸入聲發(fā)射信號譜圖,得到聲發(fā)射信號的全局特征;短時能量、過零率、峭度等信息輸入BiLSTM 網(wǎng)絡中,提取發(fā)射信號的聲學特征,最后將CNN 網(wǎng)絡和BiLSTM 網(wǎng)絡提取到的特征融合起來,采用Softmax 實現(xiàn)信號識別,實驗結(jié)果表明,所提識別方法對聲發(fā)射信號的識別準確率遠高于傳統(tǒng)識別方法。