呂 悅,張義民,張 凱
(沈陽化工大學裝備可靠性研究所,遼寧 沈陽 110142)
在生產制造等大型產業中,旋轉機械是必不可少的生產工具,而滾動軸承是旋轉機械運作的一個至關重要的部件,因此,滾動軸承健康狀況的好壞與機械運行的性能密切相關,一旦出現故障,會導致生產質量下降甚至造成嚴重事故。所以,對軸承故障進行及時的診斷是十分重要的[1]。
近年來,深度學習技術被廣泛的應用到語音識別、機械健康狀況的診斷等各大領域中。文獻[2]利用TICNN故障診斷模型,對原始的振動信號直接處理,并且診斷效果不會受到噪聲和工作負荷的影響。文獻[3]針對軸承振動信號特點提出了一種疊加去噪自編碼器(SAD)的方法,運用了貪婪訓練的傳遞規則建立深層結構,結果表明其分類的有效性。文獻[4]提出了基于改進算法的分層學習率自適應深度卷積神經網絡,對軸承的故障狀況進行了準確的分類,還對其損壞程度進行了研究。文獻[5]運用SOM神經網絡,有效的識別了軸承的故障類型。
CNN與LSTM結合的神經網絡近年來得到廣泛的應用,這一神經網絡模型由文獻[6]首次提出,他們研究出一種長效遞歸卷積神經網絡(LRCN),用于視頻的識別與描述。文獻[7]通過CNN與LSTM 結合,判斷短時交通流量的趨勢,并驗證了該方法的有效性。文獻[8]運用CNN- LSTM 模型研究睡眠分期的識別分類,分類結果準確率提高了1.2%。
就當代滾動軸承故障診斷研究方法而言,利用CNN模型與LSTM模型來做滾動軸承故障診斷的研究較少,針對這一問題,提出了改進LSTM滾動軸承故障診斷方法,將CNN與LSTM相結合,利用CNN提取振動故障信號的局部特征,再運用LSTM找出故障特征的時間維度的相關性,從而實現對不同故障有效分類。
卷積神經網絡(CNN)是文獻[9]在對貓腦皮層中的神經元研究時發現了這種奇特的神經結構,能夠使反饋神經網絡的復雜性降低。卷積神經網絡一般包括:第一層為輸入層,通常為圖像的像素矩陣(長*寬*RGB通道數)和語音信號等。第二層為卷積層,這也是最核心的一個網絡層次,主要通過卷積核進行卷積運算。可以看做是一種對應相乘的過程,并計算累加和,產生不同的FeatureMap。第三層為激勵函數層,目的是做特征映射,一般選取ReLU函數作為激活函數。避免了sigmod梯度消失問題,計算速度較快。
公式為:

第四層為池化層,其功能是將卷積操作生成的Feature Map做稀疏處理,進行更深層次的特征提取,不僅減少了運算成本并且避免了過擬合的現象。采樣方法一般分為最大值采樣和均值采樣,即將pooling窗口中的最大值和所有值相加求得平均值作為采樣值。第五層為全連接層,該層的神經元和上層的神經元彼此連接,目的是將結果給輸出層。最后一層為輸出層,輸出所有類別。
長短期記憶神經網絡(LSTM)是Hochreiter 和Schmidhuber在20世紀90年代末提出的[10]。其實質為一種改進的循環神經網絡,相較于原循環神經網絡(RNN),LSTM添加了門和記憶細胞,解決了長期依賴性問題。LSTM主要用于自然語言處理,文本的處理和情感分析等領域。LSTM和序列密切相關,其當前的操作與前期的信息是相連接的。LSTM的基本結構,如圖1所示。主要包括遺忘門、輸入門、記憶細胞和輸出門。

圖1 LSTM結構圖Fig.1 Structural Design of LSTM
圖中:?—向量各元素相乘;⊕—將向量相加。
計算公式如下:

式中:xt—當前時刻的輸入;it—輸入門;ft—遺忘門;ot—輸出門;ht-1和ht—前一時刻的隱含層輸出和當前時刻隱含層的輸出;ct和c~t—當前時刻的記憶細胞和當前時刻的候選記憶細胞,符號σ—門的激活函數為sigmoid函數;wxi、wxf、wxo、wxc、whi、whf、who、whc—權重參數;bi、bf、bo、bc—偏移參數;☉—各元素對應相乘,tanh的計算公式為:

長短期記憶神經網絡的原理為:首先,前一個時刻的輸出ht-1與當前時刻的數據的輸入xt同時輸入到遺忘門ft,經過sigmoid函數計算決定被保留的信息和需要遺忘的信息;然后,ht-1與xt進入輸入門it,經過sigmoid函數的計算和tanh函數的計算,分別確定要輸入的有價值的信息即需要更新的信息,以及暫存候選細胞狀態信息;接著,神經網絡根據輸入門、遺忘門的輸出以及前一時刻記憶細胞狀態和當前時刻候選記憶細胞狀態計算得到當前時刻的細胞狀態即ct。最后,由ht-1和xt經過輸出門ot,得到需要輸出的信息,再與當前記憶細胞狀態相結合輸出信息ht,不需要輸出的信息則仍被保留在當前細胞狀態中。
LSTM模型善于處理序列性數據,CNN模型的卷積操作在特征提取方面具有準確、運算快等特點,將二者相結合,利用CNN對軸承的振動信號進行特征提取,對提取的特征做LSTM 處理,使得各個特征在時間維度上具有連續性和依賴性,LSTM處理后做全連接,再用Softmax分類,經過改進LSTM神經網絡處理,故障診斷的準確率得到提高,達到了對軸承故障的有效診斷,模型的結構,如圖2所示。

圖2 改進LSTM模型圖Fig.2 Model of Improved LSTM
本次實驗采用美國凱斯西儲大學的風扇端軸承正常狀態和故障狀態的數據。采用的軸承是SKF6203,采樣頻率為12kHz,損傷尺寸為0.007英寸、0.014英寸、0.021英寸。故障類型類型共10類,分別為正常、內圈故障、外圈故障、滾動體故障。軸承實驗臺,如圖3所示。

圖3 軸承實驗臺Fig.3 The Bearing Test Bench
實驗是在MatlabR2019b的環境下運行的,CPU為i7-7700@3.60GHz,8.00GB的內存,Windows7操作系統。實驗對4種不同工況(不同負載和不同轉速)下的軸承故障振動信號進行軸承健康狀況類別診斷。
改進LSTM 模型的CNN 層設置了兩個卷積層兩個池化層,激活函數位于池化層之后,第一個卷積層采用的卷積核大小是5,個數是32,第二個卷積層的卷積核大小是7,個數為128,池化層的卷積核大小都為3,步長都為3。激活函數采用的是Leaky Re-LU函數,公式如下:

LSTM層的隱含層神經元個數為20,為了增加樣本數量并且防止邊界效應,運用固定窗口滑動的方法采集樣本,將滑動窗口的長度設置為1000,采用小批量梯度更新,樣本個數大小為200。訓練周期為50輪,學習率為0.001,分別取樣本總量的80%、60%、30%的樣本進行訓練。本實驗還對數據逐級加入白噪聲,對模型的抗噪性進行了對比研究。
通過改變訓練集樣本數量,將改進LSTM模型與CNN模型和LSTM模型的識別準確率分別進行對比,如表1所示。在學習率和滑動窗口大小保持不變的情況下,其總樣本為7083。隨著訓練樣本數量的不斷增加,改進LSTM模型仍能準確的提取特征并進行狀態識別,平均識別準確率為98.5%,CNN的平均識別準確率為96.9%,LSTM的平均識別準確率為53.5%。改進LSTM模型的識別準確率比CNN模型的識別準確率平均提高1.6%,比LSTM模型的識別準確率平均提高45.0%。根據表1中的準確率可以看出,改進LSTM 模型對四種工況下軸承故障的識別準確率最高,顯然泛化性能均優于CNN和LSTM。

表1 改進LSTM、CNN、LSTM模型準確率Tab.1 The Accuracy of Improved LSTM、CNN and LSTM
以訓練樣本為總樣本80%為例,實驗結果,如圖4~圖6所示。分別為改進LSTM模型、CNN模型與LSTM模型的測試結果的混淆矩陣,矩陣中的行代表預測類別,列代表實際類別,每行中的數值表示實際類別被預測為此類別的樣本數目,則對角線上的數值就代表實際類別被準確識別的樣本個數,每行之和表示實際類別被預測為該類的樣本數目,每列之和表示該類的實際樣本數目,矩陣的最后一列中綠色和紅色數值分別表示各個類別的識別精度和誤差,最后一行的綠色和紅色數值表示各類別的召回率和誤差,交點處的綠色和紅色數值代表整個模型測試的準確率和誤差,因此可得改進LSTM模型的平均精度為99.4%,CNN模型的平均精度為98.9%,LSTM模型的平均精度為49.0%,可見,改進LSTM模型精度最高,比CNN模型和LSTM模型分別高出0.5%和50.4%。圖4中,改進LSTM模型對類別5、類別8和類別9的識別存在誤差,而圖5中,CNN模型對類別2、類別4、類別5、類別8和類別9都出現了識別錯誤的現象,圖6中,LSTM模型的分類誤差較前兩個模型差距非常明顯,由此表明改進LSTM模型對故障識別準確率較高,分類效果較好。實驗中對原數據加入了21dB、19dB、17dB、15dB、13dB、11dB、9dB的白噪聲,仍選取總樣本的80%作為訓練集,剩下的作為測試集,測試了改進LSTM模型的抗噪性能,并與CNN模型以及LSTM模型進行對比。不同信噪比下改進LSTM模型、CNN模型和LSTM模型的識別準確率,如表2所示。在13dB噪聲信號下改進LSTM模型的識別準確率比CNN模型高出6.6%,比LSTM模型高出56.1%,在9dB噪聲信號下改進LSTM模型比CNN模型高出6.3%,比LSTM模型高出47.4%。其中,改進LSTM模型的平均識別準確率為89.8%,CNN 模型的平均識別準確率為86.0%,LSTM模型的平均識別準確率為40.9%。由此可見,改進LSTM模型的抗噪性能均優于CNN模型和LSTM模型。

圖4 改進LSTM模型混淆矩陣Fig.4 The Confusion Matrix of Improved LSTM Model

圖5 CNN模型混淆矩陣Fig.5 The Confusion Matrix of CNN Model

圖6 LSTM 模型混淆矩陣Fig.6 The Confusion Matrix of LSTM Model

表2 不同信噪比下改進LSTM、CNN、LSTM準確率Tab.2 The Accuracy of Improved LSTM、CNN and LSTM at Different SNR
基于滾動軸承故障振動信號具有時序性的特點,提出了改進LSTM的滾動軸承故障診斷方法,利用CNN提取局部特征,再用LSTM獲取振動信號時間維度上的特征,用Softmax分類器實現故障狀態分類。實驗選取不同數目的樣本分別進行訓練,將其測試結果與LSTM和CNN的準確率及精度分別進行對比,還對加入噪聲后的振動信號進行分類識別準確率對比。實驗表明:改進LSTM模型相較于CNN模型和LSTM模型能夠對4種不同負載下軸承故障類型依然穩定準確的分類,其泛化性能和抗噪性較強,可對信號的局部特征和時序性特征進行全面研究,診斷結果也更準確,更具代表性。