楊如意
(國電內蒙古東勝熱電有限公司,鄂爾多斯017000)
電機軸承是電機的重要組成部分,廣泛應用于電力生產等工業領域。如果設備出現故障,將影響系統運行,甚至可能造成嚴重的經濟損失和人員傷亡。因此,對電機軸承進行有效的故障診斷,不僅可以保證系統的高效運行,而且可以及時發現和排除運行故障,有效地預防重大事故的發生[1]。
電機軸承故障診斷技術是近年來出現的一門綜合技術,它包含了許多新的科學技術研究。其基本原理是在電機有負載或無負載的情況下,根據設備在運行過程中產生的機械、電氣等各種信息來判斷電機是否發生故障或運行良好。從而實現了對電機的狀態參數進行檢測和分析,確定異常的存在,判斷故障的位置和原因,預測電機的未來狀態的功能[2]。軸承是旋轉電機中的一個易損部件,因為它總是在惡劣的環境下工作,如沖擊、重載和高溫[3-4]。因此,軸承狀態監測與故障診斷對于保證軸承的安全運行,減少故障損失具有重要意義。在過去的幾十年中,為了從振動、聲音、電流、溫度信號中提取有用的信息,許多技術,如小波分析[5-6]、隨機共振[7-9]、線性自回歸建模[10],以及經驗模式分解[11-12]等在電機軸承故障診斷中相繼應用。特別是從新興的先進信號處理方法中獲益,其中振動和聲音信號分析技術得到了迅速發展[5,12-13]。
本文通過殘差BiLSTM構建深度神經網絡故障模型,將其用于電機軸承故障診斷。殘差BiLSTM可以從軸承的振動信號中學習和提取特征,通過Soft?max層便可實現故障分類。利用測試數據對故障識別的準確性進行了測試,并與其他機器學習算法進行了故障識別率的比較,表明了本文提出的方法的優越性。
LSTM單元結構如圖1所示,其通過在RNN基礎上添加門控機制來解決RNN的長期依賴問題。LSTM單元在時刻t的實際輸入包括t-1時刻的狀態ht-1和當前輸入xt。通過4個完全連接的神經元ft、gt、it和ot,3個門被用來完成記憶或遺忘信息的功能,其中遺忘門決定有多少先前的信息將被向前傳送,輸入門控制新輸入信息的方面,輸出門決定在這個時間步將輸出什么。就輸出而言,ht隨后作為輸入被送入下一時刻,可以被認為是一個短期狀態,而ct則決定了較長期的依賴性。整個計算如等式(1)-式(5)所示。


式中,gt為臨時記憶單元,ct是新的記憶單元,it為輸入門,ft為遺忘門,ot為輸出門,W和U為權重矩陣。

圖1 LSTM網絡結構
雙向長短時記憶網絡(Bi-direction LSTM,BiL?STM)已被成功廣泛應用于自然語言處理和圖像處理,它是正向LSTM和反向LSTM的組合,其結構如圖2所示,每個隱藏層神經元保存兩個信息矩陣:A和A*,其中A參與正向計算,A*則參與反向計算,兩個信息矩陣共同決定最終輸出值y。進行正向計算時,隱藏層神經元St和St-1相關;反向運算時,隱藏層神經元相關。

圖2 BiLSTM網絡結構
BiLSTM模型從兩個方向提取歷史數據特征,因此在處理時間序列數據時優于單一LSTM模型。BiLSTM采用標準的LSTM網絡對輸入數據進行順序和倒序計算,得到兩種不同的外部狀態,然后通過一個全連接層得到最終結果。正向和反向LSTM的單元結構和工作原理均相同,只是輸入的數據流不同。在正向LSTM中輸入的數據流是一個正向序列,而在反向LSTM中輸入的數據流是一個反向序列。在訓練過程中,需要對逆序輸出結果進行反轉,然后才能將其輸入到全連接層。
He等[15]于2016年在論文中提出了殘差連接網絡(ResNet),其以構建殘差塊(Residual block)的方式大大加深了網絡層次,其結構如圖3所示。x為殘差塊輸入,H(x)為輸出,F(x)為映射函數。

圖3殘差塊結構
若有L個殘差塊依次堆疊連接,以x(l)作為第l個殘差塊的輸入,x(l+1)為殘差塊的輸出。可求解得到第L個殘差塊的輸出如下所示:

從式(6)可知,殘差方式連接的深度網絡的特征是各層殘差特征的累加和,由此確保了l+1層比l層具備更多的特征信息。
當神經網絡隱藏層逐漸加深時,容易出現梯度消失和梯度彌散的現象,而殘差連接能夠在深度網絡中抑制這兩種情況,同時也減少了深度網絡模型參數量,提升網絡訓練效率,利于網絡高效提取更高層次的數據特征。BiLSTM能夠有效提取時序數據特征,本文將兩者結合,構建了殘差BiLSTM(ResBiLSTM)診斷模型如圖4所示,模型包括BiLSTM層和兩個殘差單元,其共同完成軸承時序故障數據特征提取,隨后將特征送入Softmax層完成故障分類,網絡中加入了批標準化(BN)和隨機丟棄(dropout),進一步增強模型訓練效率和泛化能力。

圖4診斷模型結構
本文的實驗數據來自美國凱斯西儲大學軸承數據中心[14]。電機軸承振動信號由圖5所示的實驗系統測量。該系統由電機(左)、測功機(右)和相關控制電路組成,軸承型號為SKF。實驗人員使用電火花機床在軸承的內圈、外圈和滾珠分別引入直徑范圍從0.007英寸到0.040英寸的故障,將有故障的軸承重新安裝到測試電動機中,實驗人員在外殼上放置一個16通道加速度計進行數據采集,記錄了0到3馬力(電動機速度為1720到1797 RPM)的振動數據,采樣頻率分別為12 kHz和48 kHz。

圖5軸承測試系統
故障數據包括驅動端(DE)軸承故障數據以及風扇端(FE)軸承故障數據,本文選擇軸承驅動端的振動信號用于AE的訓練,使用的是12 kHz頻率下獲得的數據,其中選取數據包括4種工作狀態,不同工作狀態故障直徑、電機轉速情況如表1所示。

表1不同工作狀態故障信息
利用采集的數據繪制軸承振動信號的曲線,如圖6所示。

圖6軸承振動信號曲線
從圖6可以看出,雖然波形可以提前指示故障的相關脈沖,但在某些情況下(尤其是發生滾珠故障時),它具有特別大的噪聲干擾,不利于故障診斷,需要采用能從故障信號中提取有用特征的先進方法才能對故障進行有效識別。
本文在準備好故障數據后,基于TensorFlow 2.0中的Sequential、Layers等類構建了ResBiLSTM,將ResBiLSTM得到的數據特征送至Softmax分類器進行訓練,最終得到電機軸承的故障類型輸出。對表1中的4種不同工作狀態進行了仿真分析。每種工作狀態選擇3000組數據作為訓練集,選擇1000組數據作為測試集。AE的故障診斷結果如圖7和圖8所示,圖7表示第一種和第二種工作狀態,圖8表示第三種和第四種工作狀態,其中1表示正常工作,2表示內圈故障,3表示外圈故障,4表示滾珠故障。

圖7工作狀態1和2診斷結果

圖8工作狀態3和4診斷結果
從圖7和圖8可以看出,不同工況下的1000個測試數據中,故障診斷正確率均在98%以上,實驗結果表明,所構造的ResBiLSTM對電機軸承故障具有較高的識別能力。并將所提出的方法與深度卷積神經網絡、LSTM和SVM算法進行了比較,同樣是在四種不同工作狀態下進行軸承故障診斷,多次運行(20次)的診斷結果的平均值繪制如表2所示。從表2中可以看出,ResBiLSTM的故障診斷效果明顯優于SVM,略優于深度CNN和LSTM,進一步驗證了Res?BiLSTM的有效性。

表2不同算法診斷對比
本文結合殘差連接和BiLSTM的優勢,構建了深度ResBiLSTM網絡,以ResBiLSTM完成軸承時序故障數據故障特征提取,將其送入Softmax層完成故障分類,通過與CNN、LSTM以及SVM算法對比可知,本文所采取方法更有效。注意力機制可將更多計算能力分配重要的輸入信息,突出有用的輸入和特征,后續可嘗試將ResBiLSTM與注意機制相結合,進一步增強網絡特征提取能力,提升網絡故障辨識率。