閆書豪,喬美英,2
(1.河南理工大學 電氣工程與自動化學院,河南 焦作 454000;2.煤炭安全生產河南省協同創新中心,河南 焦作 454000)
現代電氣設備多趨向于復雜化與系統化。滾動軸承是電機等旋轉電氣設備的核心部件,具有易損壞的缺點。滾動軸承發生故障的影響范圍較大,會帶來巨大損失。因此,軸承的故障診斷對于電氣設備的安全運行起著至關重要的作用。在實際工業應用中,電機設備常在變工況的狀態下運行,現場傳感器所采集多是含噪聲干擾的非平穩數據。在噪聲干擾的狀況下,穩定高效地進行電機軸承故障診斷是目前研究的重點問題[1-2]。
目前,針對含有噪聲干擾的軸承故障診斷問題主要集中于信號特征提取與機器學習相結合方法的研究。研究人員通過小波變換[3]、經驗模態分解[4]、變分模態分解[5]等信號特征提取方法反映軸承狀態。且對工況與噪聲干擾不敏感的特征,再通過神經網絡[6]、支持向量機[7]等機器學習方法實現故障識別。上述方法在處理小樣本低噪聲干擾的問題展現出良好的性能,但在處理大量樣本且干擾復雜的問題時存在以下問題:將故障診斷方法分為去噪、特征提取、特征降維和特征分類4個孤立的部分,破壞了各部分間的耦合關系,造成部分故障信息損失。因此,采用傳統機器學習的算法難以處理數據量較大的問題[8]。
深度學習算法中,卷積神經網絡(Convolutional Neural Network,CNN)能有效地提取數據的空間特征,故被廣泛應用于圖像處理、語音識別、視頻處理以及故障診斷等領域[9-10]。在軸承故障診斷領域,基于CNN故障診斷模型的輸入通常采用二維的時頻圖[11]或一維的時序數據[12-13]。李恒等人[14]提出基于短時傅里葉變換(Short-Time Fourier Transform,STFT)和深度全卷積神經網絡的軸承故障診斷方法。該方法通過STFT提取時頻圖特征,利用DCNN實現了端到端的故障診斷。軸承振動數據是一種時間序列數據,在特征提取時使用以上方法,僅提取了數據的空間特性,忽略了時序特性。因此,使用以上方法在處理強噪聲干擾的故障診斷問題時所展現出的性能有所下降。
雙向長短記憶神經網絡(Bidirectional Long and Short Memory,BiLSTM)是循環神經網絡的一種特殊結構,其適用于處理序列數據,被廣泛應用于語音識別、情感識別等序列數據的處理與預測中[15-16]。BiLSTM網絡能有效分析時間序列數據的序列相關性,充分利用數據的時間特征來提高模型的識別效果。但對于數據量較大的問題,其提取數據非線性特征的效果較差,且模型的訓練速度較慢,需要與特征提取以及特征降維方法聯合使用[17]。
為了解決上述問題,本文提出了一種基于首層為寬卷積核的卷積層(Wide Convolution,WConv)和雙向長短記憶神經網絡的模型。該模型首先通過短時傅里葉變換,將時域數據轉換為時頻圖;然后通過三層堆疊的一維卷積池化層,提取數據的空間特征并起到保留序列特征的作用,其首層采用寬卷積核以增強網絡的感受野;隨后通過BiLSTM層提取序列特征;最后經兩層全連接層分類。為提高模型處理含噪聲干擾的軸承故障診斷問題的性能以及泛化能力,采用mini-batch、批量標準化(Batch Normalization,BN)和數據增強(Data Enhanncement,EM)的方法。文中采用凱西西儲大學(Casey Western Reserve University,CWRU)軸承故障數據集構造的噪聲干擾數據集對所提出模型的效果進行驗證。
短時傅里葉變換是一種時頻變換方法,可將時域數據轉換為時頻圖。STFT的定義是采用固定寬度的傅里葉窗函數沿信號的時間軸移動截取信號,將信號截取為多個等長的子信號,每個子信號近似平穩;然后對子信號傅里葉變換,得到各時刻t的局部頻譜集合,從而構成時間和頻率的二維時頻圖。其計算式為
(1)
式中,X(t)為原信號;F(t-τ)表示中心位于τ時刻的傅里葉窗。根據文獻[14]可知,對于STFT,所選取的傅里葉窗的寬度影響所構造的時頻圖的時域與頻域的分辨率R,而R又決定了時頻圖所包含的信息。這些信息既包括有用的故障信息,也包含噪聲干擾。因此合理的T和F能夠使故障信號顯著,減少噪聲干擾。
(2)
針對軸承振動信號,可以利用軸承故障特征頻率的一倍頻確定樣本的長度,根據二倍頻確定STFT窗口的寬度。
卷積神經網絡是一種前饋神經網絡,能高效地提取樣本的時空特征。CNN的結構主要包括卷積層、池化層、批量標準化層以及激活層。雙向長短記憶神經網絡是一種特殊的循環神經網絡,能提取數據的時間特征。本文分別利用CNN和LSTM提取時頻圖的空間特征和序列特征。
卷積神經網絡可根據處理數據維度建立不同的卷積層。2D卷積應用于圖像數據,是通過2D濾波器沿2D 特征圖的X和Y兩個維度做卷積運算,提取特征圖的空間特征,但對于序列數據卻很難保留序列特征。1D 卷積適用于一維序列數據,沿數據的單一維度方向移動做卷積運算,在提取空間特征的同時可有效保留序列特征。對于時間序列數據,1D卷積利用多個濾波器沿數據時間軸移動進行卷積運算提取特征,加上偏置后通過一個激活函數就可以得到保留時間特征的特征圖,其計算式為

(3)
池化層位于卷積層后,對特征圖進行下M采樣,以降低特征圖的維度。本文采用最大池化層,假設卷積層的輸出特征圖為X∈M,N,D,最大池化層是利用w×d的patch沿特征圖的單一方向以步長S移動,將每個特征圖Xd劃分為多個區域其中1 (4) 批量標準化是為減少內部協方差偏移問題,提出的一種逐層歸一化方法,能對神經網絡的任意中間層進行歸一化操作,并減少各層間樣本的差異性,從而起到縮減訓練時間以及避免梯度消失和梯度爆炸的作用。在卷積神經網絡中,BN層通常設置于卷積層與激活層之間。具體計算式如下 (5) (6) (7) 卷積運算后利用激活函數對特征圖進行非線性化處理,以增強模型的非線性表達能力,使學到的特征更具可分性。在CNN網絡中常使用Relu作激活函數。Relu函數能有效的解決梯度消失的問題,具體計算式如式(8)所示。 (8) 在全連接層后常利用Softmax函數來處理多分類問題,具體計算式如下 (9) 遞歸神經網絡(Recursive Neural Network,RNN)在處理時間深度較大的問題時,由于隱含層內部結構簡單,在進行誤差反向傳播時會出現的梯度消失或梯度爆炸的問題。LSTM[15]為解決RNN網絡誤差反向傳播時,會出現梯度消失或梯度爆炸的問題,例如將輸入門、遺忘門和輸出門結構引入,增加了對信息進行長短期選擇記憶的功能。所謂的“門”結構就是一個使用sigmoid網絡和按位做乘法的操作,之所以被稱為“門”是因為sigmoid作為激活函數的神經網絡層會輸出一個0到1之間的數值,這個數值就代表了當前的輸入有多少能通過“門”。 遺忘門的作用是使LSTM網絡忘記之前沒用的信息。 ft=σ(W[xt,ht-1,Ct-1]+bf) (10) 輸入門的作用是根據當前輸入[ht-1,xt,bi]和Ct-1共同決定當前時刻的狀態Ct。 (11) 輸出門會根據當前狀態Ct、當前輸入xt和上一時刻輸出ht-1來決定當前時刻的輸出ht。 (12) BiLSTM是LSTM網絡的一種特殊形式。如圖2所示,相比于傳統的LSTM網絡只有單向傳播的結構,該網絡增加了前向傳播與后向傳播兩部分,每個時刻的輸出都為該時刻隱層前向輸出(fw_output)與后向輸出(bw_output)的拼接concat。這種結構充分考慮了數據前后節點之間的相關性,更加適合于處理前后時刻間關聯性較強以及呈周期性變化的時間序列數據。 圖2 雙向循環神經網絡拓撲 深度學習算法在訓練過程中,常常會出現由訓練樣本較少引起的過擬合的現象。為解決這種問題,常采用數據增強技術。對于圖像數據,常采用對圖像進行平移、鏡像、旋轉等方法來增強數據集。軸承振動信號是一維時間序列數據,本文采用一種重復采樣的方法增強數據集,減少過擬合現象。以窗口寬度為w,重復率為wide,步長為s的采樣窗沿時間軸重采樣,具體過程如圖3所示。 圖3 數據增強 本文針對軸承振動信號的特點,采用1D 卷積層沿信號的時間軸卷積運算提取特征,保證了在特征提取的同時保留了信號的時間特性,然后采用BiLSTM網絡提取進一步提取數據的序列特征。 根據軸承振動信號的特點將CNN與BiLSTM聯合使用,具體如圖5所示。模型首層WConv1層采用尺寸為(32,1)的寬卷積核,起到增強了網絡感受野的作用;WConv層后通過一個池化層來對數據降維;隨后通過兩個卷積池化層來加深模型的深度,起到增強提取空間特征的作用;然后通過一層BiLSTM層進一步提取數據的序列特征,最后通過兩層全連接層(dense)實現分類,激活函數采用softmax。為增強模型的抗干擾性能,分別采用以下方法來提升模型:(1)首層采用寬卷積核的卷積層,增強模型的特征提取效果;(2)通過堆疊的1D卷積池化層提取數據的空間并保留序列特征,通過BiLSTM提取序列特征;(3)通過mini-batch和批量標準化的訓練方法,增強模型的泛化能力;(4)通數據增強方法來增強數據集,起到了防止過擬合現象以及增強模型抗噪性的作用。 模型訓練過程如圖6所示:(1)將原數據劃分為訓練集與測試集;訓練集數據先進行數據增強,然后將時域數據通過STFT轉換為時頻圖。測試集數據先添加不同信噪比的高斯白噪聲,構造含噪聲干擾的數據,然后通過STFT轉換為頻譜圖;(2)將訓練集與測試集分別輸入模型,訓練集用于訓練模型,測試集用于驗證模型的抗噪性;(3)經過試驗,確定模型的最優結構與最優參數,實現軸承的故障診斷。 試驗數據源自凱西西楚大學(CWRU)的模擬軸承故障試驗臺[17],試驗臺包括一臺2 HP電機、編碼器和測功機,試驗軸承采用型號為SKF6205的電機軸承。通過電火花技術對測試軸承構造不同點蝕直徑的單點故障,并通過加速度傳感器采集軸承故障診斷數據。實驗數據如表1所示。采用負載為0 HP、1 HP、2 HP和3 HP,損傷部位為內圈、外圈、滾動體和正常的10種不同損傷等級的數據。每種故障類型分別采集800個樣本,每1 200個信號點構成一組樣本,10種不同等級共8 000組樣本。軸承振動信號的時域與頻譜圖如圖7和圖8所示。 圖8 時頻圖 試驗平臺采用Windows10+MATLAB2016b與Ubuntu16.04+Python3.5+Tensorflow11。CPU采用Intel(R)Core(TM)i7-7500U。模型結構的確定采用試驗的方法,模型的最優參數如表2所示。 表2 模型詳細參數 為驗證模型的抗噪性能,通過CWRU數據集構造噪聲干擾實驗。為原信號添加不同強度的高斯白噪聲,以模擬不同信噪比狀態下的軸承振動信號。信噪比SNR代表信號與噪聲的比例,SNR越小代表信號中所含的噪聲比例越大。 (13) 其中,esingal代表信號的能量;enoise代表噪聲的能量。如圖9所示,原信號添加SNR為-4 dB的噪聲后,信號的周期性沖擊成分減弱。 圖9 SNR為-4 dB時的軸承振動信號圖 采用信噪比為-4~10 dB的含噪聲信號來驗證4種不同模型的抗噪性,結果如圖10所示。4種模型在處理低噪聲信號時,識別準確率都達到了90%以上。然而在處理強噪聲信號時VMD-LSTM模型的抗噪性較差;SVM與CNN模型的抗噪性相對較好,但是對于SNR為-4 dB的信號時,識別準確率也只能達到83%左右。對比以上方法,WConvBiLSTM模型在處理不同噪聲強度信號時始終保持較高的識別準確率,說明該模型有良好的抗噪性。 圖10 各模型抗噪性對比圖 表3為分別采用CNN、CNN-LSTM、WConvBiLSTM,以及為其分別添加Mini-batch/BN和數據增強方法(DE)模型在不同SNR噪聲干擾下的對比結果,結果表明本文所提出的WConvBiLSTM模型明顯優于其他模型。為其增加Mini-batch/BN和DE方法后,模型的抗噪性有了明顯的提升。 表3 不同模型的準確率對比 在實際干擾環境中常常會出現變負載與噪聲同時干擾的復雜擾動情況。為驗證WConvBiLSTM模型在處理復雜擾動問題時的性能,利用CWRU數據集構建變負載噪聲干擾數據集,數據具體如表4所示。 表4 變負載數據集 其中,A-C、B-D代表以A和B負載數據為訓練集,C和D負載數據為測試集的情況;B-AB、B-ABCD代表以B負載數為訓練集,多種混合負載數據為測試集的情況。 結果如圖11所示,模型在處理噪聲較小的問題時呈現出的效果較好,準確率都達到了90%以上,最高能達到98%以上。但隨著噪聲增強,即隨著SNR的降低,準確率不斷下降。當SNR為-4 dB時部分情況的準確率只能達到75%。總體上,模型針對變負載和噪聲干擾的軸承故障診斷問題展現出良好的效果,但是對于噪聲強度較大并且存在變負載情況的軸承故障問題的識別準確率還需要進行提高。 圖11 不同負載的模型抗噪性對比 本文針對含有噪聲干擾的軸承故障診斷問題,并結合軸承振動信號是一種呈周期性的時間序列數據的特點,建立了一種WConvBiLSTM模型。此外本文結合CWRU數據集構造噪聲干擾試驗,獲得了以下結論:(1)首層采用寬卷積核的卷積層,可提高模型的感受野,增強特征提取效果;(2)該模型充分考慮軸承振動信號呈周期性變化的特點,同時利用CNN和BiLSTM網絡分別提取數據的空間和序列特征,增強了模型在處理噪聲干擾問題時的故障識別精度;(3)采用mini-batch結合BN對模型的訓練造成干擾,有效提高了模型的抗噪性。本研究經過大量實驗確定了最優模型,并證明WConvBiLSTM模型對工況變化以及噪聲干擾問題有較好的魯棒性。
2.3 批量標準化層

2.4 激活函數
2.5 長短記憶神經網絡

2.6 數據增強

3 WCNN-BiLSTM模型結構
4 試驗驗證
4.1 西楚大學軸承故障診斷數據集


4.2 噪聲測試





5 結束語