張 氫, 江偉哲, 李 恒
(同濟大學 機械與能源工程學院, 上海 201804)
滾動軸承作為機械設備的重要傳動部件,其工作狀況對設備產生極大的影響。 滾動軸承的故障往往會降低設備的可靠性和精度,不僅影響生產,減少設備壽命,甚至會造成事故。 目前,滾動軸承的故障診斷研究集中在故障特征提取和故障模式識別,這是實現滾動軸承智能狀態檢測與診斷的核心技術,其主要研究對象為滾動軸承的振動信號。 當滾動軸承存在局部損壞時會產生周期性沖擊,軸承的故障信息則隱含在沖擊信號的頻率特征中。 然而,滾動軸承的工作環境一般較為復雜,受工作環境影響,實際采集到的振動信號通常會被淹沒在噪聲中; 因此如何從強背景噪聲中提取故障特征是進行軸承故障診斷的重點。 在損傷故障發生的初期,強噪聲淹沒下的微弱故障特征的提取和識別是防止故障惡化和加強故障診斷及時性的關鍵。
文獻[1]提出變分模態分解(VMD)與最大相關峭度解卷積(MCKD)相結合的方法;文獻[2]提出了基于最優參數MCKD與總體局部均值分解方法相結合的軸承復合故障診斷方法,皆證明了MCKD算法在提取噪聲中的周期成分時具有顯著的優勢。 但MCKD的降噪能力有限,尤其在故障產生早期,且信噪比較低的情況下效果并不理想,需要增強故障的瞬態特征。 文獻[3-4]通過計算重構信號的Teager能量譜來突出故障沖擊特征,基于Teager能量算子對瞬態特征的有效分析實現了良好的去噪效果。 因此,本文提出了MCKD算法與Teager能量算子相結合的故障特征提取方法。 首先,采用MCKD算法對原始信號降噪,檢測信號中的周期成分;然后,利用Teager能量算子增強重構信號中的周期沖擊特征,實現弱周期沖擊特征的有效提取。
在實現對強烈背景噪聲中周期沖擊特征提取的同時,需要用模式識別的方法對提取的特征參數進行診斷。 隨著人工智能技術的不斷發展,基于深度學習的軸承故障智能診斷已成為現階段的研究熱點。 文獻[5-9]利用卷積神經網絡對數據特征的自適應性,實現了故障模式的智能識別。 雖然卷積神經網絡在診斷結果上可以得到較高的精度,但是存在一個主要問題,即卷積神經網絡及一般的機器學習模型對以時間序列作為輸入的數據,其前后關聯性不強。
滾動軸承的振動數據是一種具有時間連續性的一維信號數據,充分利用數據的時間相關性是實現滾動軸承故障識別的關鍵。 因此,本文提出以長短期神經網絡(LSTM)對Teager能量時間序列進行端到端故障診斷的方法。 LSTM是時間序列模型,其特點是通過“門”結構控制神經網絡中每個時刻的信息狀態,能持續記憶多時刻信息,挖掘數據在時間上的相關性。 本文中,MCKD與Teager能量算子過濾后的信號具有強時序特征的性質,因此LSTM在對滾動軸承振動信號的時序特征識別上更具有優勢。

x=h·y+e
(1)

(2)
MCKD以相關峭度作為評定恢復信號y性能的指標。 當y的相關峭度達到最大時,則認為此時的f即為期望的目標。 對于信號yn,其相關峭度定義為
(3)
式中:T為解卷積的周期,一般為故障振動信號周期;M為解卷積的位移數,位移數增加則會增加周期脈沖的數量。
MCKD算法以相關峭度最大化作為目標,即
(4)
為了求解式(4),并且要得到最優濾波器f,則綜合式(2)和式(3)對式(4)的等價方程進行求解:
(5)
將式(5)整理后得到式(6),為最優濾波器的矩陣形式[12],將得到的最優濾波器代入式(2)即可得到周期性沖擊信號。

(6)
式中:
根據軸承的參數和轉動頻率求解滾動軸承的故障頻率,得到解卷積周期T=1/f,而故障頻率指的是滾動體滾過內圈或外圈某固定點的頻率:
(7)
式中:fic為滾動軸承內圈故障頻率,foc為外圈故障頻率,fb為滾動體的故障頻率,fr為轉頻,d和D分別為滾動體和節圓的直徑,Z為滾動體數目,α為軸承接觸角。
Teager能量算子是一種非線性算子[13],可以理解為信號的能量,可通過對振動信號的瞬時值及其微分進行非線性組合來放大信號的瞬態能量成分,從而增強沖擊特征。 對于連續時間信號x(t),Teager能量算子的定義為
(8)

若x(t)為離散信號,則用差分代替微分,Teager能量算子被近似定義為
φ[x(n)]=[x(n)]2-x(n+1)x(n-1)
(9)
由式(9)可以看出,對于離散時間信號,只要已知當前時刻和前、后時刻的樣本,即可計算出當前時刻的Teager能量。 Teager能量算子中包含了信號的微分項,考慮了信號的瞬時頻率,對信號中的瞬態成分十分敏感。 相比于主要考慮信號幅值的傳統信號能量算子,Teager能量算子可以增強背景噪聲信號中的高頻沖擊特征,適合處理經過MCKD重構后的信號。
滾動軸承的故障信號為非平穩信號,往往被淹沒在強背景噪聲中,其故障特征提取難度較大。 為了從采集到的受噪聲嚴重污染的信號中還原出原始信號的周期沖擊故障特征,采用MCKD算法對信號降噪,但MCKD算法在故障產生初期且信噪比較低的情況下效果并不理想。 因此,本文結合MCKD算法與Teager能量算子的優勢,用Teager能量算子對MCKD算法重構后的信號進行計算,增強重構信號中的周期沖擊特征。 圖1為提取滾動軸承故障特征的流程圖。

圖1 MCKD-Teager能量算子故障特征提取過程
其具體步驟如下:
Step1確定解卷積周期T,位移數M和最大迭代次數n;
Step2計算信號x(n)的X0,X0T和XmT;

Step4根據式(2)計算輸出信號y;
Step5基于信號y計算αm和β;
Step6根據式(6)更新濾波器f,并計算信號y的相關峭度CK;
Step7若CK大于當前迭代步的最大相關峭度maxCK,則maxCK=CK,且最優濾波器f_best等于f。
Step8判斷迭代次數是否大于給定閾值n,如果滿足此條件或者迭代次數等于n,則終止迭代過程,否則迭代次數加1并返回Step4。
Step9一旦獲得最優濾波器f_best,用式(2)可計算出MCKD算法的輸出信號。
Step10根據式(9)計算MCKD輸出信號中每一瞬時的能量,得到Teager能量序列。
LSTM模型是由Hochreater等[14]提出的一種網絡結構,是一種特殊的循環神經網絡(RNN),通過在隱藏層的細胞單元中引入了更為復雜的門結構激活方式,有效地解決了RNN中梯度消失或梯度爆炸的問題,使模型具有學習長期依賴信息的能力[14]。
LSTM在神經元中加入輸入門i、輸出門o和遺忘門f。 LSTM神經元結構如圖2所示。

圖2 LSTM單元結構
遺忘門ft用來決定信息的遺忘和更新,其通過輸入當前狀態的輸入信息和上一狀態隱藏層的輸出信息到Sigmoid函數σ中,產生0(完全舍棄)到1(完全保留)之間的值后再與上一時刻的記憶單元值相乘來確定信息的取舍。
輸入門it用來選擇存儲到信息傳送帶中的信息,計算方法與遺忘門類似;臨時記憶狀態ct′需要在更新記憶單元ct之前計算,通過tanh函數來計算當前時刻的候選記憶單元值。
細胞狀態ct為當前時刻的記憶單元值,由遺忘門、上一時刻的記憶單元值、輸入門和臨時記憶狀態值共同作用。
輸出門ot用來確定當前單元輸出的信息;由Sigmoid函數產生的數值來決定。 當前細胞狀態值ct通過tanh函數激活后再與ot相乘,即可得到當前細胞單元的輸出信息ht。
各個門的計算方法為
(10)
式中:wxf、wxi、wxc、wxo分別為輸入層與隱藏層各個門之間的連接權值,whf、whi、whc、who分別為上一時刻的隱藏層輸出與當前時刻隱藏層各個門之間的連接權值,bf、bi、bc、bo分別為隱藏層各個門的偏置向量。
滾動軸承故障診斷的目的是從眾多振動信號中準確地對其中任何一種數據進行分類識別,包括學習訓練、測試診斷兩個過程。 首先,將預處理后的訓練集輸入到LSTM中進行參數學習,并用ADAM算法不斷更新權重w和偏置b,使得損失函數值減小。 最后將訓練好的參數應用于測試集,從而得到故障診斷結果,故障狀態識別過程如圖3所示。

圖3 故障狀態識別過程
學習訓練與測試診斷均包括數據預處理過程,即前文所述基于MCKD-Teager能量算子的故障特征提取方法,處理后的數據已降低了背景噪聲的影響,在時間序列上有很強的故障特征信息,將會大大減少LSTM的訓練成本。 本文提出的端到端LSTM故障診斷模型如圖4所示。

圖4 端到端LSTM故障診斷模型
LSTM故障診斷模型包含1個LSTM單元模型層和一個Softmax邏輯層,其輸入為Teager能量序列。 LSTM層各單元構成的網絡結構僅能通過訓練集訓練來獲得權重,雖然具有自主學習和聚類的能力,但是不能對信號進行分類。 因此在模型的頂層加入具有判別能力的Softmax回歸邏輯層,以此來對不同類型的信號進行分類,其損失代價函數為
(11)

數據為美國凱斯西儲大學公開的滾動軸承振動信號數據集[15]。 實驗用電動機轉速為1 797 r/min,采樣頻率為12 kHz。 本文選取驅動端軸承座振動信號的10種故障模式,分別為正常狀態以及內圈、外圈、滾動體分別在直徑0.18、0.36、0.54 mm的損傷斑點下的故障模式。 每個軸承故障診斷樣本序列取1 024個采樣點,每類故障信號取1 000個樣本,500個樣本為訓練集,500個樣本為測試集,共建立了一個大小為10 000×1 024的數據集。
表1為實驗所用型號為SKF6205的滾動軸承參數。 由式(7)可計算出故障特征頻率,如表2所示。

表1 滾動軸承SKF6205參數

表2 SKF6205故障特征參數
圖5為采樣點數1 024、采樣時長約為0.085 s、損傷直徑0.18 mm的滾動軸承內圈故障原始信號和頻譜圖。 內圈故障特征周期為74個采樣間隔,其至少包含13次故障沖擊。 由圖5(a)可見,其周期沖擊成分被噪聲嚴重干擾,故障特征難以識別;由圖5(b)可見,中、高頻處的能量較大,而內、外圈和滾動體的故障特征頻率皆處于低頻段,依舊難以識別。 原始信號中的故障特征辨識度極差,在進行故障診斷之前需要對信號進行特征提取,充分挖掘信號中存在的故障信息。
對軸承內圈故障振動信號的1 024個采樣點進行MCKD-Teager能量算子特征提取。 圖6(a)為以74為故障特征周期對圖5(a)信號做MCKD特征提取。與圖5(a)相比,信號中的噪聲得到抑制,沖擊成分得到凸顯,但在圖6(b)MCKD重構信號的頻譜圖中信號的高頻能量仍然占據較大比重。 利用Teager能量算子對圖6(a)信號進行計算后得到圖6(c)所示的瞬時能量波形圖,其在6(a)的基礎上強烈抑制了背景噪聲、沖擊特征更加明顯,且從其Teager能量譜圖6(d)可知,與圖5(b)、圖6(b)相比,162.2 Hz的故障特征頻率處的能量值達到最高,峰值譜線突出,其倍頻成分也直觀可見。

(a)軸承內圈故障原始信號

(b)軸承內圈故障信號頻譜

(a)MCKD重構信號

(b)MCKD重構信號頻譜圖

(c)瞬時Teager能量波形圖

(d)MCKD重構信號的Teager能量譜
圖7(a)為滾動軸承外圈故障信號,取1 024個采樣點,外圈的故障特征周期為112個采樣點,則至少包含9次故障沖擊。 圖7為損傷直徑為0.18 mm軸承外圈故障特征提取過程,由圖7(b)可知,原始信號圖7(a)中低頻周期沖擊能量相比于中高頻成分十分微弱。 原始信號經過MCKD-Teager能量算子重構后得到圖7(c),由其頻譜7(d)可知107.4 Hz的故障頻率能量達到最大,特征提取效果較好。
將經過MCKD-Teager能量算子處理后的10種故障模式數據集輸入到2.2節提出的LSTM故障診斷模型中進行訓練。 在不同輸入作用下,分別進行了LSTM與隨機森林(RF)、支持向量機(SVM)、前饋神經網絡和卷積神經網絡(CNN)這4種診斷模型的對比實驗,結果如表3所示,實驗平臺為windows10+Python,CPU采用英特爾Corei5-6300。

(a)軸承外圈故障原始信號

(c)軸承外圈故障MCKD-Teager能量波形圖

(b)軸承外圈故障信號頻譜

(d)MCKD重構信號的Teager能量譜

表3 CWRU數據集在5種模型下的故障識別正確率
由表3可知,以原始信號、MCKD重構信號和MCKD-Teager能量序列作為輸入的識別正確率依次提高;5種診斷模型對原始信號的識別結果均較低;而對MCKD-Teager能量序列LSTM模型的診斷效果達到最好。
前饋神經網絡的結構采用與LSTM模型結構類似的1個全連接層和1個Softmax層,CNN模型的結構為一個卷積層和一個池化層。 圖8為3種網絡模型(LSTM、前饋神經網絡和CNN)的故障識別過程。
圖8中,(a)、(d)、(g)為前饋神經網絡診斷模型的識別結果,(b)、(e)、(h)為CNN模型的識別結果,(c)、(f)、(i)為LSTM診斷模型的識別結果。 圖8(a)、(b)、(c)的輸入為原始信號,可見無論是LSTM、CNN還是前饋神經網絡,在測試集上的故障識別正確率均不高,30輪訓練后正確率分別為77.8%、80.5%和79.5%。 圖8(d)、(e)、(f)的輸入為經過MCKD算法重構后的信號,可見3種模型的識別正確率有所提高,LSTM模型的正確率93.4%要高于前兩種網絡模型。 雖然三者在訓練集上的正確率都達到了100%,但訓練集與測試集的差距較大。 圖8(g)、(h)、(i)的輸入為MCKD-Teager能量序列,LSTM診斷模型在訓練集和測試集上的差距明顯減小,正確率達到99.6%,顯著高于前兩者。

圖8 故障識別訓練過程對比
表4、5分別為不同診斷模型在滾動軸承內圈損傷直徑0.18 mm(IR018)和外圈損傷直徑0.18 mm(OR018)兩種故障模式下經過MCKD-Teager能量算子濾波后識別結果的混淆矩陣。 由表4、5可知,混淆矩陣得到5種診斷模型RF、SVM、前饋神經網絡、CNN和LSTM在IR018、OR018兩種故障模式下的識別錯誤率分別為10.1%、7.5%、10.5%、7.0%、0.3%和10.5%、8.6%、10.2%、6.8%、0.4%。 可以看出LSTM診斷模型的錯誤率要低于前4種模型,識別效果較好。

表4 IR018故障模式下的識別結果

表5 OR018故障模式下的識別結果
搭建旋轉機械故障實驗平臺,平臺主要由驅動電機、測試軸承、同步帶等裝置組成,并使用東華測試的便攜式數據采集分析系統(DH5901)來采集軸承座處的振動信號,采樣頻率為12.8 kHz。 實驗所用的軸承型號為外圈可拆卸式N205E和內圈可拆卸式NU205E,滾子數目為13個,其他參數與表1的SKF6025參數相同。 用線切割加工的方式分別在內、外圈和滾動體上加工出不同程度的損傷。 轉速為900 r/min時軸承的故障特征參數如表6所示。

表6 N205E/NU205E故障特征參數
實驗有9種故障模式,分別是正常、滾動體輕-重兩種程度的故障、內圈和外圈輕-中-重3種程度的故障。 每類故障信號選取1 000個有1 024個采樣點的樣本,500個樣本為訓練集,500個樣本為測試集,建立大小為9 000×1 024的數據集。
圖9為輕度故障下,滾動軸承內、外圈和滾動體故障信號經過MCKD-Teager能量算子處理后的波形圖。 設計了與3.1節相同的故障診斷對比實驗,結果如圖10所示。 通過對圖10中9張圖的橫向比較可以看出,前饋神經網絡和CNN相比于LSTM診斷模型,因對時序特征提取效果不強,導致其在測試集和訓練集上的差距較大,容易產生過擬合;而縱向比較可以看出MCKD-Teager能量算子序列處理后的信號,識別正確率優于前兩種輸入,是一種挖掘信號時間相關性的特征提取方法。

(a)內圈故障信號特征提取結果 (b)外圈故障信號特征提取結果 (c)滾動體故障信號特征提取結果

圖10 實驗數據集故障識別對比實驗結果
表7、8分別為不同診斷模型在滾動軸承內圈輕度故障和外圈輕度故障兩種故障模式下經過MCKD-Teager能量算子濾波后識別結果的混淆矩陣。 由表7、8可知,混淆矩陣得到5種診斷模型RF、SVM、前饋神經網絡、CNN和LSTM在內圈輕度故障和外圈輕度故障兩種故障模式下的識別錯誤率分別為16.1%、15.4%、11.5%、11.3%、1.1%和15.6%、16.0%、12.0%、9.9%、1.2%,與3.1節的識別結果類似,LSTM診斷模型的錯誤率要低于前4種模型,具有較好的識別效果。

表7 內圈輕度故障下的識別結果

表8 外圈輕度故障下的識別結果
本文提出一種基于MCKD-Teager能量算子和LSTM的故障診斷方法。 將故障信號的特征提取和識別分類結合在一起,是一種端到端的軸承故障診斷模式。 首先計算滾動軸承的故障特征周期,通過MCKD-Teager能量算子提取出相應的故障特征,再進行故障識別實驗,得出如下結論:
1) MCKD算法和Teager能量算子相結合的方式可以在時間序列上很好的提取出不同的故障特征,所得到的Teager能量波形序列能夠在測試集上取得非常好的效果。
2) 一般的分類模型對時序特征不敏感,而本文提出的LSTM故障診斷模型能夠有效地提取輸入信號的時間相關性,充分利用經過MCKD-Teager能量算子處理后信號的強時序特征,顯著提高故障識別正確率。