卓鵬程, 嚴 瑾, 鄭美妹, 夏唐斌, 奚立峰
(上海交通大學 機械系統與振動國家重點實驗室; 機械與動力工程學院,上海 200240)
滾動軸承是機械設備中應用最廣泛的部件之一,由于其工作條件惡劣,故障頻繁發生,一旦發生故障,將降低設備性能甚至造成嚴重經濟損失與人員傷亡[1].及時準確地進行滾動軸承的故障診斷,可通過設計有效的維修方案來避免事故的發生[2].目前,較多的滾動軸承故障診斷主要面向于不同的故障部件(滾動體、外圈與內圈),在故障時期上的研究則集中于復雜的故障初期,但忽略了對全生命周期內不同故障時期的綜合分析.在滾動軸承性能初始退化階段,由于其微弱的損傷不會影響設備的正常運轉而無法被發現,同時其被環境噪聲所淹沒的故障特征也對故障診斷模型帶來了巨大的挑戰.隨著軸承損傷的不斷累積,其退化程度由中度退化急劇發展成重度退化,最終會造成設備的損傷與停機[3].因此,實現滾動軸承全生命周期內的不同退化階段(初始退化、中度退化與重度退化)的精確故障診斷,可以有效地提高裝備運維效率、降低生產故障損失.
目前,在滾動軸承故障診斷領域,常用的機器學習方法有支持向量機(SVM)和人工神經網絡(ANN)等[4-5].面向滾動軸承的輕度退化數據具有高噪聲、非線性與強復雜等特性,人工神經網絡由于其自學習與高速尋優能力,成為最熱門的滾動軸承故障診斷方法[6].Li等[7]通過將反向傳播(BP)神經網絡與AdaBoost算法集成,有效地評估了分液壓缸內部泄漏的程度.但BP神經網絡具有不穩定與噪聲敏感等缺陷.相比之下,Elman神經網絡在BP神經網絡的基礎上增加了隱含層與輸入層之間的反饋,提高了網絡處理動態數據的能力.湯寶平等[8]成功地將Elman神經網絡應用于旋轉機械的故障診斷,并展現了Elman神經網絡較好的適應能力和良好的穩定性.考慮到Elman神經網絡僅僅涉及了隱含層的反饋機制,Shi等[9]在其基礎上進一步添加反饋機制,設計出OHF (Output-Hidden feedback) Elman神經網絡與OIF (Output-Input Feedback) Elman神經網絡,添加的輸出層反饋機制實現了從有限采樣點獲取更多信息.
鑒于滾動軸承不同退化階段特征信號的相似性,本文將在Elman神經網絡的基礎上,同時考慮輸出層對隱含層與輸入層的反饋,即OIHF (Output-Input-Hidden) Elman神經網絡,以提高網絡對滾動軸承不同退化階段數據的處理能力.此外,針對OIHF Elman神經網絡的梯度下降法容易陷入局部極小解的問題,本文整合了具有全局尋優求解優勢的遺傳算法(GA),建立GA-OIHF Elman神經網絡診斷模型,顯著地提高了神經網絡領域的故障診斷準確性.
在全生命周期退化過程中,當滾動軸承表面發生輕微缺陷時,振動信號中會產生相應輕度退化的周期性脈沖.這些脈沖常被噪聲和來自其他旋轉組件的諧波干擾所淹沒[10].為有效解決這一問題,目前的研究較多集中于滾動軸承的早期故障診斷[11].然而值得注意的是,在滾動軸承全生命周期內,可細分為輕度退化、中度退化與重度退化3種故障階段,不同階段呈現不同的衰退特征,其退化過程通常如圖1所示.其中:A為振動加速度幅值;v為樣本點數;g為重力加速度.在研究3種主要部件(滾動體、內圈與外圈)的基礎上,進一步深入分析相應3種故障階段(輕度退化、中度退化及重度退化)的故障診斷,從而可以為預先規劃維修與更換方案提供保障.

圖1 滾動軸承全生命周期內的振動信號Fig.1 Vibration signals during full life cycle of rolling bearing
在提出GA-OIHF Elman神經網絡診斷模型進行故障診斷之前,首要條件便是進行振動信號處理,進而提取出有效的故障特征[12-15].集合經驗模態分解(EEMD)[16]可以有效地去除振動信號的噪聲影響.因此,設計采用EEMD與GA-OIHF Elman神經網絡診斷模型分別進行振動信號處理與滾動軸承全生命周期故障診斷的研究方案,所構建的技術方法框架如圖2所示,其中IMF為基本模態分量.

圖2 滾動軸承故障診斷技術框架圖Fig.2 Technical framework of fault diagnosis for rolling bearing
該框架主要包括故障特征提取與故障診斷.針對故障特征提取,首先采用集成模態分解進行信號處理.之后,采用峭度與相關系數對分解得到的基本模態分量進行篩選.故障診斷部分主要包括遺傳算法與神經網絡,神經網絡部分主要通過在Elman神經網絡的基礎上,同時考慮輸出層對隱含層與輸入層的反饋,進而設計出故障診斷新模型OIHF Elman神經網絡.此外,針對OIHF Elman神經網絡由于梯度下降法易陷入局部最優解的技術問題,結合遺傳算法與最終形成的GA-OIHF Elman神經網絡診斷模型,可以實現更為準確與穩定的滾動軸承全生命周期故障診斷.所建立的GA-OIHF Elman神經網絡模型的優勢在于:
(1) 設計出OIHF Elman神經網絡作為核心診斷算法,以其獨特的多反饋結構,擁有適應時變特性數據的能力,其歷史數據的強敏感性特別適用于滾動軸承的輕度退化數據,可以有效地進行全生命周期故障診斷;
(2) 遺傳算法通過對網絡的初始權值和閾值進行全局尋優,可以有效地提高OIHF Elman神經網絡的非線性動態特性以及準確性,避免OIHF Elman神經網絡陷入局部最優,從而實現對滾動軸承的精確診斷;
(3) 結合OIHF Elman的多反饋結構與遺傳算法的全局尋優,不僅提高了網絡模型對于故障診斷的泛化能力,還進一步提高了模型的穩定性,可以適應不同故障階段的數據處理與診斷.
Elman神經網絡在傳統三層網絡結構(輸入層、隱含層與輸出層)的基礎上增加了一個承接層.由于其對歷史數據的敏感性,Elman神經網絡在提高計算結果的準確性的基礎上,可同時提高計算速度.假設第k步迭代中,輸入u(k)是r維向量,即輸入層神經元數量,隱藏層輸出x(k)和承接層的輸出xc(k)均是n維向量,即隱藏層與承接層神經元數量,輸出層的輸出y(k)是m維向量,即輸出層神經元數量.連接權值矩陣wI1,wI2和wI3分別是n×n,n×r和m×n維矩陣.
考慮到神經網絡每一層的反饋信息均會影響網絡對于數據的處理精度及速度,Shi等[9]考慮在Elman神經網絡的基礎上進一步設計輸出層的反饋機制,分別為輸出層對隱含層的反饋與輸出層對輸入層的反饋,即OHF Elman神經網絡與OIF Elman神經網絡.OIF Elman神經網絡與OHF Elman神經網絡的拓撲結構如圖3所示.其中:OIF Elman神經網絡增加的輸出層對輸入層的反饋結構稱為承接層2,其連接權值矩陣為wI4;OHF Elman神經網絡增加的輸出層對隱含層的反饋結構稱為承接層3,其連接權值矩陣為wI5;承接層2與承接層3的輸出都為yc(k).

圖3 OIF Elman與OHF Elman網絡結構示意圖Fig.3 Illustration of OIF Elman and OHF Elman network structures
OIF Elman神經網絡的數學模型為[9]
x(k)=f(wI1xc(k)+wI2u(k-1)+wI4yc(k))
(1)
xc(k)=αxc(k-1)+x(k-1)
(2)
yc(k)=γyc(k-1)+y(k-1)
(3)
y(k)=wI3x(k)
(4)
OHF Elman神經網絡的數學模型為[9]
x(k)=f(wI1xc(k)+wI2u(k-1))
(5)
xc(k)=αxc(k-1)+x(k-1)
(6)
yc(k)=γyc(k-1)+y(k-1)
(7)
y(k)=wI3x(k)+wI5yc(k)
(8)
式中:α、γ為反饋增益因子,其取值范圍為(0,1);f(·)通常取為sigmoid函數,其表達式為

(9)

(16)
式中:η1、η2、η3、η4、η5分別為wI1、wI2、wI3、wI4、wI5的學習步長.
鑒于滾動軸承全生命周期內故障信號具有內在的相似性,本文全面設計輸出層對隱含層及輸出層對輸入層的雙反饋機制,即OIHF Elman神經網絡.所提出的OIHF Elman神經網絡拓撲結構如圖4所示.其中,連接權值矩陣wI4、wI5分別與OIF Elman神經網絡中的權值矩陣wI4、OHF Elman神經網絡中的權值矩陣wI5相同.

圖4 OIHF Elman網絡結構示意圖Fig.4 Illustration of OIHF Elman network structure
OIHF Elman神經網絡的數學模型為
x(k)=f(wI1xc(k)+wI2u(k-1)+
wI4yc(k))
(19)
xc(k)=αxc(k-1)+x(k-1)
(20)
yc(k)=γyc(k-1)+y(k-1)
(21)
y(k)=wI3x(k)+wI5yc(k)
(22)
根據OIHF Elman神經網絡的數學模型與拓撲結構,其連接權值矩陣wI1、wI2、wI3、wI4與wI5的學習算法分別由式(14)、(13)、(12)、(11)、(10)確定.
OIHF Elman神經網絡是在OIF Elman與OHF Elman神經網絡的基礎上,進一步考慮輸出層的反饋機制,同時Elman神經網絡采用的梯度下降法同樣延續至OIHF Elman神經網絡.由于采用梯度下降法對網絡的權值及閾值進行修正,存在收斂過慢與容易陷入局部最優的缺點,為了解決這一關鍵問題,提出通過結合遺傳算法與OIHF Elman神經網絡找到最優解的方法.
遺傳算法模仿生物學進化理論,將網絡參數的尋優問題轉化為進化過程,以適應度為評價標準,通過交叉、變異、復制等操作產生新個體,淘汰適應度低的個體,從而實現參數的最優化.通過遺傳算法的全局尋優能力,將優化的參數反饋給OIHF Elman神經網絡,再通過網絡進行局部精確尋優,從而提高模型的診斷準確度.具體算法流程如下.
(1) 參數編碼與初始化:采用浮點編碼方式對神經網絡的權值與閾值進行編碼,確定交叉、變異概率,代數及初始種群規模,并隨機產生初始種群;
(2) 適應度評價:對個體適應度進行計算,采用均方誤差(MSE)及輪盤賭方式對個體進行選擇;
(3) 交叉與變異:以設定的交叉與變異概率進行操作,通過交叉產生新的優良個體,通過變異保證遺傳算法的全局搜索;
(4) 新種群:將產生的新個體放入種群中產生新種群;
(5) 重復(2)~(4)操作,直至達到進化代數要求,輸出最優個體反饋給OIHF Elman神經網絡.
MSE被廣泛用作機器學習的性能評估指標.MSE是參數的估計值與真實值之差平方的期望值,反映了診斷結果的準確性.
(23)
(24)

為了表征滾動軸承故障診斷模型的穩定性,對測試數據的MSE進行標準偏差計算.標準偏差越小,模型對不同故障的診斷能力就越平衡.

(25)
式中:MSEλ為第λ組測試樣本的均方誤差.
軸承振動數據集來自于美國凱斯西儲大學電氣工程滾動軸承試驗平臺,電機轉速為 1 797 r/min,采樣頻率為12 kHz,測試軸承型號為6025-2RS JEM SKF深溝球軸承,試驗采用電火花加工技術實現單點故障.通過分析軸承單點故障的演化過程,分別選擇故障直徑為 0.177 8、0.355 6 和 0.533 4 mm故障表征輕度退化、中度退化以及重度退化階段.每種退化故障下選擇60組樣本數據,正常階段下選擇120組樣本數據,且按照5∶1的比例隨機分成訓練集與測試集.樣本數據的輸出則由向量表示為
[0 … 0 1 0 … 0]T
其中:1對應的位置ε表示為第ε種故障模式,其余為0.
考慮采樣頻率和特征頻率,選擇 2 000 個樣本點代表故障振動信號的特征.同時采用IMF分量與振動信號的相關系數,與分量的峭度值作為IMF分量選擇的指標.每組信號選取最大相關系數的0.1作為篩選閾值,相關系數高于閾值的IMF分量進行保留[17].選擇時域內的3種有量綱參數:均值、標準差、均方根值,與3種無量綱參數:偏度、峭度、裕度作為特征向量.
進化算法是作為解決機器學習算法容易陷入局部最優的常用方法,Guo等[18]通過粒子群優化(PSO)算法優化K最鄰近法,在不平衡樣本上實現了準確分類.Liu等[19]則是分別利用遺傳算法與思維進化算法(MEA)與多層感知器神經網絡結合,提高風速的預測精度.因此,為了證明遺傳算法的優勢,同時進行粒子群優化算法與思維進化算法的對比數值實驗.
基于進化算法與神經網絡的診斷模型參數主要包括神經網絡參數與進化算法參數.
3.3.1神經網絡參數設計
(26)
式中:a為1~10的常數.式(26)是確定隱含層神經元數的常用公式,首先可以確定隱含層神經元數的范圍為[4,14].選擇基于Elman神經網絡的測試誤差作為判斷準則.神經元個數不同的Elman神經網絡預測誤差如圖5所示,隱含層神經元數確定為n=13.

圖5 神經元個數不同的Elman神經網絡預測誤差圖Fig.5 Prediction errors of Elman neural network with different numbers of neuron
3.3.2進化算法的參數設計 將遺傳算法種群數量設為30代,種群規模為10,即可接近收斂;選用交叉概率為0.5,以加速收斂由于變異帶來的強隨機性;為保證產生優秀個體的同時平穩收斂,設定變異概率為0.1.考慮到本文故障診斷的全局優化問題,二進制編碼難以實現高精度解,但在計算誤差函數時,仍需將二進制碼解碼成十進制浮點數.根據上節中的Elman網絡模型,發現網絡閾值與權值大多處于[-3,3],為了保證網絡迭代搜索空間的可行性,浮點編碼確定數據范圍為[-3,3].
考慮到算法模型訓練時長,粒子群優化算法種群規模設置為30,進化代數為10,加速常數為c1=c2=1.494 45,最大限制速度為5,位置邊界為[-1,1].思維進化算法種群規模設置為100,進化次數為10,優勝子種群數與臨時子種群數為5.
針對滾動軸承的全生命周期故障診斷問題,在OHF Elman、OIF Elman神經網絡的基礎上研究輸出層的反饋結構,衍生出OIHF Elman神經網絡.為了解決神經網絡容易陷入的局部最優問題,引入進化算法進行模型優化,分別選用遺傳算法、粒子群優化算法與思維進化算法進行數據實驗.
3.4.1神經網絡基本模型診斷結果對比分析 在滾動軸承的故障診斷領域內,SVM和神經網絡是最常用的兩種方法,為了證明新增輸出層反饋機制的有效性,SVM與Elman也將同時進行數據實驗,并和OHF Elman神經網絡、OIF Elman神經網絡與OIHF Elman神經網絡進行診斷結果對比分析.
SVM與4種神經網絡在每一個測試樣本上的診斷MSE如圖6所示.從圖6中可知,在Elman神經網絡基礎上增加輸出層反饋機構的3種神經網絡(OHF Elman、OIF Elman與OIHF Elman神經網絡)均取得了較好的診斷效果,且在多數樣本上擁有相對于Elman神經網絡與SVM的優越性.其中,OIHF Elman神經網絡在大部分的測試樣本上獲得了最為準確的診斷結果.

圖6 SVM與4種神經網絡在每個測試樣本上的診斷誤差Fig.6 Diagnostic errors of SVM and four other neural networks in each test sample
一組測試樣本會得到一個10×1的絕對誤差矩陣,將0.5作為每個絕對誤差的上限, 10個誤差均低于0.5為診斷正確.根據診斷結果,SVM、Elman、OHF Elman、OIF Elman與OIHF Elman的診斷準確度分別為45.4%、64.5%、87.27%、90%與91.8%,從而證明了3種優化Elman神經網絡的有效性.
為了更好地評價OIHF Elman診斷模型的優越性,分別計算了各模型在測試集上診斷誤差的平均值與標準差,具體結果如表1所示.

表1 SVM與4種神經網絡在測試集上的平均診斷結果
表1同樣驗證了OHF Elman、OIF Elman與OIHF Elman神經網絡反饋結構的有效性,在保證準確度的同時也提高了模型對滾動軸承診斷的穩定性.其中,OIHF Elman神經網絡對于滾動軸承故障診斷擁有高準確性與高穩定性.
3.4.2進化算法優化模型診斷結果對比分析 為了更大程度地選擇最優診斷模型,選擇3種進化算法分別與OIHF Elman神經網絡結合,同樣采用診斷誤差的平均值與標準差作為評價指標.具體結果如表2所示.

表2 3種進化算法下的OIHF Elman神經網絡模型的診斷結果
由表2可知,GA-OIHF Elman診斷模型實現了較高的93.6%的診斷準確度.相較于OIHF Elman神經網絡,不同進化算法均提高了OIHF Elman神經網絡的診斷精確度與穩定性.其中,遺傳算法的優化效果最好,所提出的遺傳算法優化的OIHF Elman神經網絡模型取得了最高的故障診斷準確性與穩定性.
3.4.3滾動軸承的全生命周期故障診斷結果分析 在考慮不同故障零部件(內圈,外圈與滾動體)的基礎上,進一步考慮了不同退化階段的故障診斷.為了更有效地說明GA-OIHF Elman神經網絡模型在滾動軸承多故障診斷上的有效性,分析了GA-OIHF Elman模型在不同零部件與不同退化階段上的診斷效果,具體結果如表3所示.

表3 基于GA-OIHF Elman神經網絡模型的全生命周期故障診斷MSE
由表3可知,GA-OIHF Elman神經網絡模型對于全生命周期故障診斷精度較為平衡且普遍較高,有效降低了中度退化與外圈故障的診斷誤差.
為了深入分析GA-OIHF Elman神經網絡對于滾動軸承全生命周期故障診斷的誤差來源,對GA-OIHF Elman神經網絡模型在3種部件不同退化階段的診斷誤差進行計算,具體結果如表4所示.

表4 GA-OIHF Elman神經網絡模型在3種部件的不同退化階段診斷MSE
表4細致地展示了GA-OIHF Elman神經網絡模型在不同故障部件上不同退化階段的故障診斷結果.GA-OIHF Elman神經網絡模型對于中度退化的診斷誤差主要來自于外圈故障,同時對于滾動體的輕度退化、中度退化與外圈的中度退化診斷誤差相對較大.
針對滾動軸承全生命周期故障信息的強混淆性與振動信號的高背景噪聲,本文提出一種基于EEMD與GA-OIHF Elman算法的研究框架.通過EEMD對振動信號實現了有效降噪與故障特征的提取.然后,在Elman神經網絡的基礎上,設計同時增加輸出層對隱含層與輸入層的反饋機制,得到OIHF Elman神經網絡,進一步提高了網絡對于時序軸承振動數據的處理能力.結合進化算法解決了神經網絡容易陷入局部最優解的問題,并通過結果對比得到了一種新的GA-OIHF Elman算法模型.經算例分析,GA-OIHF Elman算法模型可以有效地對滾動軸承進行全生命周期的精確故障診斷,同時保證了診斷模型對于不同故障(不同故障部件與不同故障時期)的診斷穩定性.未來將進一步考慮與集成學習等深度學習方法結合,以期在滾動軸承全生命周期故障診斷上提供更為準確與穩定的研究方法.