鄭近德,潘海洋,包家漢,劉慶運,丁克勤,歐淑彬
(1.液壓振動與控制教育部工程研究中心,安徽 馬鞍山243032;2.安徽工業大學 機械工程學院,安徽 馬鞍山243032;3.中國特種設備檢測研究院,北京100029)
軸承是工業領域最重要也是最脆弱、最容易發生故障的零部件。目前軸承健康監測與故障診斷的研究已經引起相當大的關注。能否準確有效地提取狀態特征信息是軸承監測和診斷的關鍵。由于軸承存在剛度、摩擦和載荷條件的瞬態變化,機械系統常常表現出非線性、非平穩行為,致使其振動信號復雜,表現出有非線性和非平穩特征[1]。常用的時域分析、頻域分析和時頻分析方法等在處理這類信號時難免存在一定的局限性。而非線性分析方法由于能夠準確有效地提取這類振動信號的非線性、非平穩的狀態特征信息而得到了廣泛關注。
在非線性動力學分析方法中,基于熵理論建立的時間序列復雜度測量方法,如信息熵[2]、近似熵[3]和樣本熵[4],都已被成功應用于機械故障診斷中[5–7]。然而,單一尺度的熵算法并不能有效測量時間序列的復雜性[8–9]。為了克服單一尺度的不足,Costa等提出了衡量不同粗粒化時間序列復雜性的多尺度熵算法(Multiscale Entropy,MSE)[8,10–11]。鄭 近 德 等[12]將MSE 應用于機械故障診斷中,結果表明,MSE 能夠有效地實現故障的識別。陳慧等[13]將MSE 與PNN結合成功應用于滾動軸承故障診斷中。然而,在MSE 算法中,隨著尺度因子的增加,粗粒時間序列會迅速變短而導致不精確的熵估計或引起未定義熵,而且熵值的誤差也將隨著粗粒化時間序列長度的迅速變短而增大。為了克服MSE方法的不足,文獻[14]提出了一種新的改進多尺度熵算法—精細復合多尺度熵(Refined composite multiscale entropy,RCMSE),RCMSE 能夠彌補MSE 的缺陷,且得到的熵值的一致性和穩定性更好。
由于提取的多尺度熵值特征維數較高,存在一定的信息冗余,藴藏故障狀態的特征信息不能被有效利用,影響故障識別效果。流形學習算法是基于拓撲流形概念而提出的降維方法,能夠實現維數約減和數據可視化,考慮將其應用于高維特征數據的可視化降維。由于現實中大多數高維數據具有非線性結構,線性降維方法不可避免地存在一定的局限性,而非線性流形學習自編碼降維方法能夠有效實現非線性高維數據的降維[15–17],文中考慮將其應用于滾動軸承故障特征的降維與可視化。為了實現故障智能診斷,需要選擇合適的分類器,支持向量機作為一種成熟的分類器,受懲罰因子和核參數影響較大,遺傳優化算法[18]能夠對SVM 的參數進行優化,自動搜索最佳參數組合,避免了依賴人為的設定和不必要的干擾[19]。在此基礎上,結合精細復合多尺度熵、自編碼降維技術和遺傳算法優化支持向量機多模式分類器,提出了一種新的滾動軸承故障智能診斷方法。最后,將提出的方法應用于試驗數據分析,結果表明,提出的方法不僅能夠有效地診斷出軸承不同故障,而且識別率較高。
對于時間序列X={xi,1≤i ≤N},第τ 個尺度粗粒化時間序列定義如下

在傳統MSE算法中,不同尺度因子τ下的MSE被定義為尺度因子τ下第一個粗粒化時間序列的樣本熵,即MSE(x,τ,m,r)=SampEn(y(τ)1,m,r)。但是,對于短時間序列的分析,MSE在較大時間尺度下往往會引起未定義樣本熵值。為此,引入了CMSE 來提高MSE算法的精度。
CMSE算法中,在尺度因子τ下計算所有粗粒化時間序列的樣本熵,CMSE值是由τ個樣本熵取平均而得到,即

RCMSE 算法解決了上述MSE 和CMSE 方法的不足,主要步驟如下:
(1)利用式(1)粗粒化程序獲得不同時間尺度的粗粒化時間序列;
(2)在尺度因子τ 下,計算全部τ 個粗粒化序列匹配向量對和的數目;

對上式進行簡化,得

根據式(4)可知,僅僅當全部nmk,τ和nm+1k,τ都為零時,RCMSE 才會有未定義熵值。因此,相較于CMSE算法,RCMSE算法大大降低了未定義熵的可能性,得到的熵值一致性和穩定性更好。
RCMSE 彌補了MSE 和C MSE 提取信號特征時熵估計不精確的缺點,得到的熵值具有更強的穩定性。文中考慮采用RCMSE 方法來提取各狀態振動信號的復雜性故障特征信息。同時,由于特征維數較多,高維數據掩蓋了有效特征信息,考慮采用Autoencoder 流形學習降維算法對高維特征向量矩陣進行降維,挖掘具有內在規律的低維流形特征。最后,為了實現智能診斷,采用訓練速度快、適合小樣本分類的支持向量機進行模式識別。同時針對支持向量機的分類結果通常會受到懲罰因子c和核函數參數g 的影響等問題,采用自適應概率遺傳優化算法(Genetic algorithm,GA)對SVM 中的參數c 和g進行優化,建立基于GA-SVM 的多類模式分類器,以對降維后的低維流形故障特征向量進行識別。
綜上,基于RCMSE、Autoencoder 降維算法和GA-SVM的滾動軸承故障診斷方法的步驟如下:
(1)假設滾動軸承故障和正常等狀態共有K類,每種狀態有Nk組振動信號(k=1,2,…K);
(2)計算每類Nk組振動信號樣本的RCMSE,每組樣本得到τmax個特征值,組成高維特征向量集RN×τmax,其中是最大尺度因子,一般取20;
(3)采用Autoencoder降維算法對高維特征向量矩陣進行降維,得到低維流形特征RN×I,I 是降維后的維數;
(4)每種狀態隨機取1/2Nk組組成訓練樣本,其余作為測試樣本,將訓練樣本輸入到基于GA-SVM多類模式分類器進行訓練;
(5)將測試樣本輸入到訓練好的GA-SVM 分類器,根據GA-SVM分類器輸出確定滾動軸承的工作狀態和故障類型。
為了驗證所提方法的有效性,將其應用于美國Case Western Reserve University 的滾動軸承試驗數據[20]。測試軸承為6205-2RS JEM深溝球軸承,使用電火花加工技術在軸承上布置單點故障。考慮轉速為1 730 r/min、負載3 HP條件下,正常軸承以及直徑大小為0.177 8 mm、深度為0.279 4 mm的外圈、內圈故障和滾動體故障的滾動軸承振動信號,采樣頻率為12 kHz,采集到具有局部單點內圈(Inner Race Fault,IRF)、外圈(Outer Race Fault,ORF)、滾動體故障(Ball Element Fault,BEF)和正常(Normal,NOR)4種狀態的振動信號,每種狀態取29組數據,每組數據長度為4 096個采樣點,4種狀態下軸承的振動信號時域波形如圖1所示。

圖1 4種狀態下軸承振動信號的時域波形
由于背景噪聲及干擾,從時域波形上很難區別這4 種狀態。將提出的方法應用于實驗數據分析,具體步驟與分析如下:
首先,計算滾動軸承每種狀態振動信號的RCMSE,每種狀態取29組樣本,每組樣本得到20個特征值,4 種狀態共得到116 組樣本,組成原始特征向量矩陣R112×20。
4 類狀態下的RCMSE 均值標準差曲線如圖2所示。

圖2 4類狀態下滾動軸承的RCMSE均值標準差圖
從圖2中可以看出,在大部分尺度上,正常軸承的振動信號熵值較大,且隨著尺度因子的增大變化平緩;而3 種具有故障的滾動軸承的振動信號的RCMSE曲線出現明顯的逐漸遞減趨勢。其次,采用Autoencoder 流形學習算法對高維特征空間進行特征降維,得到低維特征向量集,壓縮后的低維特征二維和三維流形如圖3(a)和圖3(b)所示。
從圖3 可以看出,降維后的二維和三維流形特征都能很明顯地將各狀態特征集分開。再次,對每種狀態各取15組樣本構成訓練樣本特征集R60×3,將訓練樣本集輸入到基于GA-SVM 多類模式分類器中進行訓練(一對一構建SVM 多模式分類器)。采用遺傳算法優化SVM 中懲罰參數c 和核函數參數g,將對訓練樣本特征集進行交叉驗證(Cross Validation,CV)意義下的識別率作為GA中的適應度函數值,設定CV參數為5,GA算法中的最大迭代次數為200,種群數量為20,代溝為0.9,交叉概率為0.7,變異概率為0.2。搜索到的最佳懲罰因子c 為0.233 46,核函數參數g 為15.730 1。用訓練好的GA-SVM多模式分類器對測試樣本特征集進行分類預測。根據GA-SVM 分類器的輸出值確定滾動軸承的工作狀態和故障類型:1-正常,2-外圈故障,3-內圈故障,4-滾動體故障。預測的輸出結果如圖4所示。

圖3 Autoencoder降維后二維流形和三維流形

圖4 基于本文方法的GA-SVM分類結果
從圖4 可以看出,GA-SVM 預測的所有測試樣本都得到了正確分類,識別率為100%。
為了說明RCMSE 方法在特征提取方面的優勢,再提取4類原始信號的MSE,如圖5所示。并將RCMSE和MSE的標準差進行對比分析,結果如圖6所示。從圖6中可以看出,在尺度因子較小時,特別地τ<11時,4種狀態的熵值很難區分,有交叉重疊現象,而只在較大尺度時4 類樣本的熵值才能明顯區分。對比圖5 的RCMSE 曲線可知,RCMSE 方法得到的4種狀態的熵值曲線在所有尺度上兩兩都能夠明顯區分開來,并沒有交叉重疊現象。不僅如此,從圖6 中各狀態的RCMSE 與MSE 標準差對比可以看出,各狀態下提取的RCMSE 標準差波動性較小,而MSE 標準差波動性較大,而且在大部分尺度上,正常和故障滾動軸承的RCMSE的標準差都小于MSE的標準差。

圖5 4類狀態的軸承振動信號的多尺度熵
為了驗證Autoencoder算法在降維方面的優勢,將其與常用的降維算法LDA(Linear Discriminant Analysis,LDA)[21]對 比,分 別 采 用Autoencoder 和LDA對各類狀態的MSE特征進行降維,降維后的二維和三維流形如圖7(a)、圖7(b)和圖8(a)、圖8(b)所示。
從圖7 中可以看出,根據Autoencoder 算法得到的二維和三維流形分布都能夠將4種狀態軸承明顯分開;而圖8 中根據LDA 降維后的3 類故障的二維和三維特征分布混淆在一起,難以分類識別。對比結果驗證了Autoencoder降維的優越性。
最后,為了說明SVM 參數優化的必要性,將采用LDA降維后的低維特征輸入到SVM中進行訓練與測試,c 為2,g 為1,預測分類結果如圖9(a)所示。從圖中可以看出,有18 個測試樣本被錯分,識別率為67.8571 %。而采用GA-SVM 進行分類預測,結果如圖9(b)所示,優化參數為c=1.661 5,g=6.582 3。得到的故障識別率為76.785 7%,相較于SVM 提高了8.928 6%。這進一步說明了采用遺傳算法優化SVM的必要性和優越性。
(1)介紹了一種新的衡量振動信號復雜性的算法——精細復合多尺度熵(RCMSE),其能夠克服多尺度熵在提取信號特征時產生不精確的熵估計的不足,仿真與試驗分析結果表明,與MSE 相比,RCMSE能夠更精確地提取振動信號故障特征信息,得到的熵值一致性和穩定性更好。

圖6 不同狀態軸承RCMSE與MSE標準差對比

圖7 Autoencoder降維后二維和三維特征分布

圖8 LDA降維后二維和三維特征分布

圖9 基于LDA降維特征的SVM和GA-SVM分類結果
(2)將Autoencoder降維技術應用于高維故障特征降維,得到具有拓撲流形結構的低維可視化特征,試驗分析結果表明,相較于LDA,Autoencoder 在降維方面更具有優勢。
(3)提出了一種新的基于RCMSE、Autoencoder降維和GA-SVM的滾動軸承故障診斷方法,仿真和試驗分析結果表明,與現有方法相比,所提方法在故障特征提取、高維數據可視化降維和模式識別精度方面具有明顯的優勢。