程軍圣,馬興偉,楊 宇
(湖南大學 汽車車身先進設計制造國家重點實驗室,長沙 410082)
機械故障診斷過程本質上是一個故障模式識別的過程[1],針對某一具體的機械故障診斷問題,選擇不同的模式識別方法,其分類精度和準確性可能會有較大的差異[2-3]。神經網絡結構和類型的選擇過分依賴于先驗知識或經驗,而這將會影響其分類精度[4]。支持向量機分類結果受到核函數及其參數的影響。此外,其搜索算法本質上是二進制的,對于多類分類問題則需要進行多次的二進分類[5]。
熵不但能表征信號的復雜性,而且能夠度量一個系統或一段信息的不確定性,因而有利于處理非線性問題。排列熵(Permutation Entropy,簡稱PE)算法是由Bandt等[13]最近提出的一種新的檢測時間序列隨機性和動力學突變的方法。Yan等[14]將其應用于旋轉機械振動信號的特征提取,并將排列熵與近似熵和Lempel-Ziv復雜度進行了對比,結果表明,排列熵算法能夠有效地檢測和放大振動信號的動態變化,表征滾動軸承在不同狀態下的工況特征。
本征時間尺度分解(Intrinsic Time-scale Decomposition,簡稱ITD)是由Frei等[15]提出的一種自適應時頻分析方法,該方法能將非平穩信號分解成為若干瞬時頻率具有物理意義的合理旋轉(Proper Rotation,簡稱PR)分量。與EMD相比,ITD在端點效應和計算速度上都有明顯優勢[16],且可以避免EMD方法中的包絡誤差。
論文將排列熵和VPMCD方法相結合應用于滾動軸承故障診斷,利用ITD方法對原始信號進行分解得到若干固有旋轉分量,提取各個分量的排列熵并將其作為特征值,進一步采用VPMCD方法進行故障診斷。將VPMCD方法與BP(Back Propagation)神經網絡以及支持向量機(Support Vector Machine,簡稱SVM)進行了實驗對比分析,結果表明,VPMCD方法可以有效地應用于滾動軸承故障診斷。
在VPMCD方法中,為特征值Xi定義的變量預測模型VPMi為一個線形或非線性的回歸模型,可以選擇以下的模型之一:
① 線性模型(L):
高校圖書館的特色資源是高校資源的優勢所在,越來越凸顯其不可替代的核心作用,并儼然成為圖書館核心競爭力的重要指標。特色資源為教學科研以及專業人才培養提供了有力的資源保障。
(1)
② 線性交互模型(LI):
(2)
③ 二次交互模型(QI):
(3)
④ 二次模型(Q):
(4)
式中,r≤p-1為模型階數。以p個特征值問題為例,以上述四種模型中任意一個模型,采用特征值Xj(j≠i)對Xi進行預測,都可以得到:
Xi=f(Xj,b0,bj,bjj,bjk)+e
(5)
式(5)稱為特征值Xi的變量預測模型VPMi。其中,特征值Xi稱為被預測變量;Xj(j≠i)稱為預測變量;e為預測誤差;b0,bj,bjj,bjk為模型參數,他們可以通過訓練樣本數據對預測模型進行訓練得到,這其實是采用所有訓練樣本的特征值X=[X1,X2,…,Xp]對b0,bj,bjj,bjk等模型參數進行估計的問題。

在VPMCD方法中,采用同一類別下所有特征值的預測誤差平方和值最小為判別函數對測試樣本進行分類,因此該方法可以有效地應用于具有多種樣本的模式識別。
排列熵算法不考慮數據具體值,而是基于相鄰數據的對比對數據進行分析,因此計算簡潔、速度快,抗干擾能力強,特別適用于非線性數據,具有很好的魯棒性,對噪聲有很好的抑制作用[13]。
在排列熵的計算中,有三個參數值需要考慮和設定,即時間序列長度N,嵌入維數m和時延τ。Bandt等[13]建議,嵌入維數m的取值為3~7,因為如果m等于1或2,此時重構的向量中包含太少的狀態,算法失去意義和有效性,不能檢測時間序列的動力學突變。但是,如果m取值過大,也不合適,因為相空間的重構將會均勻化時間序列,此時不僅計算比較耗時,而且也無法反映序列的細微變化[17-18]。
時延τ對時間序列的計算影響較小,以長度為1 024的隨機信號為例,在不同τ下的排列熵值隨嵌入維數的變化關系如圖1所示,由圖1可以看出,時延τ對信號熵值的影響較小,因此,論文中均取τ=1。

圖1 隨機信號在不同時延下的排列熵
為研究數據長度N對排列熵值的影響,論文取時延τ=1,以長度分別為256,512,1 024,2 048的隨機信號為例,求得對應排列熵值,分別記為PE1,PE2,PE3,PE4,如圖2所示,它們在不同嵌入維數下差值如表1所示。
由圖2和表1可知,當m=5,τ=1時,數據長度為1 024與長度512,熵值相差0.017 8,而與長度2 048熵值相差0.006 4,因此,此時選數據長度為1 024較合適。一般,嵌入維數較小時,數據長度則要求越小。論文中,嵌入維數m=5,時延τ=1,數據長度N=1 024。

圖2 不同長度的隨機信號的排列熵

表1 不同長度的隨機信號排列熵在不同嵌入維數下的差值
對原始振動加速度信號進行ITD分解(具體算法見文獻[15]),提取各個PR分量的排列熵作為特征值并構建特征值向量,結合VPMCD分類器進行模式識別。具體步驟如下:
① 分別在滾動軸承正常狀態、外圈故障、內圈故障、滾動體故障狀態下,按照一定的采樣頻率f進行N次重采樣,共獲得4N個振動加速度信號作為訓練樣本。
② 對滾動軸承四種狀態下的每一個振動加速度信號進行ITD分解,得到若干個PR分量,選擇前m個含有故障信息的PR分量作為研究對象。
③ 對含有故障信息的前m個PR分量分別提取排列熵Xi(i=1,2,…,m),并構建特征值向量X=[X1,X2,…,Xm]。

⑤采集測試信號。按照步驟①、②、③構建測試樣本特征值向量X′,并將其作為VPMCD分類器的輸入,以VPMCD分類器的輸出來確定滾動軸承的工作狀態和故障類型。
機械設備在運行時,其關鍵零部件滾動軸承可能會出現內圈故障、外圈故障或滾動體故障。為驗證排列熵和VPMCD方法的有效性,采用美國凱斯西儲大學電氣工程實驗室的滾動軸承數據[19],選用的滾動軸承為6205-2RS JEM SKF型深溝球軸承,采樣頻率為12 kHz,電機負載為0 HP,轉速為1 797 r/min。故障點的直徑為0.177 8 mm,故障深度為0.279 4 mm。圖3為采集到的滾動軸承故障振動加速度信號:

圖3 滾動軸承滾動體故障狀態下的振動加速度信號
對圖3滾動軸承滾動體故障狀態下的振動加速度信號進行ITD分解,得到的各個PR分量如下圖4所示:

圖4 滾動軸承滾動體故障狀態下的振動信號的ITD分解結果
ITD是將信號分解為從高到低不同頻率段的單分量信號,滾動軸承故障振動信號的故障信息主要集中在高頻段。由圖4可知,滾動軸承的主要故障信息集中在前4個PR分量,故論文中選取了前4個PR分量提取排列熵并結合VPMCD方法進行故障診斷。
論文選取滾動軸承正常狀態下的振動信號200組數據,外圈故障、內圈故障、滾動體故障三類狀態下的振動信號各110組數據。在正常樣本數據中隨機抽取100組數據,其余三類故障樣本數據中各隨機抽取60組數據作為訓練樣本數據,將剩下的100組正常樣本數據和外圈故障、內圈故障、滾動體故障三類故障狀態下各50組數據作為測試樣本。
首先,對訓練樣本數據進行ITD分解,對每一組樣本數據分解后的前4個PR分量分別提取排列熵,形成排列熵特征值向量。將特征值向量輸入到VPMCD分類器中對其進行訓練。
其次,將正常狀態下剩余的100組測試樣本和其余三類狀態剩余的各50組數據按照上述同樣的方法提取排列熵特征值向量,輸入到已經訓練好的VPMCD分類器中進行模式識別。
VPMCD方法利用訓練樣本估計模型參數,建立變量預測模型VPMk(k=1,2,3,4時,分別對應為正常、滾動體故障、內圈故障、外圈故障樣本的預測模型),從而對測試樣本的故障類型分類。對滾動軸承四種狀態共250組測試樣本用訓練好的VPMCD分類器進行分類,識別率達100%。表2給出了四組測試樣本的診斷結果。
為研究VPMCD方法在估計模型參數時,樣本數量的選取問題,論文選取上述美國凱斯西儲大學滾動軸承正常狀態、外圈故障、內圈故障、滾動體故障四類狀態下的振動信號各110組數據。在正常樣本和其余三類故障樣本數據中各隨機抽取20、40、50、60、80組數據作為訓練樣本數據,將剩下的樣本數據作為測試樣本。表3給出了在不同訓練樣本數情況下VPMCD分類器的分類結果。

表2 基于排列熵與VPMCD的滾動軸承故障識別結果

表3 不同訓練樣本數下VPMCD分類器識別結果
由表3可知,當訓練樣本數超過60,VPMCD分類器分類精度可達100%。在模式識別中,樣本數量并不是與分類精度成正比的。而且訓練樣本數量增多,運算時間也會增加。因此,針對上述西儲大學滾動軸承數據,VPMCD分類器在估計模型參數時,樣本數量可根據表3進行選取。
為比較VPMCD方法和常用神經網絡和支持向量機的識別效果,論文同樣選取上述美國凱斯西儲大學滾動軸承正常狀態、外圈故障、內圈故障、滾動體故障四類狀態下的振動信號各110組數據。在正常樣本和其余三類故障樣本數據中各隨機抽取60、80組數據作為訓練樣本數據,分別對SVM、BP神經網絡和VPMCD進行訓練,將剩下的樣本數據作為測試樣本,并將三類分類器的識別結果進行對比分析,如表4所示。

表4 VPMCD、BP和SVM識別結果對比
由表4可知采用不同數量的訓練樣本對VPMCD、BP神經網絡和SVM分別進行訓練后,各分類器識別率均較高,說明排列熵算法能夠有效地檢測和放大振動信號的動態變化,表征滾動軸承在不同狀態下的工況特征。同時,VPMCD分類器的訓練、測試時間要比BP神經網絡和SVM短,說明VPMCD方法不僅避免了神經網絡的迭代學習而且避免了SVM的尋優過程以及SVM對于多類分類問題需要進行多次的二進分類問題,大大減少了運算量。在使用BP神經網絡時還發現,誤差指標如果過小還會出現過學習現象。另外,BP神經網絡和SVM需要進行嚴格的結構參數的優化選擇才能達到較高的識別率,而VPMCD分類器無需進行結構參數的優化選擇。由表4也可看出當訓練樣本較少時,VPMCD分類器仍然能達到較高的識別率。在實際工程應用中可用的故障特征信號是比較缺乏的,顯然VPMCD方法更適用于實際的滾動軸承故障診斷和狀態監測。
本文提出了一種基于排列熵和VPMCD的滾動軸承故障診斷方法。排列熵算法用來檢測時間序列的動力學突變,但由于機械系統的復雜性,振動信號表現不同尺度的動力學突變,基于此,本文提出用ITD方法將振動信號進行多尺度分解,提取排列熵特征值向量,然后進行VPMCD模式識別,根據VPMCD模式識別結果判斷滾動軸承的工作狀態。通過分析得到如下結論:
(1) 從原始數據中提取的特征值實際上反映了原始數據的本質特征,VPMCD方法依據特征值之間的相互內在關系建立預測模型,避免了神經網絡的迭代學習和支持向量機的尋優過程,能更有效地實現分類。
(2) VPMCD方法采用各類樣本數據對預測模型參數進行估計,從而得到不同類別的預測模型,然后,采用預測模型對測試樣本進行分類。實驗分析結果表明,VPMCD方法在訓練樣本數較少也能有效地對預測模型參數進行估計。
(3) 在訓練樣本數不同的情況下將VPMCD與BP、SVM相比,分析結果表明VPMCD能更有效地識別滾動軸承故障的特征信息。VPMCD方法避免了神經網絡結構和類型的選擇、支持向量機核函數及其參數的選擇依靠先驗知識或經驗問題,同時避免了支持向量機的二進分類問題,可以同時進行多類分類。
(4) 排列熵算法是一種新的檢測時間序列隨機性和動力學突變的方法,具有計算簡單、快速,抗噪能力強,適合在線監測等優點。將排列熵和VPMCD方法引入滾動軸承故障診斷中,結果表明了該方法可以有效地識別滾動軸承的工作狀態。
[1]溫熙森.模式識別與狀態監控[M].北京:科學出版社,2007.
[2]LEI Ya-guo,HE Zheng-jia,ZI Yan-yang,et al. New clustering algorithm-based fault diagnosis using compensation distance evaluation technique [J].Mechanical Systems and Signal Processing, 2008,22(2):419-435.
[3]Rafiee J, Tse P W,Harifi A,et al. A novel technique for selecting mother wavelet function using an intelligent fault diagnosis system [J].Expert System with Applications, 2009, 36(3):4862-4875.
[4]Wang C C,Kang Y,Shen P C,et al. Applications of fault diagnosis in rotating machinery by using time series analysis with neural network[J].Expert System With Application, 2010,37(2):1696-1702.
[5]FEI Sheng-wei,ZHANG Xiao-bin.Fault diagnosis of power transformer based on support vector machine with genetic algorithm[J]. Expert Systems with Application, 2009, 36(8):11352-11357.
[6]Raghuraj R,Lakshminarayanan S. Variable predictive models-A new multivariate classification approach for pattern recognition applications[J].Pattern Recognition, 2009, 42(1):7-16.
[7]Raghuraj R,Lakshminarayanan S.Variable predictive model based classification algorithm for effective separation of protein structural classes[J].Computational Biology and Chemistry, 2008,32(4):302-306.
[8]Raghuraj R,Lakshminarayanan S.VPMCD:Variable interaction modeling approach for class discrimination in biological system[J].FEBS Letter,2007,581(5):826-830.
[9]Wang X Y,Makis V,Yang M. A wavelet approach to fault diagnosis of a gearbox under varying load conditions[J].Journal of Sound and Vibration,2010,329(9):1570-1585.
[10]Kankar P K,Sharma S C,Harsha S P. Fault diagnosis of ball bearing using continuous wavelet transform[J]. Applied Soft Computing, 2011, 11(2):2300-2312.
[11]WU Fang-ji,QU Liang-sheng.Diagnosis of subharmonic faults of large rotating machinery based on EMD[J].Mechanical Systems and Signal Processing,2009,23(2):467-475.
[12]CHENG Jun-sheng,YANG Yu,YU De-jie.The envelope order spectrum based on generalized demodulation time-frequency analysis and its application to gear fault diagnosis[J]. Mechanical System and Signal Processing,2010,24(2):508-521.
[13]Bandt C, Pompe B. Permutation entropy: a natural complexity measure for time series[J]. Physical Review Letters, The American Physiological Society,2002,88(17):174102(1-4).
[14]Yan R Q,Liu Y B,Gao R X. Permutation entropy: A nonlinear statistical measure for status characterization of rotary machines[J]. Mech. Syst. Signal Process, 2012 (29): 474-484.
[15]Frei M G, Osorio I. Intrinsic time-scale decomposition: time-frequency-energy analysis and real-time filtering of non-stationary signals[J]. Proceedings of the Royal Society. A, 2007, 463: 321-342.
[16]安金坤,田斌,孫永軍,等.一種基于ITD算法的直擴信號檢測算法[J].電子與信息學報,2010,32(5):1178-1182.
AN Jin-kun,TIAN Bin,SUN Yong-jun,et al. An algorithm for direct sequence spread spectrum signal detection based on intrinsic time-scale decomposition[J]. Journal of Electronics & Information Technology, 2010,32(5):1178-1182.
[17]Yan R Q,Gao R X. Approximate entropy as a diagnostic tool for machine health monitoring[J]. Mechanical Systems and Signal Process, 2007,21 (2) 824-839.
[18]Cao Y,Tung W W, Gao J B, et al. Detecting dynamical changes in time series using the permutation entropy[J]. Phys. Rev, 2004 (E70) 046217.
[19]Case Western Reserve University Bearing Data Center. Bearing data center fault test data. [EB/OL].[2012-11-10]. http://www.eecs.case.edu/laboratory/bearing.