劉 韜,陳 進,董廣明
(1.昆明理工大學 機電工程學院,昆明 650500;2.上海交通大學 機械系統與振動國家重點實驗室,上海 200240)
軸承作為旋轉設備的關鍵部件,其故障是造成旋轉機械故障的主要原因之一。因此,對軸承振動信號的狀態監測與故障診斷一直是設備維護的重要研究領域[1]。當軸承故障發生時,首先需要從監測信號提取特征;然后對特征進行識別,判斷故障類型[2]。
各種特征提取方法從不同角度描述了軸承狀態的變化,通常總希望獲取盡可能多的特征參數,但是特征維數的增加也會降低故障識別模型的效率。為了降低特征間的相關性,提高計算效率,很多特征約減方法諸如 PCA[3]、LPP[4]等已被引入軸承的故障診斷。但這些約減算法都屬于線性映射算法,而軸承的振動信號具有非線性[5],因此本文采用核主成分分析(Kernel Principal Component Analysis,KPCA)對提取的多維特征進行約減,在盡可能保留特征信息的基礎上,降低特征樣本的維數。隱馬爾可夫模型(Hidden Markov Model,HMM)由于具有的雙隨機特性,因此被廣泛用于軸承和齒輪等設備的故障診斷[6-7]。Brain等提出的耦合隱馬爾可夫模型(Coupled Hidden Markov model,CHMM)[8]是對HMM的擴展,它描述了兩個或多個相互關聯的隨機過程統計特性。本文在KPCA特征約減的基礎上,利用CHMM對多通道數據的信息融合能力,研究了多鏈的CHMM在軸承故障診斷中的應用。最后通過實驗驗證了提出方法的可行性與有效性。
假設原始數據x共有l個樣本,可以定義非線性映射 ,:xi→(xi),i=1,…l,將數據從原始空間 Rn映射到高維空間F。然后對高維空間中的數據φ(x)進行主成分分析,假設(x)均值為零,即=0,則(x)的協方差矩陣可表示為:

根據主成分分析原理,對矩陣C求解特征值和特征向量,可以得到下式:

式中,λ為C的特征值,V為C的特征向量。
將F空間中的每個樣本與式(2)做內積,可以得到:

因為特征向量可以由數據集線性表示,所以有:

因此,通過求解(7)能得到K的特征值和對應的特征向量,然后就可以根據式(4)求得C的特征向量V,從而得到映射空間F的主元方向。
將K對角化,特征值為λ1≥λ2≥…≥λl,并將對應的特征向量[α1,α2,…αl] 進行歸一化,定義 p為主分量的數量。則有:

KPCA在輸入空間僅依賴于輸入樣本空間的距離和內積,因此特征值及其約減只依賴于核函數及參數的選擇。常用的核函數包括多項式核函數、多層感知器核函數和高斯徑向基核函數等。由于支持向量對于不同的方法具有不敏感性[9],即選用不同的核函數分類結果互相接近。因此,為簡化計算,本文選用高斯徑向基核函數(RBF):

式中σ是寬度參數。在使用RBF進行KPCA分析時,較小的σ會引起過渡擬合,降低分類的泛化性能;而較大的σ會把核簡化為一個常數函數,導致核函數變成平凡分類器。因此,本文引入了基于類內類間距離的核函數優選方法[10],即尋找一個σ使得KPCA分類后的各個特征類的類內距離最小并且特征類間的距離最大[11]:

式中,SB是特征類的類間距離,SW各個特征類的類內距離。
HMM是一個雙重隨機過程,即狀態間的轉移和各狀態下的觀測值都是隨機的。假定狀態序列和序列分別S和O,Rabiner[12]將一個HMM可以定義為:

其中,π=P(q1=Si),1≤i≤N是初始狀態概率向量,q1是t=1時刻,狀態為Si的概率。A={aij]是狀態轉移概率矩陣,定義了t時刻狀態為Si轉移到t+1時刻狀態為Sj的概率。B={bj(k)]是觀測值概率矩陣,定義了t時刻,狀態為Sj時觀測值是vk的概率。
CHMM可以被認為是多個HMM通過在它們的狀態序列間引入條件概率而得到的一種多鏈模型。圖1描述了一個的雙鏈的CHMM。

圖1 雙鏈的CHMMFig.1 A CHMM with two chains
CHMM同樣可以被記為λ=(π,A,B),但鏈c在t時刻的狀態不但依賴于同鏈t-1時刻的狀態,而且也與耦合鏈t-1時刻的狀態有關,即狀態轉移概率是P(|qt-1)。但是鏈c的觀測值僅與該鏈同一時刻的狀態有關,因此有P(|qt-1)。如果CHMM的觀測值序列和隱藏狀態序列分別是{,,…,]和{,q,…,],則式(15)中的各個參數可以定義為:


其中,c是鏈的數目,qt是時刻t時的狀態。以雙鏈CHMM 為例,c∈[1,2],qt={,]。由于振動信號是連續的,通常使用高斯混合模型來擬合每條鏈在各個狀態下的觀測值概率密度函數:

式中是鏈c在狀態的高斯元個數。和分別是第m個高斯元在狀態的混合系數、均值向量和協方差矩陣。
基于KPCA特征約減和CHMM的軸承故障診斷過程如圖2所示,具體步驟如下:
(1)對各個通道的訓練和測試數據分別提取的多維特征。
(2)計算高斯核主元的最優參數并利用KPCA對訓練和測試數據的特征維數進行約減,生成新的核主成分訓練和測試樣本。
(3)對訓練數據不同狀態下的樣本分別訓練CHMM并保存到模型庫中。本文利用軸承在正常(NC)、內圈故障(IRF)、外圈故障(ORF)和滾動體故障(RBF)下的數據分別訓練單個CHMM并組成模型庫,即:λNC、λIRF、λORF和 λRBF。
(4)將測試樣本送入CHMM模型庫,分別計算樣本在不同模型下的概率P(O|λi),其中概率最大者就是測試樣本的狀態,即

其中L=4,表示軸承有四種狀態。

圖2 基于KPCA和CHMM軸承故障診斷流程圖Fig.2 Scheme of bearing fault diagnosis using KPCA and CHMM
為驗證KPCA和CHMM在軸承故障診斷中的效果,本文利用圖3所示的ZST-1軸承試驗臺分別采集了不同狀態下的軸承振動信號。

試驗軸承安裝在轉軸上,內圈隨轉軸轉動,外圈被裝夾裝置固定,軸承在水平和垂直方向的振動信號分別被兩個Kistler8791A250加速度傳感器獲取,然后通過NI 9234數據采集卡同步采集這兩個通道的振動信號,采集程序使用NI LabVIEW編寫。兩個通道數據的采樣頻率都是25.6 kHz。實驗軸承的型號是GB203深溝球軸承,具體參數如表1所示。試驗模擬了軸承在正常狀態和三種局部點蝕故障:內圈故障、外圈故障和滾動體故障的運行狀況。其中,三種故障利用電火花在相應的表面上分別加工得到。試驗一共采集了120組數據,每種狀態各30組,每一組數據的時長是0.8 s。以通道一的一組數據為例,各種狀態下軸承的時域波形如圖4所示。

表1 GB203單列深溝球軸承的主要參數和工作條件Tab.1 Parameters and operating conditions of bearing GB203

圖4 軸承四種狀態下的時域波形Fig.4 Time wave of bearing in four status
為了識別軸承故障,本文提取了11個時域和頻域的特征并進行特征約減,包括:有效值、峰峰值、零峰值、歪度指標、峭度指標、峰值指標、裕度指標、脈沖指標、波形指標、譜總值和幅值譜熵。
以通道一的數據為例,將采集到的120組數據分為訓練和測試數據。各狀態下隨機選擇40%的數據作為該狀態的訓練數據,其余60%作為測試數據。對各組數據提取11個特征,可以得到訓練特征矩陣和測試特征矩陣。然后利用KPCA對訓練特征和測試特征進行約減,核函數寬度參數σ的選擇如式(14)所述,以0.1為步長,對 σ∈[0.1,10]內的100 點進行優化計算,選取最優的=1.6。利用KPCA對訓練特征和測試特征進行約減,為保證約減后的特征主元貢獻率超過90%,保留了了前3階主元進行分析。圖5(a)和(b)分是訓練特征和測試特征約減后的前3個主元的分布。可以看到,約減后的特征能夠有效的辨識軸承4種不同狀態下的樣本,可以用于軸承故障的診斷。

圖5 KPCA特征約減結果Fig.5 The KPCA analysis of bearing data
利用KPCA約減后的訓練特征分別訓練4種狀態下的CHMM模型,然后對測試特征進行診斷。訓練和測試特征進行KPCA約減后的結果分別記為選取CHMM的參數如下:耦合鏈數目c=2,各鏈的狀態數N=2,各狀態下高斯元數目M=2。為了比較,本文也對利用PCA方法約減后的特征利用單鏈HMM模型進行診斷,其中 HMM的 N=2,M=2。HMM和CHMM的計算結果用對數似然率(Log-Likelihood)表示。不同狀態的測試樣本診斷的準確率如表2所示。為避免單次診斷可能導致的結果過于樂觀或悲觀,本文采用了5折交叉驗證(Five-fold cross-validation)來估計診斷的準確率。每次隨機選擇各狀態40%的樣本訓練模型,剩余60%的樣本則作為測試樣本計算診斷準確率,一共運行5次,取5次計算平均值作為最終診斷結果。任一狀態的樣本單次診斷的準確率可用式(21)進行計算:

其中一次診斷的效果如圖6所示,圖中a-d分別表示測試樣本原本的狀態分別是 NC,IRF,ORF和RBF。由圖6(a)中可知,NC的測試樣本(編號1-18)除編號3外,其余樣本都是在模型λNC下得到了最大對數似然率輸出,因此判斷這些樣本為正常狀態,而編號3的樣本則出現了誤分。同理,IRF和ORF狀態的樣本全都能被正確診斷,RBF的樣本則出現了兩次誤分(編號63和67)。圖6(b)是利用通道一的KPCA特征和HMM診斷的結果,除了NC的測試樣本出現了一次誤分(編號3),其余樣本都能被正確診斷。圖6(c)是利用兩個通道的KPCA約減特征和CHMM的診斷結果,其中通道一和通道二優化后的寬度參數分別取=1.6 和=1.2。

圖6 不同特征和模型的診斷結果Fig.6 Diagnosis results using different feature and models

表2 診斷結果比較Tab.2 Comparison of diagnosis results
表2給出了各種方法對軸承4種狀態樣本的診斷準確率。可以看到,KPCA的對特征約減的效果好于PCA,通過優化KPCA的寬度參數,可以獲得比較理想的約減特征。由于軸承振動信號的非平穩性[13],利用單通道數據和HMM進行分類時,KPCA特征分類的準確率除RBF樣本略低于PCA外,對其余三種狀態樣本的診斷準確率都高于PCA特征,對全部樣本診斷的平均診斷率也從94.2%提高到了96.9%。這也與KPCA特征約減后聚類效果優于PCA一致。同樣使用KPCA特征進行訓練和測試,CHMM診斷的準確率明顯高于單通道的HMM(從96.9%提高到了98.9%),這是由于雙通道數據包含更豐富的信息,而CHMM能更準確的描述多通道數據間的統計特性。診斷準確率的大幅提高也證明了利用CHMM進行軸承故障診斷的有效性。
由于KPCA可進行隱式的空間映射,省略了空間映射計算的復雜性,同時可進行非線性的復雜映射,解決了傳統PCA只能線性映射,無法反應數據的非線性關系的缺陷。而CHMM的多鏈結構使得模型能有效的融合多通道數據信息,從而獲得比單通道HMM獲取更加準確和可靠的診斷結果。
本文提出一種基于KPCA和CHMM的軸承故障診斷方法,KPCA能有效的降低特征維度,增強特征的可分能力,而CHMM則充分利用軸承多通道數據的豐富信息。實驗結果表明,所提出的方法比傳統的PCA和HMM能更加有效的診斷軸承的故障。
[1]Lou X S,Loparo K A.Bearing fault diagnosis based on wavelet transform and fuzzy inference[J].Mechanical Systems and Signal Processing,2004,18(5):1077-1095.
[2]Jiang QS,Jia M D,Hu JZ,et al.Machinery fault diagnosis using supervised manifold learning[J].Mechanical Systems and Signal Processing,2009,23(7):2301-2311.
[3]Sun WX,Chen J,Li JQ.Decision tree and PCA-based fault diagnosis of rotating machinery[J].Mechanical Systems and Signal Processing,2007,21(3):1300-1317.
[4]Yu J B.Bearing performance degradation assessment using locality preserving projections and Gaussian mixture models[J].Mechanical Systems and Signal Processing,2011,25(7):2573-2588.
[5]Janjarasjitt S,Ocak H,Loparo K A.Bearing condition diagnosis and prognosis using applied nonlinear dynamical analysis of machine vibration signal[J].Journal of Sound and Vibration,2008,317(1-2):112-126.
[6]張銳戈,譚永紅.基于最優Morlet小波和隱馬爾可夫模型的軸承故障診斷[J].振動與沖擊,2012,31(12):5-8.ZHANG Rui-ge,TAN Yong-hong.Fault diagnosis of rolling element bearings based on optimal morlet wavelet and hidden markov model[J].Journal of Vibration and Shock,2012,31(12):5-8.
[7]滕紅智,趙建民,賈希勝,等.基于CHMM的齒輪箱狀態識別研究[J].振動與沖擊,2012,31(5):92-96.TENG Hong-zhi, ZHAO Jian-min, JIA Xi-sheng,et al.Gearbox state recognotion based on continuous hidden markov model[J].Journal of Vibration and Shock,2012,31(5):92-96.
[8]Brand M,Oliver N,Pentland A.Coupled hidden Markov models for complex action recognition[C]//IEEE Computer Society Conference on Computer Vision and Pattern Recognition,San Juan,PR,USA,1997,994-999.
[9] Bernhard Schlkopf, Alexander Smola, Müller K R.Nonlinear component analysis as a kernel Eigen value problem[J].Neural Computation,1998:1299-1319.
[10]朱義.基于CHMM的設備性能退化評估方法研究[D].上海:上海交通大學,2008.
[11] Yang J,Frangi A F,Yang J Y,et al.KPCA plus LDA:a complete kernel Fisher discriminant framework for feature extraction and recognition[J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,2005,27(2):230-244.
[12] Rabiner L R.A tutorial on hidden Markov models and selected applications in speech recognition[J].Proceedings of the IEEE,1989,77(2):257-286.
[13] Antoni J.Cyclic spectral analysis of rolling-element bearing signals:Facts and fictions[J].Journal of Sound and Vibration,2007,304(3-5):497-529.