郝騰飛,陳 果
(南京航空航天大學 民航學院,南京 210016)
核方法是模式識別領域的一場革命,其基本思想是首先將原始樣本通過核函數隱含地映射到一個高維特征空間中,然后在該空間中執行相應的線性算法。由于核函數隱含地實現了一個非線性映射,同時又避開了維數災難,因此,核方法可高效地解決非線性模式識別問題[1]。機械故障診斷本質上是一個模式識別問題。目前,許多核方法已廣泛應用于機械故障診斷。文獻[2]與文獻[3]分別對支持向量機(support vector machine,SVM)在機械故障診斷中的應用進行了很好的綜述。文獻[4]研究了核主成分分析(kernel principal component analysis,KPCA)在齒輪故障診斷中的應用。文獻[5]將粗糙集理論的屬性約簡與KPCA結合,提出了一種基于粗糙KPCA的機械故障特征提取方法并將其應用于滾動軸承故障特征提取。文獻[6]提出了一種利用KPCA對故障信號的小波尺度譜圖像進行特征提取的方法,并將其應用于轉子故障診斷。文獻[7]研究了核判別分析(kernel discriminant analysis,KDA)在風機與齒輪故障診斷中的應用。
以上研究充分展示了核方法在機械故障診斷中的明顯優勢。但應用上述各種核方法到機械故障診斷時均存在一個共同的問題,即核參數的選擇問題。核參數對各種核方法的性能有很大影響,若核參數選擇恰當,則核方法可獲得比相應的線性方法更好的性能,否則,甚至可能不及對應的線性方法,因此,在應用核方法時,核參數的選擇至關重要。目前,核參數一般通過交叉驗證的方法選取,但該方法計算量較大且只能在給定的一組參數中選擇一個最優參數,因此不一定能找到全局最優的參數。
許多研究[8-10]表明KDA與SVM具有類似的分類性能,但與SVM相比,KDA在機械故障診斷中的應用研究相對較少。本文研究了KDA在機械故障診斷中的應用。針對KDA中核參數的選擇問題,本文采用You等[11]提出的同方差性準則來選擇核參數,由于使用該準則可以得到最優的核參數,因此將使用該準則來優化核參數的KDA稱為貝葉斯最優KDA。最后建立了一種基于貝葉斯最優KDA的故障診斷模型,并以滾動軸承故障診斷為例研究了該方法在機械故障診斷中的應用。
線性判別分析(linear discriminant analysis,LDA)是一種經典的監督特征提取及分類方法,其基本思想是尋找一組投影方向,將原始樣本向該組方向上投影后可使不同類別的樣本盡量遠離,同類樣本盡量靠近。如果不同類別樣本的分布滿足同方差性(即具有相同的協方差矩陣),則用LDA可求得一個最佳子空間,不同類別的樣本向該子空間投影后具有最佳判別性。但實際中不同類別的樣本一般很難滿足同方差性,為解決該問題,Baudat等[10]與 Mika等[12]分別獨立地將核技巧引入LDA,提出了KDA。KDA的基本思想是先用核技巧將原始樣本隱含地映射到一個高維特征空間;然后在該特征空間中執行LDA。根據核方法的原理,核技巧隱含地實現了一個非線性映射,從而利用核技巧可使不同類別的樣本在高維特征空間中滿足同方差性,因此KDA可有效地解決LDA中要求不同類別樣本分布滿足同方差性的問題。以下具體介紹KDA算法的基本原理。
設有x1,x2,…,xm∈Rnm 個樣本,分別屬于 c個類別,φ為由核技巧誘導的非線性映射,則KDA的目標函數為:



最優投影向量w可通過求解下列廣義特征值問題獲得:

KDA雖在理論上解決了LDA中類分布的同方差性的假定問題,但實際應用KDA時,由于不同的核參數對應不同的非線性映射,只有選擇一個恰當的核參數,才能使不同類別的樣本在高維特征空間中滿足同方差性,因此應用KDA的關鍵是選擇一個恰當的核參數。目前,核參數一般通過交叉驗證的方法進行選取,但該方法計算量較大且只能在給定的一組參數中選擇一個最優參數,因此不一定能找到全局最優參數。針對KDA中的核參數選擇問題,You等[11]提出了一個同方差性準則Q1:


用上述同方差性準則雖可保證各類樣本在特征空間中滿足同方差性,但將KDA應用于分類問題時,不僅需要各類樣本滿足同方差性,而且需要各類樣本盡量遠離,為此You等又引入另一個準則Q2測量各類樣本的可分性:


圖1 應用同方差性準則的四個例子Fig.1 Four examples of the use of the homoscedastic criterion

圖2 同方差性準則值隨兩個分布相似性變化關系Fig.2 The relationship between the value of homoscedastic criterion and the similar of two distributions
該準則實際上是特征空間中類間散度矩陣的跡,顯然可以用來測量各類樣本的可分性。根據以上分析,在應用KDA時,最優核參數應為Q1與Q2同時取最大值時對應的核參數,因此最終準則應為上述兩個準則的乘積[11],即:

由于測量各類樣本可分性的準則比較明顯,因此將最終準則仍稱為同方差性準則。
在應用KDA時,可用梯度下降法優化上述準則找到最優核參數,該核參數對應的非線性映射可將原始樣本映射到一個高維特征空間中,在該空間中不同類別的樣本具有相同的協方差矩陣并且相互之間盡量遠離。在該空間中應用LDA可求得一個最優的子空間,各類樣本向該子空間投影后可獲得最佳的判別性。因此,將用上述準則尋找核參數的KDA稱為貝葉斯最優KDA。
基于貝葉斯最優核判別分析的機械故障診斷流程如圖3所示。
具體診斷方法如下:
(1)用相關傳感器采集反映機械設備運行狀態的振動信號;

圖3 基于貝葉斯最優核判別分析的機械故障診斷流程Fig.3 Flow chart of machinery fault diagnosis based on Bayes optimal kernel discriminant analysis
(2)用各種信號分析技術(如時域分析技術、頻域分析技術以及時頻域分析技術等)構造原始特征集;
(3)根據(1)和(2)產生一批訓練樣本的原始特征集,基于該組樣本,用梯度下降法優化同方差性準則,確定最優核參數;
(4)基于訓練樣本的原始特征集,采用最優核參數,用KDA求解一組最優投影向量,該組投影向量張成一個最優子空間;
(5)對于測試樣本,首先用與訓練樣本相同的信號分析技術進行處理,形成測試樣本的原始特征集,然后將訓練樣本與測試樣本的原始特征集分別投影到上述最優子空間;
(6)在最優子空間內用最近鄰分類器進行故障分類。
滾動軸承在旋轉機械中應用極為廣泛,其運行狀態往往直接影響到整臺機器的精度、可靠性及壽命。由于滾動軸承的壽命離散性很大,無法進行定時維修,因此,對滾動軸承實施狀態監測與故障診斷具有重要意義[13]。本文以滾動軸承故障診斷為例,研究了貝葉斯最優核判別分析在機械故障診斷中的應用。實驗數據采用美國Case Western Reserve University電氣工程實驗室的滾動軸承實驗臺數據[14]。在該實驗臺中,實驗軸承支撐電機轉軸,在其內圈、外圈及滾動體上分別用電火花技術加工單點損傷,以模擬內圈故障、外圈故障與滾動體故障。在軸承座上方設置加速度傳感器測試軸承振動信號,采樣頻率為12 kHz。選取正常樣本、內圈故障樣本、外圈故障樣本及滾動體故障樣本各200個。每個樣本的數據點為4 096個。將每一種狀態的樣本隨機選取一半用于訓練,一半用于測試,即訓練樣本和測試樣本均為400個。
用兩種方法構造原始特征集。第一種首先計算原始振動信號的均值、有效值、峰值、波形指數、波峰指數、沖擊指數、裕度指數、歪度指數及峭度指數,然后由這9個時域特征組成原始特征集。第二種用經驗模式分解[15]構造原始特征集,具體方法為首先使用經驗模式分解,將原始振動信號分解為一系列本征模函數分量之和,由于滾動軸承的故障信息主要包含在高頻段且分解得到的本征模函數分量依頻率從高到低排列,據大量實驗分析、比較,發現前4個本征模函數分量一般包含了滾動軸承故障的特征信息,因此選取前4個本征模函數分量并求其相應的包絡譜,然后從各包絡譜中提取旋轉頻率、內圈故障特征頻率、外圈故障特征頻率及滾動體故障特征頻率的包絡譜值,其中每個包絡譜值均取4個本征模函數分量包絡譜中的最大值,最后用本征模函數分量的這4個包絡譜值形成原始特征集。
用KDA可獲得的子空間維數最高為C-1,其中C為樣本的類別數。在本文實驗中,滾動軸承樣本包括正常、內圈故障、外圈故障及滾動體故障4種類型,因此子空間的維數最高為3。為檢驗本文方法的性能,同時使用KPCA,LDA與SVM進行故障診斷。其中基于KPCA和LDA的故障診斷方法與KDA類似,即首先使用這兩種方法將原始特征集投影到一個三維子空間中,然后在相應的子空間內使用最近鄰方法進行故障分類。實驗中,所有核方法的核函數均選用高斯核函數,KDA的核參數通過優化同方差性準則獲得,KPCA的核參數,SVM的核參數及正則化參數均用十折交叉驗證方法選取。
根據上述實驗方法,對于KPCA,LDA與KDA首先用訓練樣本的原始特征集求解各自的最優子空間,然后將訓練樣本和測試樣本的原始特征集分別投影到相應的子空間,其中測試樣本的投影結果如圖4、圖5所示。圖4為時域特征的投影結果,圖5為包絡譜特征的投影結果。從兩圖中可以看出,對時域特征和包絡譜特征,KPCA和LDA的投影結果中均有一部分樣本發生了重疊,而在KDA的投影結果中四種狀態樣本相互分離,可分性均非常好。對上述三種方法進一步基于投影后的樣本用最近鄰方法進行故障分類,對SVM則直接基于原始特征集進行故障分類,分類結果如表1、表2所示。表1為時域特征的診斷結果,表2為包絡譜特征的診斷結果。由兩表可以看出,對時域特征和包絡譜特征,KDA的診斷結果均優于KPCA和LDA的診斷結果,與SVM的診斷結果相當,且對各種狀態樣本的分類正確率均達到了100%。實驗中,KDA作為一種監督學習方法,在訓練中利用了類標號信息,因此故障診斷的性能明顯優于無監督的學習方法KPCA;同時由于KDA使用了核技巧,因此其故障診斷的性能同樣優于線性方法LDA;與SVM相比,KDA獲得了同樣的故障診斷性能,但是通過引入同方差性準則,KDA實現了核參數的自動選取。
為進一步說明同方差性準則在優化KDA核參數中的有效性,圖6、圖7給出了KDA用于時域特征時的參數優化過程。圖6為同方差性準則值隨迭代次數的變化過程:隨著迭代次數的增加,同方差性準則的值逐漸增大,最終穩定于一個最大值;圖7為分類識別率隨迭代次數的變化過程:隨著迭代次數的增加,分類識別率逐漸增加,最終達到100%。綜合圖6、圖7可以看出,分類識別率隨同方差性準則值的增大而增加,在同方差性準則值取最大時,分類識別率達到最高,表明同方差性準則可有效地用于KDA中的核參數優化。

圖4 時域特征的投影結果Fig.4 Projective results of the time domain features

圖5 包絡譜特征的投影結果Fig.5 Projective results of the envelope spectrum features

表1 基于時域特征的診斷結果Tab.1 Diagnosis results based on the time domain features

表2 基于包絡譜特征的診斷結果Tab.2 Diagnosis results based on the envelope spectrum features

圖6 同方差性準則的值隨迭代次數的變化過程Fig.6 The change process of the value of homoscedastic criterion with the number of iteration

圖7 識別率隨迭代次數的變化過程Fig.7 The change process of the recognition rate with the number of iteration
針對應用KDA到機械故障診斷時核參數選取困難的問題,本文提出了一種基于貝葉斯最優KDA的機械故障診斷方法。該方法通過優化同方差性準則可尋找到最優核參數,因此可有效地解決KDA中核參數的選取問題。將該方法應用于滾動軸承故障診斷,實驗結果表明,該方法的故障診斷性能明顯優于KPCA方法和LDA方法,與SVM方法的性能相當,而該方法可實現核參數的自動選取,因此可進一步提高故障診斷的自動化水平。
[1]Muller K R,Mika S,Ratsch G,et al.An introduction to kernel-based learning algorithms[J].IEEE Trans.Neural Networks,2001,12(2):181 -201.
[2]袁勝發,褚福磊.支持向量機及其在機械故障診斷中的應用[J].振動與沖擊,2007,26(11):29-35.
[3]Widodo A,Yang B S.Support vector machine in machine condition monitoring and fault diagnosis[J].Mechanical Systems and Signal Processing,2007,21(6):2560 -2574.
[4]李巍華,廖廣蘭,史鐵林.核函數主元分析及其在齒輪故障診斷中的應用[J].機械工程學報,2003,39(8):65 -70.
[5]胡金海,謝壽生,侯勝利,等.粗糙核主元分析方法及其在故障特征提取中的應用[J].振動與沖擊,2008,27(3):50-54.
[6]孫麗萍,陳 果,譚真臻.基于核主成分分析的小波尺度譜圖像特征提取[J].交通運輸工程學報,2009,9(5):62-66.
[7]李巍華,史鐵林,楊叔子.基于非線性判別分析的故障分類方法研究[J].振動工程學報,2005,18(2):133-138.
[8] Bo L,Wang L,Jiao L.Feature scaling for kernel fisher discriminant analysis using leave-one-out cross validation[J].Neural Computation,2006,18(4):961 -978.
[9]Cai D,He X,Han J.Speed up kernel discriminant analysis[J].The VLDB Journal,2011,20(1):21 -33.
[10] Baudat G,Anouar F.Generalized discriminant analysis using a kernel approach[J].Neural Computation,2000,12(10):2385-2404.
[11] You D,Hamsici O C,Martinez A M.Kernel optimization in discriminant analysis[J].IEEE Trans.Pattern Analysis and Machine Intelligence,2011,33(3):631 -638.
[12] Mika S,Ratsch G,Weston.Fisher discriminant analysis with kernels[C].Proceedings of the 1999 IEEE Signal Processing Society Workshop,1999:41-48.
[13]梅宏斌.滾動軸承振動監測與診斷[M].北京:機械工業出版社,1996.
[14] Bearing Data CenterWebsite. Case Western Reserve University[OL].http://www.eecs.cwru.edu/laboratory/bearing.
[15]褚福磊,彭志科,馮志鵬,等.機械故障診斷中的現代信號處理方法[M].北京:科學出版社,2009.