張曉濤,唐力偉,王 平,鄧士杰
(軍械工程學院 火炮工程系,石家莊 050003)
多尺度主元分析(MSPCA)是一種典型的多元統計過程監控方法[1],通過數據的分布信息進行統計建模和描述數據的主要特征。李宏坤等[2]將MSPCA應用于滾動軸承故障增強檢測中,使故障信號包絡譜中故障譜線得到明顯增強,尹剛等[3]將MSPCA用于發動機缸蓋振動信號特征增強中,使得發動機不同故障的識別率得到顯著提高。主元分析PCA方法適宜描述數據的全局分布方差,使數據在投影后空間沿坐標軸的分布方差最大,但投影過程中無法保證數據的局部非線性特征不變,對于含有非線性成分的數據MSPCA方法的效果有限,因此MSPCA需要在數據非線性特征保持方面做出相應的改進處理。
局部保持投影(LPP)是一種典型的流形學習局部特征非線性保持投影算法[4],由 He等[5]在拉普拉斯特征映射的基礎上提出,局部保持投影在數據處理過程中能夠保持數據樣本局部流形結構不變,最早應用于人臉識別領域。文獻[4]中論述LPP在投影過程最優保持了數據的局部鄰域關系,可以發現數據的非線性流形。文獻[6]中的局部保持PCA算法研究表明PCA融合局部保持投以可以實現整體方差最大以及局部鄰域結構不變,由此可知LPP具有較強的數據局部非線性特征保持能力,但卻在數據的全局分布特征把握上則效果不佳。文獻[7]中進行了PCA與LPP聯合的圖像重構研究,該研究方法首先對高維圖像數據進行PCA降維處理,然后再進行LPP降維處理,是PCA與LPP順序結合的應用。
實際應用中,LPP需要引入相應處理,提高其全局信息處理能力。本文提出一種多尺度正交PCA-LPP特征增強方法,兼顧PCA的全局方差增強,以及LPP的局部非線性特征保持能力,結合小波包分解實現單維故障信號的多維構造及特征投影增強,通過投影矩陣特征值累積率區分有用特征成分子空間以及干擾成分子空間,并正交化處理消除投影分量間的信息冗余,通過重構擬合有用特征成分子空間得到特征增強信號,齒輪箱故障聲發射實測信號處理結果表明,信號故障特征得到顯著增強,表現在故障信號包絡譜中譜線明顯增強以及多樣本的故障類型辨識率明顯提升兩個方面。
正交PCA-LPP流形學習算法是一種綜合PCA和LPP兩種方法特點的流形學習算法,能夠在投影過程中實現數據分布的整體分布方差最大以及局部非線性流形結構保持。設高維空間RD中存在數據集X=[x1,x2,…,xN],正交PCA-LPP流形學習算法的目標是尋找投影矩陣W,將數據集X轉換到低維投影空間Rd(d<D)中,d為有用特征成分子空間維度,通過Y=WTX實現有用信號成分與噪聲干擾成分的有效分離。正交PCA-LPP流形學習算法的原理分析均是在此假設數據集基礎上進行。
PCA尋找數據分布方差最大的坐標系,通過投影矩陣W實現數據集從原坐標系到新坐標系的變換,實現沿坐標軸方向的整體分布方差最大,其投影矩陣W的求取目標函數如式1所示[6]。

其中

PCA全局方差最大目標函數僅考慮數據的線性空間投影,通過在投影空間保留數據集的大部分方差信息,實現全局分布特征的增強,但PCA全局目標函數中沒有考慮樣本之間的局部幾何關系,投影后數據的局部非線性信息丟失嚴重,對內含非線性成分的數據PCA方法處理效果較差。
局部保持投影LPP是一種非線性局部流形保持投影算法,能夠使投影前后的數據局部近鄰結構相似,其投影矩陣W的求取目標函數如式(2)所示[8]。


其中:sij為權重系數,所有權重系數構成權重矩陣S,對角矩陣Dii=∑jsij,L為拉普拉斯矩陣,權重系數sij由自適應鄰域構造SG方法[9]進行構造,其具體計算原理如式(3)所示。

局部保持投影LPP在數據投影空間變換過程中,能夠盡可能的保持數據局部流形結構相似,使數據局部細節特征得到保留增強,但局部目標函數沒有考慮樣本的全局分布特征,有可能導致數據全局特征投影后發生扭曲失真。
結合PCA全局方差最大目標函數與LPP局部流形保持目標函數,基于最大邊緣準則[10]構造PCA-LPP整體目標函數,如式(4)所示,該目標函數同時考慮了PCA與LPP方法的特性,能夠實現投影后數據特征的全面增強。

其中限定條件WTXDXTW=I可消除隨機尺度因子的影響。
全局目標函數結合了PCA與LPP的投影目標函數,投影過程能夠盡可能實現數據內含特征的增強,為進一步減小投影后數據集分量間的信息冗余,在計算第k投影分量過程中引入正交約束,如下所示:

其中:wk為投影矩陣W的某一列向量。
正交PCA-LPP的投影矩陣W通過聯立求解式(4)和式(5)得到,應用拉格朗日乘子法[11]將上面兩式轉化為有約束最大值問題,則第k個投影分量約束函數如式(6)所示。

將上式的L(wk)對wk求導并置零后得到:

定義矩陣形式變量 Uk-1=[μ1,μ2,…,μk-1]T,Wk-1=[w1,w2,…,wk-1],將式(8)的聯立形式改為矩陣形式如下:

由式(9)可得Uk-1的計算表達式如下:

對式(7)左乘(XDXT)-1可以得到下式:

聯立式(10)和式(11)可得下式:

通過式(12)求解特征值對應特征向量即可求解W的第k個投影分量。
總結正交PCA-LPP流形學習算法的實現步驟如下:
(1)已知樣本X,根據式(1)計算構造全局方差最大目標函數Jg(W);
(2)根據式(3)計算相似權重矩陣S,并根據式(2)構造局部流形保持目標函數Jl(W);
(3)根據式(4)構造整體投影目標函數J(W),并根據式(6)構造最大值目標函數;
(4)正交投影矩陣 W=[w1,w2,…wk]的各個投影分量通過迭代方式求解:
① w1為矩陣(XDXT)-1(Cu+Cl-XLXT)最大特征值對應的特征向量;
② wk為式(12)最大特征值對應的特征向量;
(5)根據映射Y=WTX,得到投影空間轉換后的數據集。
多尺度正交PCA-LPP特征增強方法基于小波包實現原始故障信號的多尺度分解,小波包分解能夠提供比小波分解更加精細的頻帶劃分能力,利用各子頻帶小波包系數重構分量將單維故障信號組成多維重構信號。文獻[12]認為工業過程數據是多尺度分布的,且存在潛在緩變和微小故障信息,多尺度正交PCA-LPP流形學習算法是一種基于信號多尺度分布的非線性投影處理,通過在投影過程中區分有用信號成分子空間與噪聲干擾成分子空間,從而在低維有用信號子空間重構原始信號實現故障特征的分離增強。有用子空間的維度通過投影矩陣W各分量對應特征值的大小進行確定,矩陣W各分量對應的特征值向量為λ=[λ1,λ2,…,λk],有用信號子空間維數 d通過式(13)進行確定。

其中:η為投影分量特征值累積率,一般取0.95。根據確定出的投影空間維數d,可知有用信號子空間的投影矩陣為 W=[w1,w2,…wd],有用信號成分通過Y=WTX投影計算得到。
多尺度正交PCA-LPP特征增強方法流程如圖1所示。首先對原始數據y進行n層小波包分解,在各個子頻帶內重構小波包系數得到2n個多尺度分量Cn0,…,Cni,…,Cnk,其中 k=2n-1,i=0,…,k。將 2n個多尺度分量重構成的多維信號,經多尺度正交PCA-LPP特征增強方法處理,得到)k個有用信號子空間的低維投影正交分量,…,…。參照文獻[13]的處理方法,將)k個正交投影分量經多元多項式擬合重構得到一維信號,即為故障特征增強信號。由于個分量為正交投影分量,所有多項式擬合如式(14)所示。

其中:ωi為權值,權值滿足ωi>0且∑ωi=1。

圖1 多尺度正交PCA-LPP方法流程Fig.1 Flow chart of multiscale orthogonal PCA-LPP algorithm
多尺度正交PCA-LPP方法在數據投影中,兼顧了PCA與LPP的優點,具備PCA方法投影數據整體分布方差增大,以及LPP方法局部非線性流形結構保持的雙重特點,同時正交化處理使投影后各分量之間無冗余信息。處理后信號的特征增強表現在兩個方面,一是包絡譜中故障譜線增強,二是多樣本故障類型識別率提升。
采用齒輪箱故障聲發射實測數據對正交PCA-LPP方法的特征增強性能進行檢驗,實驗齒輪箱為二級減速器,一級減速比為1∶2,故障軸承設置為中間傳動軸單端軸承,型號6206,故障齒輪為中間傳動軸大齒輪。齒輪箱原理結構及傳感器安裝如圖2所示。

圖2 齒輪箱結構及傳感器布置Fig.2 Gearbox structure and sensor arrangement
檢測中設置軸承外圈故障和齒根裂紋故障,采集傳感器為聲華R15聲發射傳感器,全波形采集儀采樣頻率1 MHz,兩種故障形式的輸入軸轉速均為1490 r/min,由軸承國標參數以及故障頻率計算公式可知外圈故障頻率fouter=44.46 Hz,齒輪故障頻率fgear=12.42 Hz。兩種故障的原始采樣信號及其包絡譜如圖3和圖4所示。
從圖3和圖4中可以看出,外圈及齒輪故障原始信號的包絡譜中干擾成分較多,故障頻率處譜線非常不明顯,無法識別故障頻率fouter和fgear。對原信號采用db4小波,分解層數為3層,取η=0.95,多尺度正交PCA-LPP處理后得到的信號及其包絡譜如圖5和圖6所示。

圖3 外圈故障原始信號及其包絡譜Fig.3 Original signal and envelope spectrum of outer ring fault

圖4 齒輪故障原始信號及其包絡譜Fig.4 Original signal and envelope spectrum of gear tooth fault

圖5 外圈故障處理信號及其包絡譜Fig.5 Processed signal and envelope spectrum of outer ring fault

圖6 齒輪故障處理信號及其包絡譜Fig.6 Processed signal and envelope spectrum of gear tooth fault
從圖5和圖6中可以看到,經過多尺度正交PCALPP方法處理后的信號,由于投影空間的變換以及信號的多項式重構,故障增強后信號的幅值不再具有原始幅值的物理意義,但信號頻率成分依然反映故障的特征信息[2-3,13]。圖 5 中包絡譜在 44.82 Hz(≈fouter=44.46 Hz)及其倍頻處有明顯譜線,可以清晰識別故障類型屬于外圈故障,圖6中包絡譜在12.4 Hz(≈fgear=12.42 Hz)及其倍頻處有明顯譜線,可以清晰地識別出齒輪故障。
故障類型識別中設置正常狀態,軸承內圈故障,外圈故障,齒根裂紋四種故障類型。軸承內外圈裂紋以及齒根裂紋如圖7所示,其中軸承內外圈故障類型為0.4mm寬,1mm深的線切割裂紋,齒根裂紋為0.2mm寬,1mm深的線切割裂紋。故障軸承以及故障齒輪位置與3.1中相同。

圖7 軸承及齒輪故障Fig.7 Bearing and gear failure
實驗中每種故障類型采集70個樣本數據,共計280個樣本,單個樣本長度1 s。經過多尺度正交PCALPP方法(參數設置與3.1相同)處理后的信號幅值不具有明確的物理意義,故考慮提取信號的頻域特征參數進行不同故障類型的識別。對特征增強后的信號y*再次進行db4小波包3層分解,重構各子頻帶小波包系數,得到8個子頻帶重構分量,計算子頻帶信號能量,得到能量特征向量 E=[E1,E2,…,E8],求取 8 個信號的能量熵作為特征向量[14],能量熵的計算如式(15)所示。

為研究多尺度正交PCA-LPP算法的性能,參照文中算法流程,比較文中算法、多尺度PCA方法、多尺度LPP方法及k近鄰多尺度正交PCA-LPP算法處理后信號以及原始故障信號提取的8維能量熵特征向量的故障辨識情況。每種故障70個樣本中,30個用于訓練支持向量機分類器,其余40個樣本用于測試分類器的故障辨識效果。分類辨識運算環境為3 GHz i5 CPU,4 G RAM,win7以及matlab R2009b。五種情況下提取的特征參量的故障識別率如表1所示。

表1 故障類型辨識率/%Tab.1 Fault identification rate/%
表1中故障整體識別率為各故障單項識別率的均值,表示四種故障類型正確識別的總數占160個測試樣本的比例。其中k近鄰多尺度正交PCA-LPP算法中設置鄰域值k的范圍為10~60,間隔為1,迭代尋找故障整體識別率最高的鄰域值,最終得到k=42。從表1中可以看到多尺度正交PCA-LPP特征增強后的故障特征,其整體辨識率最高,可達93.75%,原始故障信號直接提取特征的整體辨識率最低,僅為43.75%。多尺度PCA與多尺度LPP方法處理后信號的提取特征的故障整體辨識率分別為78.13%和84.38%,k近鄰多尺度正交PCA-LPP方法處理后信號的故障特征辨識率為89.38%。多尺度PCA與多尺度LPP方法與文中方法故障識別率的比較表明,文中方法由于能夠兼顧PCA與LPP的全局和局部特性,因此處理后信號中的故障特征增強更加全面,所以識別率更高。k近鄰方法與文中方法的比較結果表明,自適應鄰域構造SG方法的引入能夠根據樣本的特點自適應選擇近鄰數,比之k近鄰方法更好的保持了樣本的局部流形信息,因而故障識別率進一步提高,并克服了k近鄰方法迭代選擇近鄰數的問題。
文中提出一種兼顧PCA與LPP特點的正交PCALPP非線性流形學習算法,并給出相應的理論計算模型,結合小波包分解,實現單維信號的故障特征重構投影,從而增強故障特征信息,從信號故障譜線增強和故障類型辨識率提升兩方面進行了比較研究,主要有以下結論:
(1)多尺度正交PCA-LPP結合了PCA的全局分布方差增大和LPP的局部非線性特征保持能力,處理后的故障信號包絡譜中故障譜線明顯增強。
(2)對故障信號進行多尺度正交PCA-LPP特征增強處理后,提取小波包能量熵特征進行故障類別辨識的結果表明,增強后提取的故障特征向量分類更清晰,對應的故障類型識別率明顯提高。
[1]李晗,蕭德云.基于數據驅動的故障診斷方法綜述[J].控制與決策,2011,26(1):1 -9.LI Han,XIAO De-yun.Survey on data driven fault diagnosis methods[J].Control and Decision,2011,26(1):1 -9.
[2]李宏坤,趙長生,周帥,等.基于小波包-坐標變換的滾動軸承故障特征增強方法[J].機械工程學報,2011,47(19):74-79.LI Hong-kun,ZHAO Chang-sheng,ZHOU Shuai,et al.Fault feature enhancement method for rolling bearing based on wavelet packet-coordinate transformation[J].Journal of Mechanical Engineering,2011,47(19):74 -79.
[3]尹剛,張英堂,李志寧,等.基于MSPCA的缸蓋振動信號特征增強方法研究[J].振動與沖擊,2013,32(6):143-147.YIN Gang,ZHANG Ying-tang,LI Zhi-ning,et al.Fault feature enhancement method for cylinder head vibration signal based on multiscal principal component analysis[J].Journal of Vibration and Shock,2013,32(6):143 -147.
[4]趙振華,郝曉弘.局部保持鑒別投影及其在人臉識別中的應用[J].電子與信息學報,2013,35(2):463-466.ZHAO Zhen-hua,HAO Xiao-hong.Linear locality preserving and discriminating projection for face recognition[J].Journal of Electronics& Information Technology,2013,35(2):463-466.
[5]He X F,Niyogi P.Locality preserving projections[A].Neural Information Processing Systems16[C].Vancouver.MIT Press,2004:153 -160.
[6]王健,馮健,韓志艷.基于流形學習的局部保持PCA算法
在故障檢測中的應用[J].控制與決策,2013,28(5):684.WANG Jian,FENG Jian,HAN Zhi-yan.Locally preserving PCA method based on manifold learning and its application in fault detection[J].Control and Decision,2013,28(5):684.
[7]Zhang Z H,Zhu X Z,Zhao J M,etal.Image retrieval based on PCA-LPP[A].201110th International Symposium on Distributed Computing and Applications to Business,Engineering and Science[C].Wuxi,Jiangsu,China,2011:230-233.
[8]李鋒,湯寶平,宋濤,等.歸一Laplacian矩陣有監督最優局部保持映射故障辨識[J].機械工程學報,2013,49(13):100-106.LI Feng, TANG Bao-ping, SONG Tao, et al. Fault identification method based on normalized laplacian-based supervised optimal locality preserving projection[J].Journal of Mechanical Engineering,2013,49(13):100 -106.
[9]Yang B,Chen S C.Sample-dependent graph construction with application to dimensionality reduction [J].Neurocomputing,2010,74(5):301 -314.
[10]袁暋,程雷,朱然剛,等.一種新的基于MMC和LSE的監督流形學習算法[J].自動化學報,2013,39(12):2076-2079.YUAN Min,CHENG Lei,ZHU Ran-gang,et al.A new supervised manifold learning algorithm based onmmC and LSE[J].Acta Automatica Sinica,2013,39(12):2076-2079.
[11]宋濤,湯寶平,李鋒.基于流形學習和K-最近鄰分類器的旋轉機械故障診斷方法[J].振動與沖擊,2013,32(5):149-153.SONG Tao, TANG Bao-ping, LI Feng. Fault diagnosis method for rotating machinery based on manifold learning and K-nearest neighbor classifier[J].Journal of Vibration and Shock,2013,32(5):149 -153.
[12]Manish M,Henry,Joe Q S,et al.Multivariate process monitoring and fault diagnosis by multi-scale PCA[J].Computers and Chemical Engineering,2002,26(9):1281-1293.
[13]張赟,李本威.基于最大方差展開的非線性信號降噪方法及其在故障診斷中的應用[J].中國科學,2010,40(8):940-945.ZHANG Bin, LI Ben-wei. Noise reduction method for nonlinear signal based on maximum variance unfolding and its application to fault diagnosis[J].Sci China Tech Sci.,2010,40(8):940-945.
[14]李城梁,王仲生,姜洪開,等.自適應Hessian LLE在機械故障特征提取中的應用[J].振動工程學報,2013,26(5):758-763.LI Cheng-liang,WANG Zhong-sheng,JIANG Hong-kai,et al.Adaptive Hessian LLE in mechanical fault feature extraction [J]. Journalof Vibration Engineering,2013,26(5):758-763.