基于KPCA-FSVM的液壓泵可靠性壽命分布識別
景濤曹克強胡良謀高斌
空軍工程大學,西安,710038
摘要:為了準確快速識別出液壓泵的可靠性壽命分布模型,提出了一種基于核主元分析和模糊支持向量機的可靠性壽命分布模型識別方法。該方法充分利用核主元分析非線性特征提取的優勢和模糊支持向量機良好的分類能力,建立了適合可靠性壽命分布識別的模糊支持向量機模型,并將其應用于液壓泵可靠性壽命分布模型識別。仿真實驗結果表明,該模型能夠降低計算的復雜度,具有良好的泛化能力,能夠準確地識別出液壓泵無故障工作時間數據所屬的壽命分布類型。
關鍵詞:核主元分析;模糊支持向量機;壽命分布模型;液壓泵;無故障工作時間
中圖分類號:V24
收稿日期:2015-04-28
作者簡介:景濤,男,1992年生。空軍工程大學航空航天工程學院碩士研究生。主要研究方向為飛機液壓系統可靠性。發表論文1篇。曹克強,男,1960年生。空軍工程大學航空航天工程學院教授。胡良謀,男,1979年生。空軍工程大學航空航天工程學院博士后研究人員。高斌,男,1992年生。空軍工程大學航空航天工程學院碩士研究生。
Identification of Reliability Life Distribution of Hydraulic Pump Based on KPCA and FSVM
Jing TaoCao KeqiangHu LiangmouGao Bin
Air Force Engineering University,Xi’an,710038
Abstract:Aiming at identifying the reliability life distribution model of the hydraulic pump accurately and efficiently, an algorithm of KPCA and FSVM was brought forward. The recognition model of the reliability life distribution model was designed by making full use of advantages of the KPCA nonlinear feature extraction and the FSVM classification capacity, and might be used for identifying the reliability life distribution model of the hydraulic pump. The simulation results show that, the proposed method can reduce computation complexity, has good ability for generalization, and identify the life distribution type of life on time between failures of hydraulic pump accurately.
Key words:kernel principal component analysis(KPCA); fuzzy support vector machine(FSVM); life distribution model; hydraulic pump; time between failures
0引言
液壓泵是飛機液壓傳動與控制系統中的能源部件[1],是飛機液壓系統的核心,隨著液壓系統日益高速化、復雜化及高精度化,人們對液壓泵的安全性、可靠性要求越來越高[2]。
通過壽命分布模型來描述液壓泵的可靠性是一種常用的數學方法,準確識別液壓泵的壽命分布模型,是可靠性建模成敗的關鍵,因此,研究液壓泵可靠性壽命分布模型是極為重要的。
判斷一組可靠性數據所屬的壽命分布類型,主要有兩類方法。傳統的方法主要有解析法和圖分析法,但在實際應用中,常常會出現幾種分布同時滿足要求,從而無法直接判斷樣本屬于何種分布最佳。近年來,智能識別方法飛速發展,朱家元等[3-4]和韓強等[5]將其應用于可靠性壽命分布模型識別,實現了對常用的指數分布、威布爾分布、Г分布、對數正態分布、正態分布、Beta分布、均勻分布等的分類識別,識別率在90%以上。
為了簡化計算的復雜度,進一步提高分類精度,本文提出了一種基于核主元分析(kernel principal component analysis,KPCA)[6-10]和模糊支持向量機(fuzzy support vector machine,FSVM)可靠性壽命分布模型識別方法。KPCA方法是Scholkopf等[11]對線性主元分析方法(principal component analysis,PCA)進行核化得到的一種新的多變量統計方法。由于核函數的應用,KPCA較PCA具有更多優勢,尤其在非線性特征提取方面。FSVM能夠克服SVM在解決多分類問題時存在的不可分區域問題,具有更好的分類性能。本文將KPCA與FSVM相結合,將經KPCA特征提取得到的主成分分量作為FSVM的輸入建立壽命分布識別模型,并將該模型應用于液壓泵可靠性壽命分布模型識別。
1基本原理
1.1核主元分析原理
核主元分析方法是在經典的主元分析的基礎上,通過引入核函數,將數據映射到高維的特征空間,在高維空間使用PCA對其進行降維,以改善PCA在非線性數據情況下分析結果不理想的狀況[6-10]。
對于原始數據樣本集Xi(i=1,2,…,M)通過非線性映射Φ將Xi映射到新的特征空間F的像φ(xi)中。
定義映射數據的M階對稱方陣K的元素Kij為核函數:
Kij=φ(xi)φ(xj)i,j=1,2,…,M
(1)
式中,xi、xj為樣本集Xi的兩個樣本;φ(*)為非線性映射函數。
若映射數據為非零均值,則需對核函數進行中心化處理:
(2)



(3)
(4)

(5)
存在系數αj使得
(6)
成立。將式(4)、式(6)代入式(5)有

(7)

(8)
νk·νk=1

最后通過求累計方差貢獻率來確定主元特征個數。累計方差貢獻率定義為
(9)

1.2模糊支持向量機
SVM在解決多分類問題時,存在部分樣本無法確切地屬于某一類,從而產生不可分區域現象[12]。在“一對多”的情況下,假設第g類和其他類相區分開的第g個決策函數為
Dg(x)=wg·x+bg
(10)
式中,w為權向量;b為閥值;x為輸入向量。
Dg(x)=0時,分類面為最優分類超平面。屬于第g類的支持向量將滿足Dg(x)=1,而屬于其他類的支持向量將滿足Dg(x)=-1。對于輸入向量x,如果其中僅有一個類別滿足D(x)>0,那么x將被劃分到該類別中;但是當有多個類別同時滿足式(10)或沒有一個類別滿足式(10)時,那么x是不可分的,從而形成不可分區域。
針對SVM在“一對多”模式中產生不可分區域問題,文獻[13]提出了FSVM算法,在輸入向量x滿足不止一個類別,但卻得到相同分類結果的情況下引入了一維成員函數。在垂直于分類超平面Dh(x)=0的方向上設置一維成員函數mgh(x):
(1)當g=h時
(11)
(2)當g≠h時
(12)
g,h=1,2,…,n
利用mgh(x),定義第g類隸屬函數:
(13)
最終,一個待識別樣本X所屬的類別可由下式得到:
(14)
2基于KPCA-FSVM的壽命分布識別方法
本文提出的基于KPCA-FSVM的壽命分布模型識別方法步驟如下:
(1)確定初始樣本集。選定所需的分布類型以及該分布函數的參數,根據分布類型及參數產生隨機數,求出隨機數組的數字特征并進行規則化處理,將處理后的數據作為初始樣本集。
(2)核主元特征提取。通過KPCA對初始樣本集進行核主元分析,當累積方差貢獻率大于90%時,確定核主元特征個數,提取相應的主元特征向量作為FSVM模型的訓練樣本集。
(3)FSVM模型的訓練及測試。設置FSVM的初始參數,將訓練樣本集輸入到模型中進行訓練,判斷模型對訓練樣本集的識別率η,修改初始參數,直到模型對訓練樣本集識別率達到要求時停止訓練。按照步驟(1)、步驟(2)產生測試樣本集,將先測試樣本集在主元方向上進行投影,提取主元向量并輸入到模型中進行分類,得到模型對測試樣本集的識別率。若識別率不滿足要求,則重新調整FSVM的初始參數,直到滿足規定要求,即得到FSVM壽命分布識別模型。
(4)實例應用。對未知分布類型的樣本數據進行數字特征計算并進行規則化處理,將處理后的結果進行KPCA特征提取,構成待識別樣本。將樣本輸入到模型中進行分類識別,即得到該組數據所屬的分布類型。
基于KPCA-FSVM的可靠性壽命分布識別流程如圖1所示。
3仿真實驗及結果分析
3.1確定初始樣本集
采用KPCA-FSVM模型對壽命分布進行識別,首先需要確定壽命分布模式。目前,在可靠性工程研究中所用的理論壽命分布類型很多,針對機械產品壽命這種連續型的隨機變量,常用的分布形式主要有指數分布、正態分布、對數正態分布和兩參數威布爾分布[14]。分析這4種分布在不同參數下概率密度函數的形狀,然后對每種分布進行參數細分,共分為80種分布模式。細分后的分布模式如表1所示。
數字特征的選取對模型識別效果有著十分重要的影響。針對壽命分布模型的識別這類問題,通常是將提取樣本集的峰度、偏度、離散系數、分位數等數字特征作為模型識別的特征,文中選擇峰度、偏度、離散系數和7個分位數作為特征。

圖1 基于KPCA-FSVM的壽命分布識別流程圖

分布類型分布參數A、B參數數量指數分布A=50,100,…,100020正態分布A=200,400,…,1000B=200,400,…,80020對數正態分布A=0.2,0.4,…,0.8B=2,4,…,1020兩參數威布爾分布A=2,4,…,8B=200,400,…,100020
用MATLAB產生以上80種不同分布模式的100個隨機數組序列,求出該序列的數字特征并進行規則化處理,構建初始樣本集,部分初始樣本集如表2所示。

表2 部分初始樣本集
注:E代表指數分布,N代表正態分布,L代表對數正態分布,W代表威布爾分布。
3.2核主元特征提取
對初始樣本集進行核主元特征提取,首先對樣本集進行核主元分析,核函數選擇高斯徑向基核函數:
(15)
經過多次取值試驗,當σ取100時,前3個主元的累積方差貢獻率大于95%,如圖2所示。故核主元個數為3,將初始樣本集在主元方向對應的特征向量作為FSVM模型的訓練樣本集。根據表1所列的4種分布,選擇不包含表1中參數的4種分布(每種分布各10個),通過產生隨機數組序列,提取其數字特征,進行規則化處理,并在主元方向上進行投影,將投影后的結果作為FSVM模型的測試樣本集。

圖2 KPCA累計方差貢獻率
3.3FSVM模型的訓練及測試
本文通過編寫FSVM的程序,構建FSVM壽命分布識別模型(規則化參數C=1000,總類別數為4)。核函數選取高斯徑向基核函數
(16)
其中,x、x′為樣本集的樣本,參數σ=1。
將訓練樣本集和測試樣本輸入到FSVM模型中進行訓練,調整模型參數,訓練樣本集和測試樣本集滿足識別率要求時停止訓練,得到模型。本研究中規定,當模型對訓練樣本集和測試樣本集的準確識別率均達到90%時,停止訓練及測試。對于初始設定的參數,模型對訓練樣本集和測試樣本集的識別率如圖3、圖4所示。

圖3 KPCA-FSVM的訓練樣本集識別結果 (識別率為100%)

圖4 KPCA-FSVM的測試樣本集識別結果 (識別率為90%)
使用KPCA處理后的數據建立FSVM模型,模型對訓練樣本集和測試樣本集的識別結果如圖3、圖4所示。模型對訓練樣本集識別率達到100%,對測試樣本集的識別率達到90%,證明KPCA-FSVM模型具有良好的學習能力和推廣性能,可以將該模型用于壽命分布模型識別。
為驗證KPCA的性能,對未經KPCA處理的初始樣本集進行訓練,同時將產生的測試樣本集輸入到模型中進行分類識別,得到的結果如圖5所示。

圖5 FSVM的測試樣本集識別結果 (識別率為92.5%)
圖4、圖5為KPCA-FSVM模型和FSVM模型對各自測試樣本集的識別結果,準確識別率均在90%以上,表明KPCA-FSVM模型具有與FSVM模型相當的識別性能,使用KPCA對初始樣本集進行核主元分析,提取核主元特征向量,保持了模型對樣本的識別能力,同時經KPCA處理的初始樣本集由高維降低為3維,大大簡化了計算的復雜度。
仿真實驗結果表明,KPCA可以對初始樣本集數據進行非線性特征提取,有效降低了初始樣本集的維數,使用提取的主元特征向量數據并結合FSVM可建立準確的壽命分布識別模型。KPCA-FSVM和FSVM兩種方法建模的分類結果對比表明,KPCA-FSVM方法有效簡化了計算,同時保證了識別的準確率,是一種更為有效的可靠性壽命分布識別方法。
4實例應用
對31臺某型柱塞式液壓泵進行壽命試驗直至全部失效,首次失效時間依次為93h、100h、100h、100h、200h、200h、300h、300h、400h、400h、466h、500h、600h、600h、625h、700h、700h、800h、900h、900h、1000h、1000h、1100h、1206h、1402h、1622h、1700h、1900h、2000h、2200h、2400h。求出該組數據的數字特征并進行規則化處理。該液壓泵的數字特征為-0.619、-0.394、-0.511、0.96、0.709、0.646、0.641、0.574、-0.136、-0.236。對該組數字特征進行核主元提取,將提取后的特征輸入到模型中進行分類預測,分類結果如圖6所示。

圖6 液壓泵壽命分布識別結果
實驗預設樣本的壽命分布類型為指數分布;通過模型進行預測分類得到的結果為指數分布。
對液壓泵的無故障工作時間數據按置信度為95%進行極大似然估計,求出不同假設分布的參數,并使用k-s檢驗法判斷該分布類型是否合理可用,其結果如表3所示。

表3 極大似然估計和k-s檢驗結果
對比傳統方法和KPCA-FSVM判斷該型液壓泵壽命分布模型可知,使用傳統假設檢驗方法時,通過k-s檢驗的分布有指數分布、正態分布、兩參數威布爾分布,需要進一步進行判斷才能得出準確的分布模型,而使用KPCA-FSVM方法對該型液壓泵的無故障工作時間進行分類識別,可快速精確地得到該型液壓泵的壽命分布模型屬于指數分布。
5結語
基于KPCA-FSVM的壽命分布模型識別方法充分利用了KPCA提取非線性特征的優勢,實現了對特征的降維處理。同時利用FSVM在處理多分類問題上的良好性能,建立了KPCA-FSVM壽命分布模型。該模型計算復雜度低、分類效果好,能夠快速有效地實現對指數分布、正態分布、對數正態分布和兩參數威布爾分布的分類識別。使用KPCA-FSVM方法對某型未知壽命分布模型的柱塞式液壓泵壽命數據進行分類預測,得到的結果相比傳統假設檢驗方法更為精確,證明了該方法的可靠性,具有一定的實用價值,便于工程應用。
參考文獻:
[1]沈燕良.飛機系統原理[M]. 北京:國防工業出版社,2010.
[2]何慶飛,陳桂明,陳小虎,等. 基于灰色支持向量機的液壓泵壽命預測方法[J]. 潤滑與密封,2012,37(4):75-77.
He Qingfei, Chen Guiming, Chen Xiaohu, et al. Life Prediction Method of Hydraulic Pump Based on Grey Support Vector Machines[J]. Lubrication Engineering, 2012,37(4):75-77.
[3]朱家元,張恒喜,田松,等. 基于復合神經網絡的數據分布模式仿真識別[J]. 系統工程與電子技術,2002,24(10):96-99.
Zhu Jiayuan, Zhang Hengxi, Tian Song, et al. Data Distribution Simulation Identification Using Combined Structure Neural Networks[J]. Systems Engineering and Electronics,2002,24(10):96-99.
[4]朱家元,張恒喜,張喜斌. 基于智能復合結構的可靠性分布模式自動識別[J]. 航空學報,2003,24(3):207-211.
Zhu Jiayuan, Zhang Hengxi, Zhang Xibin. Reliability Distributions Automatic Identification Based on Intelligent Combined Structure Model[J]. Journal of Aviation, 2003,24(3):207-211.
[5]韓強,祝華遠,孫明禮,等. 基于支持向量機的小樣本數據概率分布模式自動識別[J]. 科學技術與工程,2009,9(10):2766-2769.
Han Qiang, Zhu Huayuan, Sun Mingli, et al. Modeling Distributions Identification for Small Samples Based on SVM[J]. Science Technology and Engineering, 2009,9(10):2766-2769.
[6]郝惠敏, 湯曉君, 白鵬, 等. 基于核主成分分析和支持向量回歸機的紅外光譜多組分混合氣體定量分析[J]. 光譜學與光譜分析,2008,28(6):1286-1289.
Hao Huimin, Tang Xiaojun, Bai Peng, et al. Quantitative Analysis of Multi-component Gas Mixture Based on KPCA and SVR[J]. Spectroscopy and Spectral Analysis, 2008,28(6):1286-1289.
[7]彭濤,楊慧斌,李建寶,等. 基于核主元分析的滾動軸承故障混合域特征提取方法[J]. 中南大學學報(自然科學版),2011,42(11):3385-3391.
Peng Tao,Yang Huibin,Li Jianbao,et al. Mixed—domain Feature Extraction Approach to Rolling Bearings Faults Based on Kernel Principle Component Analysis[J]. Journal of Central South University(Science and Technology), 2011,42(11):3385-3391.
[8]宋平,文妍,譚繼文. KPCA和遺傳BP神經網絡在滾珠絲杠故障診斷中的應用研究[J]. 機床與液壓,2014,42(9):159-162.
Song Ping,Wen Yan,Tan Jiwen. Application Research of KPCA and GA-BP Network in Ball Screw Fault Diagnosis[J]. Machine Tool & Hydraulic,2014,42(9):159-162.
[9]周欣,吳瑛. 基于KPCA和LDA的信號調制識別[J]. 系統工程與電子技術,2011,33(7):1611-1616.
Zhou Xin, Wu Ying. Signal Modulation Recognition Based on KPCA and LDA[J]. Systems Engineering and Electronics, 2011,33(7):1611-1616.
[10]張曦,閻威武,劉振亞,等. 基于核主元分析和鄰近支持向量機的汽輪機凝汽器過程監控和故障診斷[J]. 中國電機工程學報,2007,27(14):56-61.
Zhang Xi,Yan Weiwu,Liu Zhenya,et al. Process Monitoring and Fault Diagnosis of Condenser Using KPCA and PSVM[J]. Proceeding of the CSEE, 2007,27(14):56-61.
[11]Scholkopf B, Smola A, Muller K-R. Nonlinear Component Analysis as a Kernel Eigenvalue Problem[J]. Neural Computation, 1998,10(5):1299-1319.
[12]陳家德,吳小俊. 自適應模糊支持向量機算法研究[J]. 計算機工程與應用,2010,46(25): 191-194.
Chen Jiade,Wu Xiaojun. Study on Adaptive Fuzzy Support Vector Machine Algorithm[J]. Computer Engineering and Applications, 2010,46(25): 191-194.
[13]Inoue T, Abe S. Fuzzy Support Vector Machines for Pattern Classification[C]//International Joint Conference on Neural Networks. Killarney,Ireland,2001:1449-1454.
[14]吳月明,王毅群,李莉. BP神經網絡與廣義RBF神經網絡在產品壽命分布模型識別中的應用研究[J]. 中國機械工程,2006,17(20):2140-2143.
Wu Yueming, Wang Yiqun, Li Li. Application Study on BP Network and Generalized RBF Network in Estimating Distribution Model of Mechanical Products[J]. China Mechanical Engineering, 2006,17(20):2140-2143.
(編輯張洋)