999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數據集不均衡下的設備故障程度識別方法研究

2016-11-24 06:36:56段禮祥王金江
振動與沖擊 2016年20期
關鍵詞:分類故障

段禮祥 , 郭 晗, 2 , 王金江

(1.中國石油大學(北京) 機械與儲運工程學院,北京 102249; 2.中國特種設備檢測研究院,北京 100013)

?

數據集不均衡下的設備故障程度識別方法研究

段禮祥1, 郭 晗1, 2, 王金江1

(1.中國石油大學(北京) 機械與儲運工程學院,北京 102249; 2.中國特種設備檢測研究院,北京 100013)

在機械故障診斷中,由于故障樣本難以收集且數量遠遠少于正常樣本,即產生數據集不均衡問題。這將導致傳統的分類算法如支持向量機(SVM)在處理不均衡分類問題時對少數類樣本(故障樣本)的分類準確率過低。加權支持向量機(C-SVM)算法是一種處理樣本集不均衡問題的常用算法,可以在一定程度上改善少數類樣本的分類準確率。但是在故障程度相近時會導致樣本間距過小,加權C-SVM算法對這類故障樣本的識別精度不理想。為提高數據集不均衡下故障程度相近樣本的分類準確率,采用二叉樹結構與加權C-SVM相結合的方法,綜合考慮樣本類間距離、類內距離和不均衡程度,優化二叉樹結構。結果表明,該算法能夠有效處理樣本距離過近的不均衡數據集分類問題,從而提高了故障程度相近樣本的分類準確率。

故障診斷;故障程度識別;數據集不均衡;二叉樹加權支持向量機

轉子不平衡是旋轉機械中最常見的故障之一,正確識別轉子不平衡故障程度,是對設備進行視情維修的前提條件[1-2]。在故障程度相近時,不同類別的樣本相似度很高,且距離較近,在進行分類時很容易將其誤分成其他類別。在工程實際中,故障樣本的數量遠遠少于正常樣本,并且當準備收集異常樣本時,設備可能已經無法運行,即出現數據集不均衡問題[3-4]。

SVM算法在針對小樣本、維數過高、非線性等問題方面具有明顯的優勢,因此在近些年發展非常迅速[5-6]。但是,在處理不均衡數據集分類問題時,傳統SVM算法以樣本的整體分類準確率為評價準則,分類超平面會朝著少數類樣本方向移動,忽略少數類樣本,且在多數類樣本內產生過擬合[7-8]。針對這一問題,文獻[7]提出了一種加權C-SVM算法,研究懲罰參數C的選擇方式,降低了樣本的誤分率。文獻[8]根據正負類樣本數量確定懲罰參數C,并將改進后的C-SVM算法與KNN欠抽樣算法相結合,取得了良好的效果。

上述文獻都證明加權C-SVM算法可以提高不均衡數據集中少數類樣本的分類準確率,但是在故障程度相近時,不同類別的樣本相似度很高,且容易出現邊界混疊現象,利用加權參數移動分類面可能會導致某類樣本分類準確率過低。針對這一問題,本文采用一種二叉樹加權支持向量機算法,在進行樣本加權時綜合考慮樣本的類間距離、類內距離以及不均衡程度,確定二叉樹結構,并采用該方法識別5種不同程度的轉子不平衡故障樣本。

1 加權二叉樹支持向量機

1.1 加權支持向量機

加權C-SVM算法是在SVM算法的基礎上,針對樣本的大小、重要度等特點引入不同的權重,其優化問題可以表示成如下形式[7]:

(1)

式中:si表示第i類樣本的權重。式(1)的含義是通過給不同種類樣本賦予不同的權重,改變樣本的懲罰參數,進而補償類別不均衡所帶來的影響。

計算加權參數si的一種最基本方法是計算每種樣本與占樣本總數的比例,取倒數作為該類樣本的加權參數,可以得出:

(2)

式中:ni代表第i類樣本數,m代表樣本種類。

在進行故障程度識別時,希望故障程度越大的樣本識別的錯誤率越低,因此,要給其賦予較大的懲罰參數。加權C-SVM算法中法分類函數為:

(3)

式中:αi表示拉格朗日算子。在尋找最優解時,若αi=0,則對應的訓練樣本稱作支持向量;若αi=C,則對應的樣本稱作邊界支持向量;若0<αi

1.2 二叉樹加權支持向量機

二叉樹加權支持向量機由多個二分類加權支持向量機組成,每個節點的分類器按照屬性結構排列。二叉樹算法比一對一分類算法需要訓練的子分類器數目更少,且能夠避免一對一方法中產生的不可分區域,并且由于每一級分類器訓練樣本數目在逐漸減少,因此可以提高運行效率,縮短運行時間。但是二叉樹加權支持向量機分類算法存在誤差累計問題,即上層節點產生的分類錯誤會一直延續下去,導致下層節點的分類誤差較大。因此,必須確保上層節點的分類器的性能最優,在確定二叉樹結構時應該首先識別最容易區分的類別[9-10]。本文綜合考慮類間距離與類內距離確定二叉樹結構,再根據樣本分布范圍與樣本不均衡度確定加權參數。

(5)

式中::ni表示第i類樣本中的樣本個數,xj表示將該類樣本中的任意樣本點。可以得出整個樣本集內任意點xk到該類樣本中心距離為:

(6)

類間距離表示的是兩類樣本中心點間的距離,不能代表樣本的可分離度,因此需要進一步進行計算,第i類樣本的類內距離可以表示為:

(7)

根據文獻[11],可以推出分離性測度公式表示如下:

(8)

式中:i和j分別表示第i類樣本和第j類樣本。Sij越大,證明兩類樣本的可分離性越好,在建立二叉樹支持向量機分類器時,應該在越上層。

1.3 粒子群優化算法

粒子群優化算法的原理是模擬鳥類的捕食行為,鳥類在捕食的時候,會搜索當前最近的食物區域。通過鳥類捕食行為的啟發,PSO算法中將問題的潛在解用不同的粒子來表示,通過合適的適應度函數確定各個粒子的適應度值。PSO算法是一種并行的隨機搜索算法,可以實現對整個解空間的搜索,并且該算法具有控制參數少、算法簡單等優點,因而一經提出便獲得了廣泛的關注。

假設PSO種群大小為n,用Pi表示種群中第i個粒子的位置,Vi表示速度,fitnessi表示適應度值。則基于PSO的尋優算法步驟可以描述如下:① 初始化種群中的粒子位置和速度,粒子位置Pi,速度Vi隨機初始化;② 根據目標函數計算粒子適應度值fitnessi;③ 循環迭代,尋找個體極值Pbest和群體極值Gbest;④ 滿足條件,終止循環,算法結束。

2 故障診斷應用

2.1 轉子振動信號特征提取

本次實驗采用美國本特利公司生產的RK4系列轉子振動試驗臺,轉子系統由調速臺、電機、轉軸、雙圓盤、軸承、基座等組成,最大速度10 000 r/min。采樣精度24 Bit,采樣頻率16 000 Hz,采樣長度25段(每段為1 024點),轉速為 6 230 r/min。通過在轉子圓盤上加裝不同質量的配重螺釘來模擬不同程度的不平衡故障,本實驗加裝了質量為0.3 g, 0.5 g, 0.8 g, 1.0 g的4種配重螺釘,采集包括正常信號在內的五種樣本。采用MF-DFA方法對每段數據進行分析,提取出αmax、αmin、α0、Δf四種特征參數,圖1(a)~1(d)所示為每種特征參數對應的分布圖。

圖1 αmax、αmin、α0、Δf特征參數變化曲線圖Fig.1 Curves of αmax,αmin,α0 and Δf features

由圖1可以看出,針對轉子不平衡信號,特征參數αmax和α0能夠較好地區分出5種故障程度,而其他指標均出現不同程度的混疊。αmax與α0兩種特征參數只有個別點出現混疊,并且兩組參數中混疊的樣本點不同,因此本文采用αmax和α0兩種特征參數結合共同作為特征向量,并進行歸一化處理,形成原始特征集。

2.2 轉子故障程度識別

由于RBF核函數能夠解決樣本特征與類別標簽之間的非線性問題,并且計算起來較為簡單,因此本文選用RBF核函數。采用RBF核函數的加權C-SVM算法有C和γ兩個參數需要確定。采用的數據分析工具是Matlab2013和libsvm工具箱,表1描述了這些數據的基本特性參數。

將原始數據集中任取一組數據作為測試樣本,其余149組數據作為訓練樣本,循環測試150次。分別采用傳統SVM算法和加權C-SVM算法對測試樣本進行分類,分類結果如圖2(a)和2(b)所示,圖中縱坐標代表樣本實際類別,橫坐標代表樣本預測類別,不同的顏色代表不同的分類準確率,即0%~100%。通過對比可以看出,傳統的SVM多分類方法分類結果偏向多數類樣本,即圖2(a)中分類結果集中在1、2、3類,第4、5類樣本因為數據的數量較少被分類器忽略。觀察圖2(b)可以發現,將樣本集賦予不同的權重后,第4、5類樣本分類準確率明顯提高,證明分類面的傾斜情況有所好轉。

圖2 SVM、加權C-SVM、PSO-CSVM、PSO-BT-CSVM算法分類結果Fig.2 Classification results of SVM、weighted C-SVM、PSO-CSVM and PSO-BT-CSVM

引入加權C-SVM算法后,雖然對分類結果的分布起到一定的改善,但是并未完全解決少數類樣本的識別問題,即第4類樣本有25%被誤分為第3類樣本。分析原因可能有以下2點:① 在建立分類模型時沒有對參數進行優化,可能造成C和γ不夠適合,進而導致分類結果不夠理想。② 本文中采用的數據是故障程度相近的5組轉子不平衡數據,因此特征指標相似度較高,且隨著樣本個數的減少,很可能出現正類樣本特征完全被負類樣本包圍的情況。引入加權C-SVM算法,調整懲罰參數后雖然樣本分布情況得到了改善,但是引入不同的權重僅僅改變了樣本的相對重要性,對每類樣本的分布情況沒有做充分地考慮,在樣本距離較近,邊界不明顯的情況下難以得到理想結果。

表1 數據集描述

針對第一種假設,引入粒子群優化算法優化參數C和γ,得到分類結果如圖2(c)所示。可以發現,各類樣本的分類準確率均有所提高,證明參數是否優化是影響加權C-SVM分類器結果的一個因素。但是第4類樣本仍存在15%的樣本點被誤分為第3類樣本,因此需要進一步分析該類樣本的數據特點,找出影響分類結果的因素。前文提到根據樣本的不均程度衡度確定樣本的權值分布不能反映出樣本的分布特性,樣本距離較近,邊界不明顯的情況會影響加權C-SVM的分類效果。針對這一問題,對5種樣本的類內距離、類間距離和不均衡程度進行綜合分析,引入二叉樹加權支持向量機算法進行識別。首先要根據公式(5)~(8)計算出每種樣本與其他樣本之間的可分離度,可以得到表2。

表2 故障樣本可分離度

由表2可知,第4類樣本與第3類樣本的可分離度最小,解釋了第四類樣本容易被誤分的原因。因此,可以將第3、4類樣本最后識別,避免其對其他類別的樣本造成干擾。計算其他三種樣本的平均可分離度為0.653 0、0.499 9、0.551 0,可以確定二叉樹分類器的分離順序為0.0、1.0、0.3、0.5、0.8。由于本文討論的是不均衡數據集分類情況,按照可分離度來構建二叉樹支持向量機分類模型,第二節點分類器將面臨樣本極度不均衡的情況,即正類樣本不均衡程度為1∶9,這種情況很容易使正類樣本淹沒在負類樣本中,導致正類樣本無法識別。為了改善每個子分類器的分類效果,確保少數類樣本的識別精度,將加權C-SVM與二叉樹方法箱結合,構建基于不均衡樣本集的BT-CSVM算法。采用樣本不均衡度與樣本類半徑相乘得到權重指標,確定每個節點加權C-SVM分類器的樣本權重,計算結果如表3所示。

表3 故障樣本分布指標

構造分類器的節點,利用PSO算法優化參數C和γ,圖2(d)表示PSO-BT-CSVM算法的分類結果。證明該方法針對樣本類間距離較小的不均衡數據集分類效果由于傳統的多分類加權C-SVM算法,具體分類準確率如表4所示。

表4 SVM、C-SVM、PSO-CSVM、

對比表4中各種算法,可見加權C-SVM算法能夠改善少數類樣本的識別精度,但是參數的優化程度和樣本的可分離度會對結果產生影響。經過PSO算法優化后第4類樣本識別精度有所提高。PSO-BT-CSVM算法在識別分離度較小的樣本集上有明顯的優勢,并且總體分類準確率達到了98%,因此可以得出結論,PSO-BT-CSVM算法在識別故障程度相近的數據集時具有明顯優勢。

3 結 論

傳統SVM算法在進行故障診斷時沒有考慮樣本的不均衡問題,導致故障樣本分類準確率偏低。基于樣本不均衡程度的加權C-SVM算法能夠改善分類器的少數類樣本識別效果,但是降低了多數類樣本的分類準確率,并且在處理相近故障程度識別問題時分類結果不理想。本文提出了一種二叉樹加權C-SVM算法,提高了故障程度相近樣本的分類準確率。

(1) 加權C-SVM算法中懲罰參數C和核函數參數γ的選用直接影響算法的分類準確率。通過PSO算法尋找合適的C和γ可以明顯提高樣本的分類準確率,但樣本相似度高、類間距離小的情況下分類效果仍然不夠理想。

(2) 引入樣本可分離度概念,解釋相近故障程度的樣本容易錯分的原因。采用二叉樹結構與加權C-SVM算法相結合的方式,綜合考慮樣本可分離度與樣本不均衡度2種參數確定加權參數,實例中該方法將類間距離過小的兩類樣本分類準確率分別提高6.7和10個百分點,而全部樣本分類準確率也提高了2.7個百分點。

[1] 張龍, 黃文藝, 熊國良. 基于多尺度熵的滾動軸承故障程度評估[J].振動與沖擊, 2014,33(9): 185-189.

ZHANG Long, HUANG Wenyi, XIONG Guoliang. Assessment of rolling element bearing fault severity using multi-scale entropy[J].Journal of Vibration and Shock,2014,33(9): 185-189.

[2] 江瑞龍, 陳進, 劉韜, 等. 設備性能退化評估在巡檢系統中的應用[J]. 振動與沖擊,2012, 31(16): 134-137.

JIANG Ruilong, CHEN Jin, LIU Tao, et al. Performance degradation assessment with the application of patrol inspection system[J]. Journal of Vibration and Shock, 2012,31(16): 134-137.

[3] 陶新民, 劉福榮, 童智靖, 等. 不均衡數據下基于SVM的故障檢測新算法[J]. 振動與沖擊, 2010,29(12):8-12.

TAO Xinmin, LIU Furong, TONG Zhijing, et al. A new fault detection method of unbalanced data based on SVM[J]. Journal of Vibration and Shock, 2010, 29(12):8-12.

[4] 姚培, 王仲生, 姜洪開, 等. 不均衡數據下基于CS-Boosting的故障診斷算法[J]. 振動、測試與診斷, 2013, 33(1):111-115.

YAO Pei, WANG Zhongsheng, JIANG Hongkai, et al. Fault diagnosis method based on CS-boosting for unbalanced training data[J]. Journal of Vibration, Measurement & Diagnosis, 2013, 33(1):111-115.

[5] PAHLO C, EVA A, JOSE B, et al. Multiclass support vector machines with example—dependent costs applied to plankton biomass estimation[J]. IEEE Transaction on Neural Networks and Learning Systems, 2013,24(11):1901-1905.

[6] 石志標, 苗瑩. 基于FOA-SVM的汽輪機振動故障診斷[J].振動與沖擊, 2014,33(22): 111-114.

SHI Zhibiao, MIAO Ying. Vibration fault diagnosis for steam turbine by using support vector machine based on fruit fly optimization algorithm[J]. Journal of Vibration and Shock, 2014,33(22): 111-114.

[7] WANG Xiping, TAN Wenxue, WU Huarui. An innovative SVM for wheat seed quality estimation[J]. Journal of Information & Computational Science, 2015,12(1): 223-233.

[8] 劉進軍. 基于懲罰的SVM和集成學習的非平衡數據分類算法研究[J]. 計算機應用與軟件, 2014,31(1): 186-190.

LIU Jinjun. Research onclassificating unbalanced data based on penalty-based SVM and ensemble learning[J]. Computer Applications and Software, 2014,31(1): 186-190.

[9] 趙海洋, 徐敏強, 王金東. 改進二叉樹支持向量機及其故障診斷方法研究[J].振動工程學報, 2013,26(5):764-769.

ZHAO Haiyang, XU Minqiang, WANG Jindong. An improved binary tree SVM and application for fault diagnosis[J]. Journal of Vibration Engineering, 2013,26(5):764-769.

[10] LIU Xiaofeng, LIN Bo. Identification of resonance states of rotor-bearing system using RQA and optimal binary tree SVM[J]. Neurocomputing, 2015,152:36-44.

[11] 許永建. 變壓器故障診斷技術研究[D]. 南京:南京理工大學, 2010.

A mechanical fault severity identification method under unbalanced datasets

DUAN Lixiang1, GUO Han1,2, WANG Jinjiang1

(1. School of Mechanical and Transportation Engineering, China University of Petroleum, Beijing 102249, China;2. China Special Equipment Inspection and Research Institute, Beijing 100013, China)

In mechanical fault diagnosis, the samples under fault condition are often difficult to obtain, which is the called unbalanced dataset issue. This leads to very low classification accuracy for the conventional algorithm, such as support vector machine (SVM). Weighted C-support vector machine shows improved performance, however, due to the small sample space caused by close fault severities, the classification accuracy of weighted C-support vector machine is still not high enough. To improve the classification accuracy for close fault severity cases under unbalanced dataset, this paper presented an approach integrating weighted C-support vector machine algorithm with binary tree structure, named as BT-CSVM. The binary structure was then optimized taking account of sample space of class-to-class, sample space of inter-class, and unbalance degree. Experimental results show that the proposed method can effectively deal with the unbalanced dataset problem by improving the classification accuracy for close fault severity cases.

fault diagnosis; fault severity identification; unbalanced data; binary tree weighted C-support SVM

國家自然科學基金項目(51005247);中國石油大學(北京)科研基金資助(2462015YQ0403;2462014YJRC039)

2015-07-10 修改稿收到日期:2015-10-15

段禮祥 男,副教授,1969年10月生

TH17

A

10.13465/j.cnki.jvs.2016.20.029

猜你喜歡
分類故障
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
故障一點通
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
奔馳R320車ABS、ESP故障燈異常點亮
給塑料分分類吧
故障一點通
故障一點通
主站蜘蛛池模板: 麻豆AV网站免费进入| 婷婷色狠狠干| 亚洲午夜18| 精品亚洲欧美中文字幕在线看| 亚洲女同欧美在线| 98超碰在线观看| 国产第一页第二页| 亚洲床戏一区| 91极品美女高潮叫床在线观看| 嫩草在线视频| 中文字幕 日韩 欧美| 国禁国产you女视频网站| lhav亚洲精品| 国产91无码福利在线 | 亚洲系列无码专区偷窥无码| 激情六月丁香婷婷| 性欧美久久| jizz亚洲高清在线观看| 色综合久久88色综合天天提莫| 黄色网址免费在线| 玖玖精品视频在线观看| 亚洲成a人片77777在线播放| 亚洲无码电影| 91蝌蚪视频在线观看| 人妻一区二区三区无码精品一区| 亚洲自拍另类| 精品無碼一區在線觀看 | 亚洲永久免费网站| 黄色福利在线| 福利视频久久| 国产精品99在线观看| 国产成人免费| 91国内在线观看| 久久精品无码国产一区二区三区| 国产午夜福利亚洲第一| 毛片在线区| 国产国语一级毛片在线视频| 老司机精品一区在线视频| 九九热在线视频| 99尹人香蕉国产免费天天拍| 国产小视频免费观看| 久久亚洲高清国产| 青青国产在线| 亚洲黄色高清| 经典三级久久| 日本国产一区在线观看| 久久综合亚洲鲁鲁九月天| 国产人成在线视频| 午夜福利免费视频| 午夜国产精品视频黄 | 园内精品自拍视频在线播放| 91精品aⅴ无码中文字字幕蜜桃| 国产福利2021最新在线观看| 真实国产乱子伦高清| 国产噜噜在线视频观看| 久久久精品无码一二三区| 91福利在线看| 91国语视频| 亚洲一区无码在线| 国产精品尤物铁牛tv| 蜜臀av性久久久久蜜臀aⅴ麻豆| 大学生久久香蕉国产线观看| 国产91精品久久| 欧美成人aⅴ| 国产乱人激情H在线观看| 国产精品白浆在线播放| 国产原创第一页在线观看| 女人18一级毛片免费观看 | 国产精品无码影视久久久久久久| 亚洲a级毛片| 99视频在线免费看| 亚洲精品成人7777在线观看| 亚洲成年人网| 欧美午夜在线播放| 亚洲大学生视频在线播放| 97久久免费视频| 国产精品自在拍首页视频8| 蜜臀AV在线播放| 亚洲国产系列| 亚州AV秘 一区二区三区 | 夜夜操国产| 久久亚洲综合伊人|