申永軍, 段春宇, 王杜娟,楊紹普
(1.石家莊鐵道大學機械工程學院 石家莊, 050043)(2.中國中鐵工程裝備集團有限公司 鄭州, 450016)
?
基于α穩定分布和支持向量機的軸承模式分類*
申永軍1, 段春宇1, 王杜娟2,楊紹普1
(1.石家莊鐵道大學機械工程學院 石家莊, 050043)(2.中國中鐵工程裝備集團有限公司 鄭州, 450016)
針對滾動軸承發生故障時振動信號表現出來的脈沖特性,提出了一種基于α穩定分布和支持向量機的模式分類方法。介紹了α穩定分布的定義和概率密度函數,并與故障軸承振動信號的概率密度函數曲線進行比較,證明了具有脈沖特性的軸承振動信號符合α穩定分布。用小波包分解技術對不同類型的軸承實測數據進行分解,并提取相應特征參數作為特征向量,建立支持向量機診斷模型,進行特征模式分類。通過與傳統的基于峭度和方差的模式分類方法進行比較,表明該方法具有較高的診斷準確性。
α穩定分布; 小波包分解; 支持向量機; 故障診斷
α穩定分布又被稱作非高斯穩定分布和重尾分布,是滿足廣義中心極限定理的一類分布。α穩定分布概念提出后,在信號處理領域得到了廣泛的關注。不同領域的人員進行了大量關于α穩定分布噪聲下的信號處理研究[1-5],也在故障診斷領域進行了一定研究。李長寧等[6]提出了α穩定分布的擬合方法并初步用于滾動軸承故障診斷。師寧寧等[7]提出了利用α穩定分布對齒輪進行故障識別的新方法。
機械故障診斷用到了很多信號處理和特征提取方法[8-9]。在機械故障診斷領域,關于α穩定分布理論的研究還不深入,實際應用的很少。滾動軸承發生故障時反映到振動信號上最明顯的就是脈沖特性,表現出極強的非線性和非平穩特征。這種具有脈沖特性的故障振動信號的概率密度分布需要更高精度的處理技術去擬合,而α穩定分布能夠精確地描述具有脈沖特性的信號。基于此,筆者提出了用α穩定分布來擬合具有脈沖特性的滾動軸承振動信號的思路,進一步利用小波包分解技術獲得不同頻段信號,得到了不同故障軸承振動信號的特征參數并作為特征向量,應用支持向量機進行故障模式分類。
如果隨機變量X存在參數0<α≤2,γ≥0,-1≤β≤1和實數a,使其特征函數具有式(1)的形式,則隨機變量X服從穩定分布[10]
(1a)
(1b)
其中:α為特征指數,決定該分布的脈沖特性程度;β為對稱參數,表征α穩定分布概率密度曲線的偏斜程度;a為位置參數;γ為分散系數,表示α穩定分布圍繞位置參數的分散程度。
當α=2時,α穩定分布退化為高斯分布,即高斯分布僅是α穩定分布的一個特例。一般的α穩定分布的概率密度函數沒有統一的封閉表達式,但可以得到標準的α穩定分布(a=0,γ=1)的概率密度函數的冪級數展開式。特別是當β=0時,稱為對稱α穩定分布(symmetricalαstable distribution, 簡稱SαS分布)。標準SαS分布的概率密度函數為
(2)
圖1給出不同α值所產生的標準SαS分布噪聲隨機序列;圖2給出了不同α值所對應的α穩定分布的概率密度函數曲線及其拖尾細節。

圖1 不同α值產生的隨機序列
從圖1可以看出,服從α穩定分布的樣本具有明顯的脈沖特性,非常適合描述滾動軸承等機械部件中的沖擊型故障信號。從圖2可以看出,α穩定分布的PDF曲線比高斯分布的PDF曲線有更顯著的尖峰,卻比高斯分布有更厚重的拖尾,且α值越小,拖尾越厚。因此,α穩定分布相比于高斯分布更適合描述脈沖沖擊型的隨機變量。
2.1 仿真信號處理
由于滾動軸承的故障信號具有明顯的脈沖特性,在統計信號處理方法的研究中,將其假設為高斯分布則會帶來較大誤差。以一組滾動軸承故障仿真信號為例,畫出它的概率密度曲線圖,分析其與高斯分布曲線的差異。


圖2 不同α值的概率密度函數曲線及拖尾細節
用兩個諧波頻率調制一個指數衰減的脈沖來仿真滾動軸承的脈沖信號,仿真表達式為
x(k)=e-qt'(sin2πf1kT+1.2sin2πf2kT)
(3)
其中:t'=mod(kT,1/fm);q=550;fm=100 Hz;f1=3 000 Hz;f2=8 000 Hz;采樣間隔T=1/25 ks;q,fm,f1,f2分別表示指數頻率、調制頻率和兩個載波頻率。
仿真信號時域波形如圖3所示。

圖3 未加噪聲仿真信號時域波形
利用對數法估計得到α=0.22;γ=0.001 8。圖4給出了仿真信號、高斯分布和α穩定分布的PDF曲線。從圖中可以看出,α穩定分布能夠更準確地反映滾動軸承振動信號的概率密度分布。

圖4 仿真信號概率密度分布與高斯分布及α穩定分布的擬合曲線
2.2 實驗數據處理
筆者采用QPZZ-Ⅱ機械故障模擬及實驗平臺進行實驗。選取滾動軸承的型號為NU205EM,在無故障的滾動軸承上進行加工,制造出內圈故障、外圈故障和滾子故障來模擬實驗。對內外圈故障分別在250~1 100 r/min轉速過程中采集到28組實驗數據,然后從中隨機抽取1組進行分析,得到處理結果如圖5和圖6所示(選取的信號轉速為912 r/min)。

圖5 內圈故障信號概率密度分布與高斯分布及α穩定分布的擬合曲線

圖6 外圈故障信號概率密度分布與高斯分布及α穩定分布的擬合曲線
由圖4~圖6可知,無論是仿真信號還是實際采集到的滾動軸承故障信號,都可以很明顯地觀察到滾動軸承故障信號的脈沖特性。在相同轉速下,外圈故障的脈沖性要強于內圈故障的脈沖性,其信號分布更集中(信號分布區間更小),概率密度的尖峰更大。對于實驗數據概率密度曲線的擬合,α穩定分布的擬合精度要比高斯分布高得多,即脈沖沖擊下的滾動軸承振動信號更符合α穩定分布。
3.1 支持向量機
支持向量機(support vector machine,簡稱SVM)是從線性可分情況下最優分類平面發展而來,其核心思想是建立一個超平面作為決策曲面,使正反例之間的隔離邊緣最大化[11]。

(4)
該優化問題的約束條件為
yi[ωTΦ(xi)]-1+ζi≥0
(5)
其中:ζi為松弛因子(ζi≥0);C為懲罰因子;b為分類閾值;Φ為非線性變換函數。
松弛變量的值實際上反映了對應的點到底離群有多遠,值越大,點就越遠。C用來衡量最大間隔和最小分類誤差,太小起不到懲罰作用,太大則由于誤差的影響會導致錯誤。Φ將樣本從原空間映射到高維特征空間,并在高維特征空間中求最優分類面。
按照泛函理論,如果一核函數K(xi,yi)滿足Mercer條件,它就對應某一變換空間的內積K(xi,yi)=Φ(xi)Φ(yi),因此在高維特征空間只需進行內積運算,而不必知道Φ的具體形式。
SVM中不同的內積核函數可構造實現輸入空間中不同類型的非線性決策面的學習機,從而形成不同的算法。常用的核函數有線性核函數、多項式核函數、徑向基核函數和sigmoid核函數等,筆者采用的是徑向基核函數(radial basis function,簡稱RBF)。
3.2 特征提取
分析α穩定分布中的4個參數,其中對稱系數對于滾動軸承信號來說,一般情況下等于0或近似等于0,而對于位置參數也可以通過去均值法使其為0。因此,有效的特征參數只剩下特征指數α和分散系數γ,用對數法估計出α和γ,將α和γ作為特征進行提取。
3.3 實驗分析
將上述特征提取方法應用于軸承的故障診斷實驗中,分別對正常、內圈故障、外圈故障、滾子(深)故障和滾子(淺)故障在轉速為640~650 r/min進行數據采集,采樣頻率為4 kHz,采樣點數為65 536,得到5類樣本數據,其振動信號的波形如圖7所示。

圖7 滾動軸承振動信號
分別對每類信號估計特征指數和分散系數,可以得到2個條件屬性。考慮到每個信號是平穩的并且足夠長,因此可以將數據分段。筆者將每個信號分成30段,每段數據長度為2 000,這樣每種類型的故障就擁有了30個信號,從而產生30組2維向量。每組數據對應的狀態類型分別表示如下:1為正常狀態;2為內圈故障;3為外圈故障;4為滾子故障(淺);5為滾子故障(深)。從每個類型的30組特征向量中任意選取20組,作為訓練樣本,剩下的10組用于檢測,數據集的詳細描述如表1所示。
首先,按照LIBSVM工具箱所要求的格式準備數據集;然后,選用RBF作為核函數,獲得支持向量機模型;最后,利用獲取的模型進行測試。根據懲罰因子C的不同得到如表2所示結果。

表1 滾動軸承數據集
表2 不同參數下各種狀態類型的故障診斷結果
Tab.2 The fault diagnosis results of various types with different parameters

Cg準確率/%12345 10.7 6070100100400.076070100100400.0076070100100400.0007607010010040100.7 9070100100400.077070100100400.0076070100100400.00076070100100401000.7 10070100100400.079070100100400.0079070100100400.000790701001004010000.7 10070100100500.0710070100100400.0079070100100400.0007907010010040100000.7 10070100100500.0710070100100500.00710070100100400.0007907010010040
實驗結果表明:直接應用特征指數和分散系數進行分類,對于外圈故障和滾子故障(淺)的故障分離效果相當明顯;懲罰因子對實驗結果具有一定的影響,通過改變懲罰因子可以提高故障診斷的準確率;g對結果的影響不是很大。為了對比基于特征指數和分散系數的分類方法與基于峭度和方差的分類方法的效果,筆者做了基于峭度和方差的支持向量機故障診斷實驗,結果如表3所示。
相比于基于峭度和方差的支持向量機故障診斷實驗效果,基于α穩定分布的支持向量機故障診斷方法的效果相當明顯。然而對于內圈故障和滾子(深)故障并不能通過選擇最優懲罰因子得到很好的分離效果。究其原因,是僅此兩個特征參數所構成的向量維數過少,無法滿足分類要求。
表3 基于峭度和方差的故障診斷結果
Tab.3 The fault diagnosis results of various types based on kurtosis and variance

Cg準確率/%1234510.7 50508040300.0750508060400.00740508060400.00073040808040100.7 50507040400.0750508060400.00730508050400.0007504080100401000.7 60606040300.0750506060400.00750408060400.0007304070904010000.7 60705040400.0750508060300.00750507060400.00073060706040100000.7 70805020400.0740506060300.00750508050400.00073050807040
3.4 改進方法
為了提高分類效果,引入小波包變換,即通過小波包分解的方式進行預處理。應用小波包分解技術[12]將原始信號頻帶進行多層次劃分,進一步對多分辨分析中未做細分的高頻部分進行分解,使信號更為精細,同時擴充了向量維數。該方法的流程如下。
1) 小波包分解。利用小波包對原始信號進行雙層分解,選擇db2作為小波基函數,這樣可以得到4個反映原信號不同頻段特征的信號,此處給出內圈故障的小波包分解信號,如圖8所示。

圖8 滾動軸承內圈故障小波包分解信號
2) 特征參數提取。將小波包分解得到的4個信號分別用對數法估計其特征指數α和分散系數γ,組成一個8維的特征向量。不同工況全部特征指數α和分散系數γ的均值和標準差如表4所示。

表4 訓練數據集不同工況下特征指數α和分散系數γ的比較
從表4可以看出,5種工況的特征指數α和分散系數γ的標準差都很小,說明比較穩定,而且在不同頻段α和γ并不相同,因此α和γ可以作為滾動軸承故障診斷的特征。進行上述實驗步驟,利用支持向量機進行分類,得到改進后的實驗結果如表5所示。
利用改進后方法能夠很精確地提取故障類型,尤其是正常狀態、外圈故障和滾子故障(淺),幾乎不受懲罰因子的影響,正確率都能達到100%;而通過改變懲罰因子,內圈故障和滾子故障(深)的正確率也能達到100%。
為了說明α穩定分布在滾動軸承故障診斷中的優越性,筆者也在小波包分解的基礎上進行了基于峭度和方差的支持向量機故障診斷實驗,結果如表6所示。
表5 改進后不同懲罰因子下各種狀態類型的故障診斷結果
Tab.5 Improved results of fault diagnosis of various types with different penalty factors

Cg準確率/%12345 10.7 10040100100800.0710040100100800.00710030100100800.00071003010010080100.7 100701001001000.07100701001001000.007100601001001000.0007100601001001001000.7 100801001001000.07100801001001000.007100801001001000.00071008010010010010000.7 1001001001001000.071001001001001000.0071001001001001000.0007100100100100100100000.7 1001001001001000.071001001001001000.0071001001001001000.0007100100100100100
表6 基于峭度和方差的不同懲罰因子下各種類型故障診斷結果
Tab.6 The fault diagnosis results of various types with different penalty factors based on kurtosis and variance

Cg準確率/%12345 10.7 10100101000.0740010501000.00750040501000.00076070805040100.7 1000101000.0750020501000.00760040501000.000770605050501000.7 10100101000.0750020501000.00760040501000.0007806040505010000.7 10100101000.0750020501000.00760040501000.00078060405050100000.7 10100101000.0750020501000.00760040501000.00077060405050
通過表6能夠發現,基于峭度和方差的分類方法總是有兩類(或幾類)故障特征較為接近,不能很好地反映兩者(或多者)之間的差異,即便再增大懲罰因子,也不能獲得更為準確的判斷,分類效果不甚理想。表2中,內圈故障和滾子故障(深)診斷準確率遠低于其他狀態類型,也恰恰說明了兩類故障特征相近,不易區分;但α穩定分布的特征指數α和分散系數γ還是比傳統的峭度和方差更準確地表達了故障特征。表5充分展示了經過改進后方法的優越性,不僅能對特征較鮮明的正常信號、外圈故障和滾子故障(淺)進行準確分類,還精確地分離出了較難區分的內圈故障和滾子故障(深)。
筆者通過對軸承故障信號的概率密度函數擬合,證明了軸承故障信號更符合α穩定分布,并在此基礎上提取出了能夠反映特征信息的相關特征參數,通過小波包分解理論和特征參數構成特征向量,進而利用支持向量機對故障進行了分類。該方法計算簡單,故障分類準確率高,在故障診斷和狀態監測中應用前景廣闊。
[1] Rajan A, Epedelenlioglu C T.Diversity combining over rayleigh fading channels with symmetric alpha-stable noise[J]. IEEE Transactions on Wireless Communications, 2010, 9(9): 2968-2976.
[2] Li Sen, Qiu Tianshuang, Zha Daifeng. Adaptive blind equalization for MIMO systems under α-stable noise environment[J]. IEEE Communications Letters, 2009, 13(8): 609-611.
[3] Ma Shuang, Zhao Chunhui, Wang Ying. Fractional low order cyclostationary spectrum sensing based on eigenvalue matrix in alpha-stable distribution noise[C]∥The First International Conference on Pervasive Computing Signal Processing and Applications. Harbin, China:IEEE Computer Society,2010:500-503.
[4] 顧陳, 何勁, 朱曉華. 沖擊噪聲背景下基于最小歸一化均方誤差的波束形成算法[J]. 電子學報, 2010, 38(6): 1430-1433.
Gu Chen, He Jin, Zhu Xiaohua. Minimum mean square normalized-error beamforming amid heavy-tailed impulsive noise of unknown statistics[J]. Chinese Journal of Electronics, 2010, 38(6): 1430-1433.(in Chinese)
[5] Xia Weijuan, Zhu Lidong, Xiong Xingzhong. Fractional lower order statistics based generalized constant modulus algorithm for blind multi-user detection in DS/CDMA systems[C]∥International Conference on Wireless Communications and Signal Processing. Suzhou, China:IEEE Communication Society,2010: 1-6.
[6] Li Changning, Yu Gang. A new statistical model for rolling element bearing fault signals based on alpha-stable distribution[C]∥ 2010 Second International Conference on Computer Modeling and Simulation.Sanya,China:IEEE Computer Society,2010: 384-390.
[7] Yu Gang. Shi Ningning. Gear fault signal modeling and detection based on alpha stable distribution[C]∥International Symposium on Instrumentation & Measurement, Sensor Network and Automation. Sanya,China:IEEE Communication Society,2012: 471-474.
[8] 申永軍, 張光明, 楊紹普, 等.基于Gabor變換的欠定盲信號分離新方法[J].振動、測試與診斷, 2011, 31(3): 309-313.
Shen Yongjun, Zhang Guangming, Yang Shaopu, et al.New method for blind source separation in under-determined mixtures based on Gabor transform[J].Journal of Vibration, Measurement & Diagnosis, 2011, 31(3): 309-313.(in Chinese)
[9] 胡愛軍, 孫敬敬, 向玲.經驗模態分解中的模態混疊問題[J].振動、測試與診斷, 2011, 31(4): 429-434.
Hu Aijun, Sun Jingjing, Xiang Ling.Mode mixing in empirical mode decomposition[J].Journal of Vibration, Measurement & Diagnosis, 2011, 31(4): 429-434.(in Chinese)
[10]邱天爽, 張旭秀, 李小兵,等. 統計信號處理-非高斯信號處理及其應用[M].北京:電子工業出版社, 2004:139-172.
[11]袁勝發, 褚福磊. 支持向量機及其在機械故障診斷中的應用[J]. 振動與沖擊, 2007,26(11): 36-40.
Yuan Shengfa, Chu Fulei. Support vector machines and its applications in machine fault diagnosis[J]. Journal of Vibration and Shock, 2007,26(11): 36-40.(in Chinese)
[12]曾蕓, 武和雷. 基于小波包的頻帶能量特征提取及智能診斷[J]. 計算技術與自動化, 2008, 27(4) : 115-117.
Zeng Yun, Wu Helei. The energy characteristics on the frequency bands extracted eased on the wavelet packet and intelligent diagnosis[J]. Computing Technology and Automation, 2008, 27(4): 115-117.(in Chinese)

10.16450/j.cnki.issn.1004-6801.2015.06.011
*國家自然科學基金資助項目(11072158, 11372198);教育部新世紀優秀人才支持計劃資助項目(NCET-11-0936);河北省高等學校創新團隊領軍人才計劃資助項目(LJRC018);河北省高等學校高層次人才科學研究資助項目(GCC2014053);河北省高層次人才資助項目(A201401001)
2014-09-15;
2015-01-07
TH17; TN911
申永軍,男,1973年12月生,博士、教授、博士生導師。主要研究方向為機械系統的非線性動力學、振動控制與故障診斷。曾發表《基于分數Fourier變換的自適應信號降噪方法》(《振動工程學報》2009年第22卷第3期)等論文。 E-mail:shenyongjun@126.com