汪峰, 周鳳星, 嚴保康
(武漢科技大學信息科學與工程學院, 武漢 430081)
滾動軸承是大多數生產流水設備和運輸設備的核心[1]。一旦出現了故障,輕則造成生產停止,工廠效益受到影響,重則造成人員傷亡,影響整個作業間人員的生命安全。因此,對滾動軸承的各種類型故障進行精確診斷和定點維修具有重要的工程意義。
現代化的軸承故障診斷大多依托人工智能算法方法,首先需要采集軸承運行狀態時的各種故障振動信號,然后從振動信號中提取出數學特征,再輸入到人工智能算法中進行狀態識別以完成故障診斷[2]。振動信號的特征提取一直是這一流程中的關鍵的一環。楊婧等[3]提出了將信號相關度分析方法和網格搜索算法結合來進行特征提取。王圣杰等[4]將集合經驗模態分解引進到希爾伯特黃變換(Hilbert-Huang transform,HHT)實現對HHT的改進,將改進的HHT結合拉普拉斯變換進行特征提取。韓松等[5]通過比較了不同算法的標準差和拉依達準則對數據進行了預處理,再通過主成分分析(principal component analysis,PAC)降維特征數據實現了特征提取。
經驗模態分解(empirical mode decomposition,EMD)依據信號自身的局部特征進行自適應分解成若干個本征模態函數(intrinsic mode function,IMF)分量,廣泛應用于滾動軸承復雜、波動的振動信號的特征提取[6]。時域信號包含的信息量大,是機械故障診斷的原始依據,通過選擇和考察合適的信號時域參數可以對不同類型的故障做出準確的判斷[7]。提取出來的多維特征量之間的相關性容易影響故障診斷率且多維特征量不利于支持向量機算法(support vector machines,SVM)的訓練和預測,而主成分分析是一種可以有效消除數據的冗余、復雜信息并對其進行壓縮的方法。鑒于此,現選擇將EMD分解得到的IMF分量的上、下包絡值矩陣的奇異值和時域特征參數作為特征量來提取,提取出兩種特征量后使用PCA降維融合成新的融合特征量完成特征提取,再將融合特征量輸入到SVM模型中以實現軸承故障信號更精確的診斷。
EMD算法本質是依據振動信號的特征時間尺度得出一套流程來對原始信號多次篩分,最終篩選出多個IMF分量[8]。各IMF分量必須滿足下面兩個條件:極值點的個數與過零點的個數必須相等或最多相差1個;信號局部極大值與局部極小值確定的包絡線的均值為零。其算法流程如圖1所示。

n為循環次數;hn為原始信號x(t)與上下包絡線均值序列mn的 差序列;c(n)為分離出的各IMF分量;rn為余項序列圖1 經驗模態算法流程Fig.1 Empirical modal algorithm flow
(1)對EMD分解出來的IMF分量c1(t),c2(t),…,cn(t)進行Hilbert變換[9],則有

(1)
式(1)中:ci(t)為各個IMF分量;t為時間;τ為積分變量。
(2)再求出每個IMF分量的包絡:

(2)
(3)由式(2)得到的振動信號的包絡值矩陣記為C,假設C為m×n階矩陣,由奇異值分解理論可知,存在正交矩陣U=[u1,u2,…,um]∈Rm×m和V=[v1,v2,…,vn]∈Rn×n,其中:um和vn分別為矩陣U和V的最后一列。使得
UTCV=diag[σ1σ2…σp]=S
(3)
則矩陣C的奇異值分解為
C=USVT
(4)
式(4)中:σ1≥σ2≥…≥σp≥0;σi(i=1,2,…,p)為C的奇異值;diag為取對角矩陣;S為奇異值組成的對角矩陣;矩陣U和V是C的奇異向量矩陣。
標準SVM分類算法是二分類算法,只能將樣本分為兩類。軸承的故障類型往往不止兩類,所以要用到SVM多分類器。SVM多分類器采用“一對一”算法[10],即在樣本中任意選擇兩類訓練成一個標準SVM分類器,N類樣本則得到N(N-1)/2個標準SVM分類器。在預測過程中,將測試樣本依次輸入到這N(N-1)/2個標準SVM分類器,每個分類器都會預測出一個結果,然后統計出次數最多的預測類別即被認定為最終結果。標準SVM分類過程如下。
(1)將兩個不同類別的樣本(訓練樣本)的標簽分別定義為1和-1。
(2)選定核函數類型,求解最優朗格朗日乘子a*。

(5)
式(5)中:ai為拉格朗日乘子;K(xi,xj)為核函數;aj、bi、bj為推導過程變量。
(3)將任一支持向量X代入到式(6)中求偏差值b*得出判別公式f(X)構建SVM模型,將測試樣本的屬性值輸入到SVM模型,根據判別公式f(X)輸出的值將測試樣本分類。

(6)
PCA是一種廣泛用于特征降維融合的方法,通過線性變換將數據從高維空間映射到低維空間,消除了數據本身冗余、復雜的相關成分從而能更容易地對數據進行處理。將振動信號樣本用向量矩陣表示成X=[x1x2…xn],xi為設備的各種故障信號,第l列Xl=[x1lx2l…xnl]T表示樣本的特征量。其協方差矩陣[11]為

(7)
Sxui=λiui,i=1,2,…,n
(8)
計算樣本xj和樣本均值的差再與特征向量ui相乘得到對應的主成分分量為

(9)
所求特征向量構成n維正交空間,將樣本投影到該空間即可得到對應的n維主成分量。定義累計貢獻率為

(10)
通常當累積貢獻率θ≥0.95時,認為這l個主元包含了原始數據95%以上的信息,可用l個主元來表征原始數據,達到降維融合的目的。
由于振動信號的復雜性和不確定性,單一特征量無法全面地表征軸承振動信號故障特征信息,從而難以確保故障診斷準確率。因此,從軸承振動信號中提取出IMF分量上、下包絡值矩陣的奇異值和原始信號的各種時域特征參數后,然后利用PCA將這兩種故障特征量融合后得到信息互補的特征量,最后使用SVM進行故障診斷,故障診斷步驟如圖2所示。

圖2 故障診斷步驟Fig.2 Trouble shooting steps
實驗的軸承數據選擇美國凱斯西儲大學軸承數據中心發布的軸承故障信號[12]。實驗軸承為SKF6205深溝球軸承,電機荷載為0 hp,電機近似轉速為1 797 r/min,采樣頻率為12 kHz,數據長度為2 048個點,具體的樣本集如表1所示,樣本集中4種狀態下振動信號的時域圖如圖3所示。

表1 樣本集Table 1 Sample set

圖3 4種狀態振動信號Fig.3 Four state vibration signals
EMD分解無須預先設定任何基函數,對任一信號具有自適應分解能力,分解的結果是唯一的,通常前幾個IMF分量具有原始信號的主要信息[13]。所以本文選擇對前5個IMF分量進行分析,圖4為內圈故障1信號EMD分解的前5個IMF分量。由于篇幅有限,只給出圖4中分量IMF1的上下包絡圖,如圖5所示。
IMF分量突出了信號的局部特征且都是調幅調制信號,這樣對IMF分量進行包絡分析有利于特征提取。現在需要對包絡信號定義一個合適的描述參數來作為特征量,奇異值是信號矩陣的固有特征且具有很好的穩定性,所以將奇異值作為特征向量顯然是可以的。圖6為前5個IMF分量上、下包絡奇異值對比。

圖4 內圈故障1信號前5個IMF分量Fig.4 The first five IMF components of the inner ring fault 1 signal

圖5 分量IMF1的上下包絡圖Fig.5 Upper and lower envelope diagram of component IMF1

圖6 前5個IMF分量上、下包絡奇異值對比Fig.6 Comparison of the upper and lower envelope singular values of the first five IMF components
從圖6中可以看出,奇異值的差異性逐漸在減小,這也說明了EMD分解的前幾個IMF分量包含了原始信號大部分特征信息。為了從原始信號中挖掘出更多有用的特征信息以提高故障診斷準確率,選取前5個IMF分量。
軸承運行狀態的改變引起振動信號的改變從而導致時域特征參數的變化,時域特征參數包含了其最根本的特征信息。在對每個樣本提取出前5個IMF分量上、下包絡值矩陣的奇異值后,再計算樣本的13個時域特征參數,依次是最大值、最小值、峰峰值、均值、方差、標準差、均方根、峭度、偏度、波形指標、峰值指標、脈沖指標、裕度指標,即對每個樣本提取出23維特征向量。所選時域特征參數計算如表2所示。
奇異值和時域特征參數包含了不同角度的故障信息,將它們進行融合將得到比信號單一特征更為敏感的特征向量。將得到的23維特征向量進行基于PCA的特征量融合,提取累計貢獻率達到95%的主成分。經過PCA融合后,得到各主成分的貢獻率及累積貢獻率如表3所示。
從表3中可以看出,前5個主成分的累積貢獻率已經達到了95.41%,因此,可以將前5個主成分代替原來的高維特征向量,剩余的主成分貢獻率所占比重不到5%可以看作噪聲成分而忽略不計。這樣原來的23維特征向量被降維融合成了5維融合特征向量(前5個主成分)。同一故障尺寸不同狀態和同一狀態不同故障尺寸(以內圈故障為例)的前3個主成分繪制的樣本空間三維圖如圖7和圖8所示。

表2 所選時域特征參數

表3 主成分貢獻率及累積貢獻率

圖7 同一故障尺寸不同狀態前3個主成分樣本分布圖Fig.7 The sample distribution diagram of the first three principal components of the same fault size in different states

圖8 同一狀態不同故障尺寸前3個主成分樣本分布圖Fig.8 Distribution diagram of the first three principal component samples of different fault sizes in the same state
從圖7和圖8中可以看出,同一狀態不同故障尺寸的故障信號分離情況較好,而同一故障尺寸不同狀態的故障信號也基本得到分離,只有正常和滾動體1這兩種狀態出現了少部分干涉現象。下面將使用SVM進行更精確的故障診斷,將表1樣本集的10種類型的樣本標簽依次定義為0、1、2、3、4、5、6、7、8、9。將樣本進行PCA融合提取出融合特征向量后,對訓練集進行SVM算法訓練建立起SVM分類模型后,將測試集輸入到模型中進行分類識別。為了驗證融合特征量診斷的優越性,同樣對表1樣本集提取出前5個IMF分量的能量熵后輸入SVM中進行故障診斷。能量熵和本文融合特征量的分類結果如圖9所示。
由圖9可知,能量熵的分類準確率為90.6%,融合特征量的分類準確率達到了98.6%,診斷準確率有了明顯的提升。
對滾動軸承的故障診斷問題進行了研究,得到以下結論。
(1)使用PCA將奇異值與時域特征參數兩種不同的特征量相融合以提高故障的診斷準確率,結果表明融合特征量比常用的特征量診斷效果要更好。
(2)基于PCA的特征量融合能夠將不同角度的特征信息進行融合得到更為敏感的特征,剔除了無用、冗余、復雜的特征信息從而更簡潔、全面地表征了滾動軸承各種運行狀態。