俞 嘯,董 飛,高 彬,張 立
(1.徐州醫科大學醫學信息學院,江蘇徐州221009;2.中國礦業大學物聯網(感知礦山)研究中心,江蘇徐州221008;3.中國礦業大學信息與控制工程學院,江蘇徐州221008)
滾動軸承的是旋轉機械設備的重要組成部分,其健康狀態將直接影響設備的安全運轉。現有軸承故障識別研究中多采用振動信號的時域、頻域和時頻域的統計特性作為故障的特征信息[1-2],例如平均值、標準差、峰度、偏度等。常用的振動信號時頻分析方法有:小波變換[3]、短時傅里葉換[2]、魏格納-維爾分布(Wigner-Ville Distribution,WVD)[4],希爾伯特黃變換(Hilbert-Huang Transform,HHT)[5-7]等。Ali等[8]利用信號IMF分量的時域特征實現滾動軸承狀態識別;Xue[9]等分別提取軸承振動信號的排列熵等特征作為識別系統的特征向量;Zhang等[10]利用時頻域統計特征來訓練SVM來提高滾動軸承的故障識別率;Bafroui等[3]提取振動信號小波系數中故障敏感特征。上述研究中的故障診斷模型都是基于統計特征的,然而,統計特征中只能包含振動信號中部分故障相關的特征信息,無法對故障特征進行完整的描述,可能導致故障識別準確率的下降[11]。
文中利用HHT邊際譜(Hilbert Marginal Spect?mm,HMS)作為軸承故障狀態的初步特征,引入PCA方法[12-13],提取HMS的主成分信息,利用HMS主成分作為為特征向量,實現對軸承故障模式分類器的訓練,建立HHT-PCA-SVM模型,實現軸承故障模式識別,實驗結果表明PCA可以從HMS中提取出目標更加敏感的低維特征信息,從而提高類軸承故障的識別率。
Empirical Mode Decomposition(EMD)可以將x(t)信號分解為不同尺度的本征模態分量(Intrinsic Mode Function,IMF),如公式(1)

對ci(t)進行 Hilbert變換:


計算幅值函數和相位函數:

得到瞬時頻率:

x(t)的 Hilbert譜表示為:

邊際譜h(w)表示為H(w,t)的時間積分:

邊際譜h(w)代表信號的幅值在整個頻率段上隨頻率的變化的情況[5]。


可以由式(11)將xi變換為:

其中:U是一個n×n正交矩陣,ui是樣本C(協方差矩陣)的第i個本征矢量。

PCA求解過程轉換為本征矢量求解過程:

其中λi是C的一個本征值,ui是相應的本征矢量。
HMS能夠表征信號瞬時頻率特征,同時也存在大量的冗余信息。這里采用PCA對HMS進行降維處理,實現對HMS的二次特征提取,取前p維的主成分分量建立故障主成分特征向量,利用主成分特征向量對SVM分類器進行訓練[16],建立HHT-PCASVM故障分類模型。結合交叉檢驗方法和粒子群優化算法(Particle Swarm Optimization,PSO)對模型SVM懲罰因子c,核函數參數g和p參數進行優化,模型工作過程如圖1所示。

圖1 HHT-PCA-SVM分類模型
利用凱斯西儲大學的軸承故障實驗臺振動數據[16]開展實驗研究,軸承試驗臺裝置如圖2所示,由一個2HP的三相感應電動機(左側)軸和一個用于產生額定負載的測力計(右側)組成,實驗臺驅動端和風扇端各有SKF-6205-2RS軸承一個,分別對振動傳感器采集的兩端(Driver-D,Fan-D)振動信號進行分析,完成對表1所示的10種軸承狀態振動信號的識別,每個樣本為2000個采樣點構成的信號,10種故障信號各取60個樣本,共600個樣本,隨機抽取每種信號20個樣本作為訓練集,剩余40個樣本作為測試集,完成對HHT-PCA-SVM模型的訓練和測試。

圖2 CWRU軸承故障試驗臺

表1 實驗選取的驅動端軸承故障種類
首先對訓練數據集振動信號進行EMD分解,得到信號的各階IMF分量,然后對IMF分量進行Hilbert變換,求信號的HMS。計算前三階IMF分量的希爾伯特包絡譜,如圖3(b)~(d),在轉頻、故障頻率點及其兩倍頻附近(29.3 Hz,105.5 Hz,205.1 Hz)處出現明顯譜線,同時存在若干干擾譜線,圖3(e)為外圈故障的HMS。

圖3 軸承故障振動信號HHT分析
利用PCA對HMS進行降維處理,降維后選取的特征維數為p,在c和g取定值的條件下(c=8,g=1),p值和HHT-PCA-SVM模型故障種類識別準確率之間的關系如圖4所示,當p值較小時,選擇的主分量少,特征信息不足,模型識別準確率不高,隨著主成分維數的增加,模型識別率迅速準確提高,并在10~25之間達到峰值。

圖4 識別準確率和主成分維數之間的關系
為了驗證特征提取方法的有效性,分別采用時域和頻域統計參數和SVM結合的ST-SVM模型、統計參數和PCA結合的ST-PCA-SVM模型,HHT邊際譜和SVM結合的HHT-SVM模型,以及HHT-PCASVM模型對驅動端Driver-D和風扇端FAN-D軸承故障數據集實驗分析。
ST-SVM中,對振動信號進行EMD分解,提取前4階IMF分量及其希爾伯特包絡譜的統計參數構成特征向量,訓練SVM分類器。這里選取每個IMF分量的5種時域參數和5種頻域參數,具體參數見表2。在ST-PCA-SVM中,對ST-SVM進行PCA分析,提取主成分分量構成特征向量,訓練SVM分類器。

表2 時域和頻域統計特征參數
包絡譜sp(k)的能量可以表示為:

sp(k)的能量熵定義為 :

其中,

sp(k)的能量熵能夠反映IMF分量在頻域上的能量分布不確定度,不同故障狀態振動信號的能量熵值存在差異,常作為統計特性來表征故障位置和故障程度。
結合交叉驗證和PSO優化方法,對模型的最佳參數進行尋優,得到優化模型,各模型的分類效果如表3所示。

表3 各故障分類模型的分類結果
根據表3的結果可以發現,對于驅動端軸承數據集Driver-D,基于統計特性的ST-SVM和STPCA-SVM模型性能一般,而基于HMS的HHT-SVM和HHT-PCA-SVM模型可以取得較高的識別準確率。而對于風扇端軸承數據集Fan-D,ST-SVM和ST-PCA-SVM及HHT-SVM模型性能相比于數據集Driver-D均出現大幅度下降。這是由于風扇端軸承距離傳感器較遠,從振動信號中提取的信息中存在更多與故障狀態相關度低或不相關的信息,PCA方法可以從HMS中提取出目標性更強的高層特征抽象,所以HHT-PCA-SVM模型依然可以保持較高的識別準確率。
針對滾動軸承故障狀態識別問題,將振動信號的HMS作為初步特征,利用PCA算法提取出HMS中的故障狀態敏感信息,以提取出的主成分特征向量作為輸入訓練分類器,利用HHT和PCA完成特征構建,結合SVM方法提出了HHT-PCA-SVM軸承故障識別方法。利用美國凱斯西儲大學的軸承故障實驗臺開放振動數據對HHT-PCA-SVM進行實驗分析和驗證,針對驅動端和風扇端軸承分別選取10種不同位置、不同程度的故障信息進行分析。通過實驗驗證的方式分析模型參數p,g和c對識別準確率的影響,實驗結果表明,選擇合適的模型參數可以提高模型的識別準確率。對于測試集數據,HHT-SPARSESVM模型驅動端軸承故障狀態識別率為98%,風扇端軸承故障狀態識別率為97.5%,相比于ST-SVM和ST-PCA-SVM及HHT-SVM模型,HHT-SPARSESVM模型可以得到較高的故障識別率,并具有較強的適應能力。