謝中敏,沈寶國,胡 超
(江蘇航空職業技術學院航空工程學院,江蘇鎮江 212134)
軸承作為旋轉機械的核心部件,其故障信息經常被反映在振動信號中。但受制備材料、工作環境等影響,致使軸承壽命離散度較大,且其振動信號常受到其他部件的影響,導致對軸承故障狀態識別的難度較大[1]。
軸承故障振動信號是典型的非平穩信號,部分振動信號處理方法難以描述非平穩信號的局部信號特征,但經驗模態分解法(Empirical Mode Decomposi‐tion,EMD)能夠將振動信號分解為若干個本征模態(Intrinsic Mode Function,IMF)分量[2-3],從而凸顯出信號的局部特征。且針對單通道混疊信號的另一種處理方式是利用獨立分量(Independent Component Analysis,ICA)有效地分離振動信號中的故障特征信息,剔除噪聲信號的干擾,從而進行頻譜分析[4]。王志等[3]對軸承振動信號進行EMD 分解,將IMF 作為故障特征樣本,采用融合和算法對滾動軸承故障樣本進行診斷并取得較好的診斷結果;張健等[5]同樣采用EMD 對滾動軸承振動信號進行分解并采用變量預測模型對軸承故障進行診斷。但EMD 分解會產生欠包絡、端點效應等問題[6],而使用ICA需要構建有效的信號輸入矩陣。
由于振動信號分析帶來的諸多因素,許多學者對振動信號進行處理后,基于部分神經網絡具備的模糊診斷性能實現軸承故障特征識別。皮駿等[7-8]基于軸承振動信號時域特征參數,結合遺傳算法[7]、量子遺傳算法[8]、極限學習機[7-8]等對軸承故障進行診斷并取得較好的結果;陳超宇等[9]利用全矢深度學習網絡對軸承故障樣本進行診斷;殷鍇等[10]將BP 神經網絡用于故障診斷;馬圣[11]基于試驗室軸承故障信號,利用經驗模態分解法對軸承故障振動信號進行處理,并結合優化算法優化的極限學習機實現軸承故障診斷;鄭蒙福等[12]基于滾動軸承信號的集總經驗模態分解的能量特征,結合單純進化算法優化的支持向量機實現軸承故障診斷。但不少學者直接對采集的振動信號進行時域特征處理[6],導致得到的特征信息中也存在干擾信息。為了避免由于振動信息摻雜帶來的干擾,本文采用EMD 對振動信號進行分解,利用能量貢獻度篩選IMF 分量進行信號重構,通過ICA 實現振動信號的分離;對處理后的信號進行特征參量提取,考慮到提取特征參量之間的耦合性、高維性,采用遺傳算法進行最優特征選擇,并用遺傳算法優化的極限學習機實現軸承故障診斷。
軸承通常被包裹在旋轉機械的內部,通過振動加速度采集到的振動信號較弱,且包含各種復雜的機械噪聲信號與部分由試驗設備等造成的干擾信號。對此,采用最小二乘法擬合法消除由于采集系統或者振動信號本身原因所導致的信號漂移現象。
采集到的振動信號中通常包含著多種微弱振動信號,極有可能淹沒由軸承故障引起的高頻沖擊信號。EMD 是一種非常適用于處理非平穩信號的時頻處理方法[2],其主要思想是將振動信號x(t)進行分解,直到不滿足前提假設條件時為止,分解得到的一系列獨立分量從不同角度反映著振動信號。
振動信號x(t)極有可能由不同振動源組合疊加而成,因此在處理振動信號時如果能夠準確識別振源,對于故障識別頗受裨益。快速ICA 能夠從復雜混疊信號中提取相互獨立的信號源[2]。
基于上述分析,本文在對振動信號進行后續處理時,采用“最小二乘法+EMD+ICA”的模式對采集到的振動信號進行降噪處理,剔除信號x(t)中的干擾項,其降噪流程如圖1所示。
降噪方法的基本步驟如下:
(1)對軸承振動信號x(t)進行最小二乘法趨勢消除分析,并對振動信號數據進行指數平滑法處理;
(2)對步驟(1)處理得到的振動信號進行EMD 分解,得到1組不同尺度的IMF分量;
(3)計算IMF分量的信息熵增益比,計算方法如下:
a.對IMF分量進行歸一化處理

式中:λi'為處理后的IMF 分量;λi為IMF 分量降序排列后的第i個分量;d為IMF分量的數量。
b.計算第i個分量的熵值pi

c.計算第i個分量熵值pi的增益比gi

(4)對篩選信息增益比大于0.1 的前幾個分量進行重構得到信號x(t)';
(5)將x(t)與x(t)’作為ICA 的輸入矩陣,令其均值0 進行去中心化和白化處理,隨機選擇初始權值wp;
(6)通過一系列迭代計算,當wp收斂時可得到分離矩陣和分離信號。
文中所采用的滾動軸承故障振動數據源自美國西儲大學的軸承數據中心[13]。軸承故障模擬試驗臺如圖2 所示。試驗臺主要包括:1500 W 的電機、扭矩頻編碼器、功率計、加速度傳感器、控制電子裝置等(圖中未給出);軸承類型為6205-2RS-JEM-SKF,其基本尺寸參數見表1。在試驗中,電機轉動頻率為1730 r/min,采用頻率為48 kHz。采用整周期采樣,獲取到內環故障、外環故障以及滾動體故障的振動信號,其中某個整周期的時域振動信號如圖3所示。

圖2 軸承振動分析試驗臺和采集裝置

表1 6205-2RS-JEM-SKF型軸承參數

圖3 滾動軸承振動信號的時域波形
采用第1 章中提到的方法對滾動軸承振動信號進行降噪處理,內環故障的振動信號經過最小二乘法和指數平滑法處理后的效果如圖4 所示。從圖中可見,軸承振動信號的采集確實存在一定的微弱漂移現象;并且經過平滑處理后,振動信號的趨勢變化更為直觀可見。

圖4 最小二乘法消除趨勢項
對振動信號進行EMD 分解,外環故障振動信號的EMD 分解如圖5 所示;計算內、外環故障以及滾動體故障振動信號的IMF 分量的信息熵增益比,如圖6所示。從圖中可見,不同故障類型的振動信號被分解成的IMF 分量數量不一,且其所包含的信息量不同,選擇信息增益比大于0.1 的IMF 分量實現信號重構,得到x(t)'。將x(t)與x(t)'作為ICA 的輸入矩陣,對振動信號進行分解,軸承內環故障信號分解如圖7所示。

圖5 外環故障信號的EMD分解

圖6 IMF分量的信息熵增益比

圖7 軸承內環故障
從圖中可見,IC2分量相比于IC1分量沖擊特性更加明顯,且其頻域變換后IC2的特征頻譜相比更易突出。因此,后續特征參量提取基于ICA 分離后得到的IC2分量。
但通過頻譜對故障特征進行識別,尤其是針對軸承而言,需要先根據待檢測物體尺寸計算故障特征頻率,隨后從頻譜中尋找是否存在相關故障特征頻率的倍頻存在,從而判斷故障。在識別過程中為降低人工干預,采用遺傳算法優化的極限學習機對軸承健康狀態進行診斷。
在時域分析中,通常使用能夠反映振動信號在時域上的幅值和能量的指標[2,7]:平均值、絕對平均值、峰峰值、均方根值;能夠反映振動信號在時域上分布的指標:標準差、偏度、峭度、脈沖因子、波形因子、波峰因子、變異系數、方差。這些指標的部分值見表2。
工程項目質量,由于其影響因素多,波動大、變異大、隱蔽性以及終檢局限大等特點,造成工程項目質量管理中往往會不可避免地出現一些問題,工程項目質量管理不是一個單一的短期的過程,而應該是一個長期的系統的過程。施工項目質量控制的系統過程主要分為事前質量控制,事中質量控制和事后質量控制。

表2 時域特征參量
考慮到時域特征中部分特征之間的耦合性和特征指標數量的高維性,如果直接進行故障診斷不僅造成診斷時間延長,同時還會造成診斷效果較差。因此,利用遺傳算法對輸入變量進行降維操作。
利用遺傳算法對自變量降維時,需要將解空間映射到編碼空間中,而每個編碼則表示一種解。在變量篩選過程中,變量要么被選中要么被舍棄,選中的變量對應的基因值賦值為“1”,否則賦值為“0”。采用遺傳算法在降維過程中,通過計算檢驗集樣本的誤差值判斷變量的舍棄,如果變量的加入使得誤差值減小,則選擇,否則舍棄。
由于每類故障有960 組樣本集,3 類軸承故障共計2880 組數據,隨機選擇2000 組數據集作為訓練樣本集,另隨機不重復選擇300 組數據集作為校驗集數據,剩下的580 組數據作為測試集樣本數據。由于神經網絡隨機初始值導致的不可復現問題,篩選變量時需在相同條件下重復試驗100 次,記錄每次試驗的校驗集誤差值,求得的平均誤差變化如圖8 所示;選擇出現頻率大于50次的特征參量作為最優特征,在100次試驗下各特征被選中的次數如圖9 所示。因此,最優特征參數為:平均值、絕對值、峰峰值、均方根值、偏度、峭度、脈沖因子、波峰因子,其部分數值結果呈現見表3。

表3 最優的時域特征參量

圖8 自變量降維過程的適應度函數進化過程

圖9 100次試驗下各變量被選中的頻率
Huang 等[14]提出極限學習機(Extreme Learning Machine,ELM)算法,用于克服單隱層前饋神經網絡訓練速度慢、容易陷入局部極小點而難以達到全局最優等缺點。且ELM 算法隨機產生輸入層與隱含層連接權值和隱含層閾值,便能逼近任意非線性分段函數[15]。但極限學習機相比傳統神經網絡需要更多的隱含層神經元,且由于隨機賦予輸入權值和閾值,可能會導致病態問題出現[16]。針對這一問題,本文利用遺傳算法優化ELM,并用于故障診斷中。
3.2.1 遺傳算法
遺傳算法是一種生物種群優化算法,其基本思想是通過對種群中的個體進行交叉、變異等操作實現最優種群的選擇,其詳細理論可參考文獻[11]。遺傳算法具有實用、高效、魯棒性強的優點,但在求解非線性問題時容易出現早熟現象,從而使算法不能跳出局部極值。為避免這種情況的出現,文中采用自適應變異概率,即:對高于種群平均適應度的個體采用較低的變異概率,而對低于種群平均適應度的個體采用較高的變異概率。
3.2.2 遺傳算法優化的極限學習機
診斷模型的基本步驟如下:
(1)根據提取的時域特征參數量,設置降維模型中遺傳算法的參數并初始化種群;
(2)經過選擇、交叉、變異操作,產生新的種群,并計算校驗集樣本的誤差;
(3)根據誤差選擇特征變量,重復進化種群直至滿足終止條件時輸出最優特征變量;
(4)對最優特征參量數據集進行非重復劃分,并設置優化模型中的遺傳算法相關參數;
(5)經過選擇、交叉、變異操作,產生新的種群,并計算種群適應度值;
(6)根據適應度值選擇最優個體;
(7)重復步驟(5)并實時更新最優個體,直至滿足終止條件為止;
(8)輸出ELM 網絡的最優參數值,并根據Moore-Penrose計算ELM輸出矩陣。
文中涉及到遺傳算法優化極限學習機診斷模型為一整體,是指診斷方法主要包括如下過程:信號的處理、特征提取、降維和診斷,其診斷過程如圖10 所示,圖中紅色虛線表示誤分類。

圖10 EMD-FASTICA 與遺傳算法降維的極限學習機診斷方法
為了驗證文中提出的故障診斷方法,從是否去噪、是否降維并結合常見的BP神經網絡、支持向量機出發,分析本文方法的可行性。
對算法中涉及的參數進行如下說明:遺傳算法種群數量為30,最大進化代數為100,交叉概率為0.6,變異概率為0.05,初始基因值為[-0.5,0.5];極限學習機網絡輸入神經元數量等于輸入變量維度,隱含層神經元數量為30,激活函數采用sigmoid(),輸出神經元數量為3;BP 神經網絡采用3-7-1 的網絡結構;支持向量機隨機初始化罰參數和核參數;在遺傳算法優化的極限學習機中,從數據樣本集中隨機不重復地選擇1660 組數據作為訓練集數據、隨機不重復地選擇500組數據作為校驗集數據,剩下的720 組數據作為測試集數據;在未優化的極限學習機中,隨機不重復地選擇2160組數據作為訓練集數據、剩下720組數據作為測試集數據。
利用本文提出的方法及對比方法對軸承故障樣本數據實施診斷,其診斷結果見表4。為了方便分析,對結果進行分類整理,如圖11、12所示。
從表4 中可見,故障樣本數據經過降噪、降維處理后的診斷效果與未降噪、未降維的效果存在差異,其規律很好地被展示在圖11、12中。從圖11中可見,振動信號經過降噪處理并對振動特征參數進行降維處理后,診斷效果均存在明顯改善;從圖12 中可見,振動信號經過降噪處理后相比未降噪,其診斷結果也存在明顯差異;通過對表4 的診斷結果數據進行分析發現,經過降噪并降維處理后,診斷效果最好;且相比于ELM、SVM和BP,GA-ELM 的診斷效果最優,其對3種故障的平均診斷正確率達到90.67%,而其它3種分別為87.36%、81.35%和81.56%。

表4 故障診斷結果

圖11 軸承故障樣本數據診斷結果(降維)

圖12 軸承故障樣本數據診斷結果(未降維)
通過試驗仿真發現:(1)ICA 能對混疊信號進行有效分離,實現更具故障特征信息的提取;(2)特征變量的降維不僅能夠降低計算維度,同時也能提升診斷方法的準確率;(3)經過優化后的診斷網絡,其故障識別率相對提升;(4)文中提出的軸承故障診斷方法能夠有效地實現故障診斷,其準確率能超過90%,具有明顯優勢,而ELM、SVM 和BP 3 種診斷模型正確率分別為87.36%、81.35%和81.56%。