郭秀才, 吳妮, 曹鑫
(1.西安科技大學 電氣與控制工程學院, 陜西 西安 710054;2.甘肅靖遠煤業集團有限責任公司, 甘肅 白銀 730913)
在礦井惡劣的工作環境下,通風機受客觀因素、機械磨損等的影響,經常發生故障。滾動軸承作為通風機主要部件,發生故障的概率較高。據統計,通風機滾動軸承故障發生率高達30%以上[1],因此,研究礦用通風機滾動軸承故障診斷方法對煤礦安全生產具有重大意義。
滾動軸承故障智能診斷方法一般由信號采集與預處理、特征提取、故障識別、評估決策等構成,其中特征提取和故障識別最為主要。有效的信號特征提取是確保故障識別高準確率的基礎,目前多用時頻特征提取法,如小波變換、經驗模態分解(Empirical Mode Decomposition,EMD)等。鞠晨等[2]對采集的滾動軸承振動信號進行小波包分解并提取分量能量特征,通過粒子群優化算法優化BP神經網絡(Back Propagatiom Neural Network,BPNN)完成故障診斷。王林軍等[3]利用EMD分解振動信號,獲取分量并提取其能量特征,結合遺傳算法優化的BPNN完成軸承故障類型識別。上述信號特征提取方法僅提取時頻分量特征,失去了原有信號直觀特征,導致故障診斷精度不高。在時頻分量信號特征的基礎上,加入原始振動信號相關時域、頻域特征可對信號特征全面挖掘,相對精確地描述軸承運行狀態,但特征的增加會加大計算復雜度。核主成分分析法(Kernel Principal Component Analysis,KPCA)將多個高相關性變量轉換成少數包含原變量大部分信息且彼此不相關的變量,實現融合降維,減少計算量。徐衛曉等[4]提出KPCA與BPNN相結合的軸承故障診斷方法,提取振動信號的時域、頻域特征,并采用KPCA有效解決特征冗余問題,提高了故障診斷準確率。
在故障類型識別方面,目前多采用BPNN和支持向量機(Support Vector Machine,SVM)等識別方法。皮駿等[5]通過改進遺傳算法優化的BPNN完成了滾動軸承故障診斷。董建平等[6]采用改進的果蠅優化算法對SVM的懲罰因子和核函數進行優化,對滾動軸承的故障模式進行分類診斷。王圣杰等[7]將復合特征向量輸入至遺傳算法優化的SVM中,完成滾動軸承故障狀態識別。以上文獻所用的診斷網絡均屬于“淺層學習”的算法結構,要在1~2層的模型結構中完成函數擬合,導致故障診斷精度不高。深度學習通過層次化學習實現數據高效處理,具有強大的數據分析和挖掘能力[8-9]。其中深度置信網絡(Deep Belief Network,DBN)已被廣泛應用于軸承故障診斷領域中[10-11]。
針對現有礦用通風機滾動軸承故障診斷方法僅提取時頻分量特征和采用淺層網絡結構,導致故障診斷精度不高的問題,本文提出了一種基于多域特征融合與DBN的礦用通風機滾動軸承故障診斷方法。首先對原始振動信號進行小波包降噪處理,提取降噪信號相關時域、頻域特征和本征模態函數(Intrinsic Mode Function,IMF)能量特征;然后采用類內、類間標準差對特征進行篩選,通過KPCA對篩選特征進行降維融合;最后將融合特征輸入至DBN中完成滾動軸承無損傷、內圈損傷、滾珠損傷和外圈損傷4種運行狀態識別。
小波包將信號頻帶進行多層次劃分,對高頻部分進行進一步分解,并能夠根據被分析信號的特征自適應地選擇相應頻帶,使之與信號頻譜相匹配,從而提高時頻分辨率。基于小波包的滾動軸承振動信號降噪步驟如下[12]:
(1) 選擇小波基,確定一個小波的分解層次,并對信號進行小波分解。
(2) 確定最佳小波包基,在給定熵標準之后,計算最優樹。
(3) 對各個分解尺度下的高頻系數選擇一個適當的閾值進行閾值量化處理。
(4) 將信號進行小波包重構。
時域、頻域指標被廣泛應用于滾動軸承故障診斷中。利用時域參數對滾動軸承早期故障進行監測和診斷,初步判斷滾動軸承是否出現故障[13]。處于不同運行狀態的滾動軸承,其振動信號中的頻率成分、不同頻率成分的能量大小及主頻位置各具特點。時域、頻域指標見表1,其中x(i)為樣本采樣點(i為樣本序號,i=1,2,…,N,N為樣本采樣點個數),xmax(i)為樣本中絕對值最大的I個樣本點,f為頻率,S(f)為單邊譜密度函數。

表1 時域、頻域指標Table 1 Time domain and frequency domain indexes

集合經驗模態分解(Ensemble Empirical Mode Decomposition,EEMD)可以把非線性不平穩信號分解成為若干個IMF分量和1個余項[14]。滾動軸承振動信號的IMF能量特征提取步驟如下:
(1) 對樣本分別進行EEMD分解,得
(1)
式中:cl(i)為IMF分量,l=1,2,…,L,L為IMF分量個數;q(i)為余項。
(2) 計算L個IMF分量與其對應的樣本信號的相關系數,淘汰相關系數小于平均相關系數的IMF分量。

通過對滾動軸承降噪數據在時域、頻域、IMF能量特征提取,得到8+3+J維特征集F=[TPE],挖掘了信號在不同域的特征,但特征是否有效需進一步驗證。由于類內、類間標準差可衡量特征的集中和分散度,因此選用二者的比值作為衡量特征敏感度指標,對特征進行有效篩選[15]。特征敏感度指標計算步驟如下:
(1) 針對同一特征,分別對軸承4種運行狀態特征樣本求標準差Xb,再對所得4個標準差求均值,即得類內標準差Do。
(2)
(3)

(2) 針對同一特征,分別對軸承4種運行狀態特征求均值Yb,再對所得4個特征樣本均值求標準差,即得類間標準差Di。
(4)
(5)

(3) 對于某一特征,其類內標準差Do與類間標準差Di的比值為該特征的敏感度指標ξ。
(6)
當ξ<1時,ξ越小,敏感度越高,反之,敏感度越低;當ξ>1時,則該特征對區分故障狀態無意義。通過ξ對8+3+J維特征集F進行篩選,得篩選特征集F′=[T′P′E′]。
主成分分析法(Principal Component Analysis,PCA)在盡量減少信息損失的同時實現指標降維融合,達到對數據的全面分析[16]。KPCA在PCA的基礎上,采用非線性映射將原本數據空間中的非線性問題轉化為映射空間中的線性問題,以完成非線性數據的特征降維融合。采用KPCA對篩選特征集進行降維融合以降低計算復雜度。
假設F′在原始空間R上,通過φ映射將F′映射到空間Γ,得到像φ(sm),sm為特征點,則映射后的特征φ(s)的協方差矩陣為
(7)
對矩陣C作特征矢量分析,設其特征值為λ,特征矢量為V,則λV=CV。
(8)

通過計算映射數據在特征矢量V上的投影可得降維后的融合特征集:
(9)
式中k為特征矢量個數。
DBN是由多層受限玻爾茲曼機(Restricted Boltzmann Machine,RBM)和BPNN構成的深度神經網絡。網絡訓練步驟分為預訓練和整體參數優化[13]。
(1) 預訓練。DBN通過貪婪學習算法對每層RBM進行逐層訓練,上一層RBM訓練結束后,將該RBM隱含層的輸出作為下一層RBM的輸入,依次完成所有RBM參數的初始化。
(2) 整體參數優化。每層RBM經過無監督預訓練后,網絡權值僅相對該層特征向量達到最優,無法確保整體DBN網絡權值達到最優。BPNN作為DBN的最后一層,以RBM網絡的輸出作為其輸入,通過把反向誤差自頂向下傳播至每層RBM,微調整個DBN網絡的權值,從而使得整體DBN網絡權值達到最優。反向參數優化各層的權值更新公式為
Δw(t)=m(t)Δw(t-1)+η(t)w(t-1)
(10)
w(t)=w(t-1)-Δw(t-1)
(11)
式中:Δw(t)為權重增量;w(t)為DBN層間的權重,t為更新次數;m(t)為DBN層間的附加動量;η(t)為DBN層間的學習率。
基于多域特征融合與DBN的礦用通風機滾動軸承故障診斷步驟如下:
(1) 通過小波包降噪方法對軸承原始振動信號進行降噪,并劃分數據集,從4種不同狀態的降噪數據集中分別提取120個樣本,總計480個樣本,其中測試集包含336個樣本,訓練集包含144個樣本。
(2) 提取480個樣本在時域、頻域、IMF能量的特征量。
(3) 采用基于類內、類間標準差的特征敏感度指標對步驟(2)所得特征指標進行篩選。
(4) 通過KPCA對步驟(3)篩選后的多維特征集進行降維融合。
(5) 確定診斷網絡DBN的相關參數。將訓練集的融合特征輸入到DBN網絡中,以得到訓練好的DBN診斷網絡。
(6) 通過訓練好的DBN診斷網絡對測試集進行滾動軸承故障類型識別。
實驗數據選用美國 Case Western Reserve University電氣工程實驗室的原始振動數據。選取通風機軸承在相同轉速下無損傷和內圈、滾珠、外圈分別受到17.78 mm損傷的4種工作狀態,對其故障類型進行診斷。首先對數據進行降噪,然后提取各域特征及融合特征并分析特征特點,最后將不同特征集T,P,E,F′和F″分別輸入至DBN、PSO-SVM(粒子群優化支持向量機)和PSO-BPNN(粒子群優化BP神經網絡)分類器完成故障診斷并分析結果。
選用小波包對實驗數據進行分解和重構,對原始振動信號進行降噪處理。以外圈故障為例,原始信號和降噪信號如圖1所示。與原始振動信號相比,降噪后的信號在某種程度上消除了異常的尖峰信號,噪聲得到了降低。

圖1 滾動軸承外圈故障的原始信號和降噪信號Fig.1 Original signal and noise reduction signal of rolling bearing outer ring fault
時域、頻域特征根據表1獲得;通過EEMD獲取IMF分量時,設定附加高斯白噪聲的均方差為 0.2,總體平均次數為50,根據分解后的IMF分量與原始信號的相關系數選取前4個IMF分量并求取其能量特征。時域特征、頻域特征和IMF能量特征分布如圖2—圖4所示。圖中橫坐標0—120、120—240、240—360、360—480分別表示軸承無故障、內圈故障、滾珠故障和外圈故障4種狀態所對應的特征樣本。

(a) 時域特征分布1

(b) 時域特征分布2

(a) 頻域特征分布1

(b) 頻域特征分布2
從圖2可看出,有效值判斷故障類型的有效意義最大,均值特征不具有分析意義,因此直接用所有時域特征進行故障診斷會存在一定誤差。從圖3和圖4可看出,4種運行狀態下的頻域特征和IMF能量特征差異比較明顯,可進行初步故障診斷。

圖4 IMF能量特征分布效果Fig.4 The IMF energy characteristics classification effect
計算15個特征的特征敏感度指標,結果見表2。根據對特征敏感指標ξ值的界定,時域特征中,樣本均值對滾動軸承狀態的判別無意義,有效值的值最小,與以上特征分布信息的分析結果一致。因此采用特征敏感度指標不僅可以實現對無用特征的剔除,還能選取分類效果較好的特征。

表2 各特征敏感度指標Table 2 Sensitivity index of each characteristics

采用KPCA對F′降維,得到主元成分貢獻率,結果如圖5所示,前3個主元的累計貢獻率已達95%以上,故選取前3個主元做主成分,得到降維后的3維融合特征集F″,即特征1,特征2,特征3,通過式(6)求得3種特征所對應的ξ值分別為0.010,0.029,0.032,其分布如圖6所示。

圖5 主元成分貢獻率Fig.5 Contribution rate of the principal element components

圖6 融合特征分布效果Fig.6 Classification effect of fusion characteristics

為評估基于多域特征融合與DBN的礦用通風機滾動軸承故障診斷方法的分類效果,分別將特征集T、P、E、F′和F″輸入至DBN、PSO-SVM及PSO-BPNN分類器中進行結果分析和對比,各網絡參數設置如下:
(1) DBN參數設置:輸入層節點數為輸入所對應的特征維度;輸出節點數為4,代表軸承的4種運行狀態;設有2層RBM,RBM訓練迭代次數取65,學習率為0.01,反向調整時,學習率為0.01,微調次數為10。
(2) PSO-SVM參數設置:PSO慣性因子為1,參數c1=c2=1.5,迭代次數為100,種群規模為20,粒子群速度取值范圍為[-1,1],粒子群位置取值范圍為[-5,5];SVM選取徑向基核函數。
(3) PSO-BPNN參數設置:PSO慣性因子隨迭代次數增加從0.9線性遞減至0.5,參數c1=c2=2,迭代次數為100,種群規模為50,粒子群速度和粒子群位置取值范圍為[-1,1];BPNN選取3層結構,輸入節點數為輸入所對應的特征維度,輸出節點數為4,隱含層神經元節點數分別為6,4,5,6,4,學習速率為0.1,動量因子為0.9,期望誤差為0.01。
將5種特征集輸入至DBN中進行網絡訓練,得到的均方誤差曲線如圖7所示。可看出融合特征與DBN診斷網絡的均方誤差最早達到預期,且在迭代500次后很穩定,表明融合特征可提高DBN診斷性能。
將測試集輸入至訓練好的DBN、PSO-SVM及PSO-BPNN分類器中,得到的診斷結果見表3。其中,時間和準確率是指10次實驗的平均耗時和平均準確率。

(a) 時域特征-DBN

(c) IMF能量特征-DBN

(e) 融合特征-DBN

表3 不同特征層與不同診斷層結合的診斷結果Table 3 Diagnosis results of different characteristics layers and combination with different diagnostic horizons
由表3可知,對比不同特征層、相同診斷層的診斷結果,特征層為融合特征的耗時最少、準確率最高;基于特征融合與DBN的礦用通風機滾動診斷方法的診斷效率優于PSO-SVM、PSO-BPNN診斷方法。
為驗證基于特征融合與DBN軸承故障診斷方法的適應性,將軸承不同位置受到35.56 mm損傷的故障數據經過相同的處理輸入至融合特征與DBN診斷網絡中,10次實驗的平均準確率達99.78%,平均診斷時間為0.491 s,表現出良好的穩定性和泛化能力。
(1) 將時域、頻域、IMF能量、篩選、融合特征集輸入至DBN中進行網絡訓練,融合特征與DBN診斷網絡的均方誤差最早達到預期,且在迭代500次后很穩定,表明融合特征可提高DBN的診斷性能。
(2) 將測試集輸入至訓練好的DBN、PSO-SVM及PSO-BPNN分類器中,表明基于特征融合與DBN的礦用通風機滾動軸承故障診斷方法的準確率最高、耗時最少。
(3) 對于不同損傷故障數據表現出良好的穩定性和泛化能力。