付藝華 李 亞 朱建府
(昆明理工大學信息工程與自動化學院)
隨著我國高鐵技術的快速發展,大型軌道維護機械設備必須建立完善的故障診斷系統,才能達到國家鐵路裝備更新發展的整體要求。 滾動軸承作為大型軌道維護機械設備的精密元件,對其振動信號的故障診斷研究具有重要的理論價值和現實意義。
在故障診斷應用中,人工智能的全面發展突飛猛進,其中包括神經網絡、支持向量機等算法。神經網絡相較于支持向量機存在收斂速度慢、計算復雜等問題,而支持向量機中,核函數的選擇、正則化因子和模型參數的選擇十分困難,需要人為地不斷嘗試,影響了故障診斷的性能。 由于貝葉斯推斷方法在解決參數問題上具有一定的優勢, 因此采用貝葉斯3層推斷選擇最小二乘支持向量機 (Least Squares Support Vector Machine,LSSVM)參數(γ,σ),可以獲得最優參數模型[1]。
在此,筆者以滾動軸承作為研究對象,采用變分模態分解 (Variational Mode Decomposition,VMD)方式進行故障信號的特征提取,通過貝葉斯3層推斷理論方法獲得貝葉斯算法優化的最小二乘支持向量機(Bayesian-LSSVM)參數(γ,σ),從而得到最優故障類型模式識別模型[2],最終找到最適合滾動軸承故障診斷的方法。
2014年,Dragomiretskiy K和Zosso D首次提出了VMD[3],VMD是一種非遞歸模式信號分解方法[4]。 該方法可有效尋找變分模型最優解從而實現信號的分解,同時為了實現各個變量的有效分離和信號的時域、頻域剖分,可以通過獲得的最優解確定每個分量的頻率中心和帶寬[5]。
實際上,解決變分問題的過程就是變分模態的分解過程,能夠對信號完全分解,不存在模態混疊現象。 而解決變分問題過程又包含了變分問題的構造和求解兩部分[6]。
1.1.1 變分問題的構造
假設限制條件為每種模態的總和等于原始信號f, 變分問題描述為獲得K個模態分量uk(t)(k=1,2,…,K),達到每個模態的估計帶寬之和最小,即具有中心頻率的有限帶寬之和最小。 構造過程分為3個步驟[2]。
第1步,為了獲得每個模態分量uk(t)的解析信號, 運用希爾伯特變換計算相關的振動信號,得到模態分量uk(t)的單邊頻譜:

其中,δ(t)為沖激函數,t為時間。
第2步, 每個模態分量的解析信號通過混合指數調制到預估的中心頻率上,然后計算頻譜調制相應的基頻帶:

其中,ωk表示第k個模態分量的中心頻率。
第3步,對調解信號進行H1高斯平滑,估計出各個模態信號帶寬,則變分約束模型為:

1.1.2 變分問題的求解
變分問題的求解主要分為兩個步驟。
第1步,通過引入二次懲罰函數因子α和拉格朗日算子λ(t),確保信號重構的準確性,同時拉格朗日算子可以保持約束性,從而得到變分問題約束模型的最優解。 在存在高斯噪聲的情況下,擴展后的表達式為:



同理,通過將中心頻率的取值問題轉換到頻域,得到中心頻率的更新過程為:

VMD算法中的拉格朗日算子主要用來增強約束性,二次懲罰項主要用來提高收斂性[8]。在頻域的連續更新中,通過傅里葉變換將每個模態逆變換到時域,通過連續變換重新估計中心頻率并周期性地更新每個模態的功率譜中心[9]。 具體步驟如下:
b. 令k=0、k=k+1,當k<K時執行循環,更新uk和ωk;
LSSVM擴展于支持向量機(SVM),其主要思想是將二次規劃問題轉化為求解線性方程的問題,并用等式約束條件代替標準SVM的不等式約束條件,降低計算的復雜度[10]。 線性可分情況下的分類超平面如圖1所示。
由圖1可知,LSSVM就是將兩種不同類型的滾動軸承故障數據分離并遠離這個超平面,以獲得更好的分類效果, 從而提高準確率和效率,獲得故障分類結果。 假設給定一個有n個數據的訓練樣本{xi,yi}(i=1,2,…,n),其中輸入數據xi∈Rm(m為R空間的維數),輸出數據yi∈R。則最優線性回歸函數可代表函數擬合問題:

其中,w∈Rm為權向量,φ(x)為非線性函數,b為常數且b∈R。

圖1 線性可分情況下的分類超平面
最小二乘向量機采用ξi平方項方法來優化指標,所以優化指標和約束條件分別為:

其中,ξi≥0為松弛因子,c>0為懲罰參數。
根據式(9)、(10)將模型進行變換,引入拉格朗日函數L:

其中,ai為拉格朗日乘子。
為使得實際風險最小,得到如下等式約束條件:


根據KKT最優條件,消去w和ξ后整理可得:

其中,a=[a1,a2,…,an]T,y=[y1,y2,…,yn]T,e為元素為1的n×1向量,I為n×n的單位陣,G=[φ(x1)T,φ(x2)T,…,φ(xn)T]T。
通過最小二乘法求解方程(13)即可得到a和b的值,則LSSVM的擬合模型為:

其中K(x,xi)為核函數。
由軸承故障診斷的特點可知,決定LSSVM學習精度和泛化能力的重要參數是超參數,一般采用交叉驗證方法確定傳統LSSVM超參數(γ,σ),但此方法耗時久,且不適用于大樣本建模。 故筆者提出采用貝葉斯優化參數算法來優化估計超參數(γ,σ),其基本思想是在最大化參數分布的后驗概率時獲得最優的參數值。 貝葉斯優化參數算法主要包括以下3層推斷。
第1層,模型參數的推理,即w和b的推斷。給定訓練集D={xk,yk}Nk=1(其中N為維數空間)和模型H中的正則化參數γ,則由貝葉斯準則可以得到:

其中,證據概率分布P(D|lgμ,lgξ,H)為一個標準化的常數,P(w,b|lgμ,lgξ,H)為先驗概率,P(D|w,b,lgμ,lgξ,H)為相似度。
第2層,正規化參數的推理,即參數μ、ξ和γ的推斷。 假設P(lgμ,lgξ|H)=P(lgξ|H)P(lgμ|H),利用貝葉斯法則可以由訓練集D推斷出:

第3層,網絡結構的推理,即核函數的推斷。通過選擇不同的核函數,可獲得不同模型的后驗概率,將貝葉斯法則應用到Hj可以推斷出:

通過最大化P(D|Hj)即可求得最優的核函數系數。
基于VMD與Bayesian-LSSVM的滾動軸承故障診斷方法流程如圖2所示。

圖2 基于VMD與Bayesian-LSSVM的滾動軸承故障診斷方法流程
基于VMD與Bayesian-LSSVM模型對滾動軸承故障診斷的識別過程如下:
a. 處理滾動軸承振動信號數據。對滾動軸承的外圈故障信號、內圈故障信號和滾動體故障信號進行數字化處理。
b. 初始化相關參數。對變分模態分解在處理滾動軸承外圈故障信號、內圈故障信號和滾動體故障信號時的相關參數進行優化。
c. 獲得模態函數。 對外圈故障信號、內圈故障信號和滾動體故障信號進行簡單的特征值濾波處理,利用優化參數的變分模態分解方法對濾波處理過的故障信號進行分解,得到模態函數。
d. 故障判別。 利用貝葉斯優化的LSSVM模型進行模式識別,獲得模式識別準確率。
為了保證實驗的真實性,筆者選用美國凱斯西儲大學的滾動軸承實驗數據進行分析,采用變分模態分解方法對數據進行特征提取,最終獲得相應的正常、外圈故障、內圈故障和滾動體故障信號特征向量。 選用采樣頻率為12kHz、故障直徑為0.007英寸(1英寸=2.54cm)、轉速為1 797r/min的滾動軸承振動信號作為數據樣本集。
實驗后,提取前6個IMF作為診斷模型的輸入特征向量。 結果表明,變分模態分解不僅能夠分析特定的頻段,還能對滾動軸承故障頻率進行特征提取,有效分離出故障信息,因此變分模態分解在故障診斷的特征提取方面有著實質性意義。
為了驗證設計的Bayesian-LSSVM診斷算法的有效性,將變分模態分解后提取的特征向量經過重構,選取其中部分信號作為訓練樣本和測試樣本,然后代入Bayesian-LSSVM診斷模型中,得到4種信號的故障分類結果,如圖3所示。

圖3 基于Bayesian-LSSVM的4種信號故障分類結果
同時, 為了驗證Bayesian-LSSVM診斷算法比SVM、LSSVM和PSO-LSSVM的診斷效果更好、診斷時間更短、效率更高,選用相同的訓練樣本和測試樣本,分別進行診斷實驗,訓練時間與測試時 間 比 較 如 圖4、5 所 示。 可 以 看 出,Bayesian-LSSVM在滾動軸承故障診斷中訓練時間和測試時間都比其他算法更快、效率更高。

圖4 4種方法訓練時間比較

圖5 4種方法測試時間比較
4種故障模型的診斷準確率見表1。 可以看出, 相較于其他3種模型,Bayesian-LSSVM診斷模型的診斷準確率最高, 因此Bayesian-LSSVM故障診斷方法具有更好的實用性。

表1 4種故障模型的診斷準確率
為了提高鐵路大型機械設備滾動軸承故障診斷識別的準確率,筆者提出了一種貝葉斯優化的LSSVM故障模式識別模型。 該模型先通過VMD對振動信號進行特征提取,得到模態函數,然后引用最小二乘支持向量機,并利用貝葉斯算法優化最小二乘支持向量機的參數,構造貝葉斯優化的LSSVM分類模型。 通過數據實驗對模型進行了對比驗證, 結果表明, 基于VMD 與Bayesian-LSSVM的方法在滾動軸承故障診斷上具有較高的準確率和可研究的價值。 下一步工作將研究VMD算法的參數優化問題,以進一步提高滾動軸承故障診斷的準確率。