夏 源,王藝華,張鑫瑞
(西安工業大學 機電工程學院,西安 710021)
齒輪箱是連接和傳遞動力的傳動裝置,被廣泛用在農業機械中。但由于其內部結構復雜,工作環境惡劣等因素,齒輪和軸承等主要部件易發生故障。因此,對齒輪箱進行故障特征提取和模式識別是當前亟需解決的問題。
為此,采用ReliefF算法對齒輪箱振動信號的特征向量進行降維,去除敏感度較差的特征向量,保留敏感度高的特征向量。將敏感度高的特征向量導入深度置信網絡中,進行故障的模式識別。


式(1)中:diff(A,R,Hj)是樣本R與Hj在特征A上的差;C為與樣本R不同的類總數;P(C)為第C類的概率;class(R)為樣本R所在的類;M為類C中與樣本R的第J個最近鄰樣本;diff(A,R,Mj(C))為樣本R與樣本M在特征上的差。
其中diff(A,R,Hj)分為兩部分,其中對于離散變量
(2)
對于連續變量
式(2)、式(3)中R(A)和Hj(A)代表R和Hj在特征A下的樣本值。
(5)反復計算上述步驟m次,獲得特征向量權重。
最后設定一個權重閾值,將超過該值的特征向量構成敏感特征集合,完成特征降維。
深度置信網絡(Deep Belief Net, DBN)由兩部分構成,分別是基于受限玻爾茲曼機(Restricted Boltzmann Machine, RBM)的無監督訓練和反向調參。
無監督訓練階段最重要的就是訓練RBM,以確保獲得準確的權重值。RBM的可見節點和隱含節點間是全連接,而隱含層和可見層層內兩兩之間不存在連接[2]。在訓練RBM時,原始數據輸入到可見層,形成向量V,再通過權重值W傳遞給隱含層,得到向量H,這樣可以同時得到所有的隱含層節點值。隱含層向量和可見層輸入向量的差值,就作為權重更新的依據。
DBN中有多個RBM構成。上述過程為單獨訓練每個RBM網絡,并不能夠保證DBN網絡的特征向量輸出最優。因此DBN最后一層選用BP神經網絡作為模式識別分類器。在分類過程中,將訓練后的輸出與理想輸出的差值反向傳播,調整DBN網絡參數,完成反向調參過程。
本文使用PHM2009齒輪箱故障數據集[3]進行實驗。加速度振動傳感器數據作為實驗數據。電機轉速1800 r·min-1,采樣頻率為67 kHz,采樣時間為4 s。其中,齒輪箱共有8種復合故障類型。本文以4500個采樣點為一組數據樣本,每種故障類型提取40組數據樣本進行分析。
將8種狀態振動信號用變分模態分解(Variational mode decomposition, VMD)方法處理,進而提取每個IMF分量的時域與能量熵值特征,具體操作步驟如下:
(1)將故障3信號用VMD將信號分解成8個IMF分量。如圖1所示。

圖1 故障3狀態下振動信號模態分解
(2)計算振動信號的各個IMF分量與原始振動信號的互相關系數。主要分兩步,第一步計算原振動信號與各IMF的自相關系數,公式如式(4)
(4)
其中,x(i)是各采樣點數值,N表示數據長度。
第二步計算原始振動信號和IMF分量信號的互相關系數
(5)
由式(5)計算所得的值范圍在[0,1],值越接近1,表示IMF分量與原信號相關性越大。
(3)利用相關系數提取主要IMF分量。由表1可知,前三個IMF分量的系數較大。因此提取各狀態振動信號的前三階IMF分量進行分析。

表1 IMF分量與原始信號的相關系數
本文提取的無量綱特征參數主要有峰值、脈沖、波形、裕度和峭度指標,設定xi(t)為信號數據,xi為各點幅值,N為采樣點數,δ為標準差。各指標計算公式如表2。

表2 五種無量綱時域特征計算公式
同時,能量熵能夠反映正常信號同故障信號之間的能量變化,各頻帶能量變化情況包含故障信息。對信號的分解具有正交性時,分量信號功率之和與原信號功率E相等。各分量的功率Ei計算如式(6)
(6)
設pi=Ei/E,且∑ipi=1,則能量熵的定義,如式(7)
Ee=-∑ipilogpi
(7)
因此,提取每個IMF在時域上的五個無量綱特征和能量熵特征,共18個特征向量。經特征提取后,用ReliefF算法進行降維。如表3所示,權重值越大的表示對故障越敏感。

表3 特征向量權重值值
分析上表數據,本文將權重閾值設為5,以實現特征向量的降維優化。此時優化后的特征向量為式(8)
T=[T15、T18、T12、T9、T1、T6、T3、T10]
(8)
為驗證本文提出方法的準確性,以4500個采樣點為一組數據樣本,一共8種狀態,每種提取40組數據樣本,共有320組數據。在實驗中隨機抽取50%作為訓練樣本,50%作為測試樣本。將降維后的特征向量與未降維的特征向量導入DBN中,模式識別結果如圖2、圖3所示。

圖2 ReliefF對特征向量降維后的識別準確率

圖3 未降維特征向量的識別準確率
(1)僅以未降維特征向量作為深度置信網絡的輸入不易區分故障類型,本文提出應用ReliefF算法降維的特征向量能夠使識別準確率提高11.87%。
(2)由表4對此可見,DBN網絡進行訓練和學習,能夠在訓練樣本數目較少的情況下有較好的分類效果,結合ReliefF算法,能夠準確識別出齒輪箱故障狀態信息。

表4 DBN模式識別效果對比