徐濟宣,馬 輝,馮小凱
(1.江西交通職業技術學院汽車工程系,江西 南昌330013;2.吉林農業科技學院,吉林 吉林132101;3.湖南大學,湖南 長沙410082)
滾動軸承是大型自動化設備中最容易損壞的機械部件之一,軸承故障會引發巨大的經濟損失,甚至造成人員傷亡。因此對軸承進行實時、準確地監測和診斷顯得極為重要[1]。對同一設備故障狀態監測的多個傳感器具有互補性,可以彌補單個信息源數據不完整的缺陷。因此,研究多源異構數據的融合與故障診斷問題具有重要的理論意義和工程價值。
設計多源異構數據的融合方法,實現多源數據的關聯、交叉和互補,是多源異構數據融合的根本問題。多源異構數據的融合,按照融合級別,可以分為數據級融合、特征級融合和決策級融合。數據級融合即為原始采集數據的融合,包括加權平均法、金字塔算法等,文獻[2]使用加權平均法對傳感器位置進行融合,此方法簡單易懂、易于實現,但是融合信息的對比度低。特征級融合是提取每個異構數據的特征,而后進行特征組合,得到多源異構數據的聯合特征。文獻[3]將故障數據分為靜態開關量、動態電氣量和暫態電氣量,分別提取故障特征組成聯合特征,實現了特征級融合,得到了精確的故障類型和故障位置。這種融合方法過于粗糙,各自孤立的提取各自信息的故障特征,而后組合成特征向量,忽略了異構數據之間的關聯性和互補性。決策級融合是指對多源數據建立各自的深度學習網絡,決策時對分類結果進行融合,包括投票法、D-S證據理論等。文獻[4]在煤礦安全預警中提出了基于D-S理論的決策級融合方法,建立的安全預警模型對井下安全具有指導意義,但是D-S理論的理論基礎存在爭議,同時DS理論存在指數爆炸問題。
本文研究了軸承多源異構故障數據的特征融合問題,使用深度神經網絡將多源數據特征進行有效融合,提取更加能夠表征故障特性的融合特征,達到提高軸承故障診斷精度的目的。
顧名思義,堆疊自編碼器是由編碼器堆疊而成,因此首先介紹自編碼器。自編碼器(Automotive Encoder,AE)分為編碼和解碼兩個過程,其中編碼可視為特征提取的過程,解碼可視為數據還原的過程[5],其模型結構如圖1所示。

圖1 自動編碼器模型結構Fig.1 Automotive Encoder Model Structure
編碼器輸入記為X,則編碼過程(即隱藏層輸出)為:

式中:σ1—編碼過程激活函數;W—輸入層向隱藏層的傳遞權值矩陣;b—隱藏層的偏置向量;h—隱藏層激活值,也可以理解為提取的隱藏特征。解碼過程為:

式中:σ2—編碼過程激活函數;W′—隱藏層向輸出層的傳遞權值矩陣;b′—輸出層的偏置向量;Y—輸入的重構值。自動編碼器的重構誤差及參數更新過程[6]為:

式中:J(X,Y)—重構誤差,α—學習率。
本節構造的深度神經網絡(Deep Neural Network,DNN)由多個自編碼器堆疊而成,以前一個自編碼器的隱藏層激活值作為下一個自編碼器的輸入,網絡結構如圖2所示。
對于圖2所示的堆疊自編碼器,輸入無標簽數據X,使用式(1)、式(2)和式(3)進行訓練,得到AE1的隱藏層特征h1和網絡參數θ1={ }W1,b1,W1′,b1′。而后以h1作為AE2的輸入,按照式(3)訓練方法,得到AE2的隱藏層特征h2和網絡參數θ2={W2,b2,W2′,b2′}。重復以上過程直至得到自編碼器AEn的隱藏層特征hn和網絡參數θn={Wn,bn,Wn′,bn′}。

圖2 自編碼器堆疊而成的深度神經網絡Fig.2 Deep Neutral Network Stacked by Automotive Encoder
最后一層自編碼器得到的隱藏層特征hn即為深度神經網絡獲取的輸入數據隱藏特征。將隱藏特征hn輸入到Softmax分類器中,使用有標簽的數據對Softmax分類器進行訓練。對于K分類問題,將第m個觀測樣本x(m)=[x1(m),x2(m),…xk(m)]輸入到堆疊自編碼器中得到隱藏特征hn,將hn輸入到Softmax分類器中,得分類結果[7]為:

式中:label(m)—分類結果;θ=[θ1,θ2,…,θK]—Softmax分類器參數。
為了保證分類的準確性,通過最小化分類代價函數實現參數的優化與更新,代價函數及參數更新方法為:

式中:M—樣本數量,K—分類數,θ—Softmax分類器網絡參數,E(θ)—重構誤差。
卷積神經網絡更加適用于二維輸入數據,比如圖像輸入。卷積神經網絡由輸入層、卷積層、池化層、全連接層和輸出層組成[8]。
(1)卷積層。卷積層將輸入數據與卷積核進行卷積運算生成特征映射,供池化層提取與降維。對于輸入數據X,卷積核從輸入數據中學習到的特征為:

式中:hCNN,i—第i層卷積層的特征輸出,?—卷積,WCNN,i—第i層卷積核權值,bCNN,i—第i層卷積核偏置,g()—線性整流ReLU激活函數。
(2)池化層。池化層是為了提取重要的特征信息,達到降低特征維度的目的。最大池化方式可以獲得與位置無關的特征,對于軸承周期性振動信號極為適用,因此本文使用最大池化方式最大池化是指對卷積層輸出的特征量hCNN,i,每連續ψ個hCNN,i選擇一個最大值進行保留。數學描述為:

式中:hCNN,j—第j個池化層輸出,維度為s,g—池化長度。
(3)全連接層。將最后一級池化層的輸出平鋪,作為全連接層輸入。對輸入數據使用ReLU激勵函數進行激活,得到卷積神經網絡的最終特征參數hCNN。
卷積神經網絡的參數使用基于Adam算法的優化方法,具體可參考文獻[9]。
當前的多源異構數據特征級融合,大都獨立地提取各數據源的特征,而后拼接成聯合特征向量,這種粗糙的融合方法忽略了數據的互補性和關聯性。為了解決這一問題,本文提出了基于深度學習的交替優化方法。
第一步:使用堆疊自編碼器構造的深度神經網絡(DNN)提取1維振動信號的故障特征FDNN。深度神經網絡構造為:

式中:NetDNN—訓練完畢的深度神經網絡;TrDNN—訓練完畢的網絡參數;Feedforward—多隱藏層神經網絡生成函數;θDNN={WDNN,bDNN}—神經網絡參數;MD—隱藏層數;h1~hMD—各隱藏層神經元數量;X1D—輸入的1維振動數據。
使用訓練得到的深度神經網絡NetDNN,得到1維振動數據的特征為:

式中:FDNN—1維數據隱藏特征;GDNN—深度神經網絡輸出函數。
第二步:使用卷積神經網絡(CNN)提取2維圖像數據的1維故障特征FCNN。卷積神經網絡構造為:

式中:NetCNN—訓練完畢的卷積神經網絡;TrCNN—訓練完畢的網絡參數;Feedforward—多隱藏層神經網絡生成函數;θCNN={WCNN,bCNN}—網絡參數;MCL、Mpool—卷積層數和池化層數;SizeCL、Sizepool—卷積核大小和池化核大小;X2D—輸入的2維圖像數據。
使用訓練得到的卷積神經網絡NetCNN,得到2維圖像數據的特征為:

式中:FCNN—2維圖像數據得到的1維隱藏特征;GCNN—卷積神經網絡輸出函數。
第三步:使用堆疊自編碼器構造融合網絡Netfu,用于多源特征的交替優化融合,最終獲得多源融合特征Ffu。使用多隱藏層神經網絡生成函數Feedforward得到融合網絡Netfu,為:

式中:Netfu—訓練完畢的融合網絡;Trfu—訓練完畢的網絡參數;θfu={Wfu,bfu}—神經網絡參數;Mf—隱藏層數;h1~hMf—各隱藏層神經元數量;FDNN、FCNN—輸入數據。
將1維振動數據隱藏特征FDNN、2維圖像數據的隱藏特征FCNN同時輸入到融合網絡Netfu中,進行交替優化,優化方法示意圖,如圖3所示。

圖3 交替優化示意圖Fig.3 Alternative Optimization Diagram
首先將隱藏特征FDNN輸入到融合網絡Netfu11中,網絡參數初始化方法為:

式中:Q—輸入層神經云數量,hfu1、hfu2、hfu3—隱藏層1、隱藏層2、隱藏層3的神經云數量,Wfu1—輸入層到隱藏層1的權值,bfu1—隱藏層1的偏置值,Wfu2—隱藏層1到隱藏層2的權值,bfu2—隱藏層2的偏置值,Wfu3—隱藏層2到隱藏層3的權值,bfu3—隱藏層3的偏置值;函數rand(a,b)是指產生a×b矩陣,矩陣值為(0,1)間隨機數;zeros(a,b)是指產生要素為0的a×b矩陣。
將FDNN輸入到融合網絡Netfu11中,按照式(1)、式(2)和式(3)進行訓練,得到訓練完畢的參數Trfu1,1D,利用訓練完畢的網絡提取1維數據的融合特征為:

式中:Ffu1,1D—1維數據提取的融合特征,Gfu1—融合網絡Netfu11輸出函數。
而后以Trfu1,!D作為融合網絡Netfu12參數初值,將隱藏特征FCNN輸入到融合網絡Netfu12中,網絡參數的初始化方法和訓練方法同融合網絡Netfu11一致,至此完成了隱藏特征FDNN和FCNN的第一輪交替優化。融合網絡Netfu11對輸入數據FDNN的重構誤差為:

式中:Rcfu11—融合網絡Netfu11對FDNN的重構值,W′、b′的含義與式(2)一致,為解碼過程參數,φ—激活函數,n—隱藏特征FDNN的數據長度,Lfu11—融合網絡Netfu11對輸入數據FDNN的重構誤差。以同樣方式計算融合網絡Netfu12對輸入數據FCNN的重構誤差,記為Lfu12,由此得到第1輪交替優化誤差L1為:

按照以上過程,重復地將FDNN與FCNN輸入到融合網絡中進行交替優化,直至優化誤差L小于設定值ε。此時得到訓練完畢的融合網絡Netfu和網絡參數Trfu。根據訓練完畢的融合網絡Netfu,得到多源異構數據的融合特征Ffu為:

式中:Gfu—融合網絡的輸出函數。
使用Softmax分類器進行故障類型診斷。將融合特征Ffu作為Softmax分類器輸入,生成Softmax分類器為:

式中:Netsoft—Softmax分類器網絡;θsoft—Softmax網絡參數;hout—Softmax分類器神經元數量;Ffu—Softmax分類器輸入的融合特征。
基于融合特征的Softmax分類器診斷結果為:

式中:result—分類結果;θ=[θ1,θ2,…,θK]—Softmax分類器參數;K-分類種數;p(yi=i|Ffu;θ)—參數為θ、輸入為Ffu時分類為k的概率。
對包括Softmax分類器在內的融合網絡進行參數反向調整時,為了防止模型過擬合和過學習,將L2正則化懲罰項加入到損失函數中,為:

式中:JC—損失函數,n—樣本數量,y—原始標簽,y′—識別結果,α—正則化超參數,w—權值矩陣列向量。依據此損失函數,使用梯度下降法對融合網絡進行參數的反向優化。
根據以上多源異構數據的特征融合方法,制定基于融合特征的深度神經網絡診斷流程,如圖4所示。

圖4 基于深度神經網絡的診斷流程Fig.4 Diagnosis Flow of Deep Neural Network
基于融合特征的深度神經網絡診斷方法分為離線建模部分和在線診斷部分,離線建模部分主要功能是深度神經網絡建立與參數訓練,在線診斷部分功能是使用訓練完畢的深度神經網絡模型,實時提取數據的融合特征并進行故障類型診斷。
本文以美國凱斯西儲大學提供的軸承試驗數據為基礎設計實驗[10],使用電火花技術在軸承上加工單點故障,軸承狀態分為內圈故障、外圈故障、滾珠故障和正常狀態等四類,故障直徑包括0.007英寸、0.014英寸、0.021英寸、0.028英寸和0.04英寸等,數據采樣頻率分為12kHZ和48kHz兩種,電機負載分為0hp、1hp、2hp、3hp等。本文使用負載為0hp、采樣頻率為12kHZ、電機轉速為1797RPM狀態下的實驗數據,設計三組實驗如下。
實驗一:故障直徑均為0.014英寸的內圈故障數據、外圈故障數據、滾珠故障數據和正常軸承數據。訓練樣本規模為8000,測樣樣本規模為4000。一維數據為一維振動數據,二維數據為監控中心監視器截屏二維圖像數據。
實驗二:故障直徑分別為0.007英寸、0.014英寸、0.021英寸的內圈故障數據和正常軸承數據。訓練樣本規模為8000,測樣樣本規模為4000。一維數據為一維振動數據,二維數據為監控中心監視器截屏二維圖像數據。
實驗三:故障直徑分別為0.007英寸、0.014英寸、0.021英寸的外圈故障數據和正常軸承數據。訓練樣本規模為8000,測樣樣本規模為4000。一維數據為一維振動數據,二維數據為監控中心監視器截屏二維圖像數據。
為了驗證多源異構數據融合特征的診斷效果,同時使用一維數據提取特征FDNN、二維數據提取特征FCNN、融合特征Ffu進行故障診斷。用于特征融合的深度神經網絡模型,如表1所示。

表1 融合網絡模型Tab.1 Fused Network Model
三組實驗的實驗結果較多,由于篇幅限制,在此僅以圖形的形式對實驗一的診斷結果進行展示,另外兩組實驗的結果統計數據在后文中以表格形式給出。實驗一的診斷結果如圖5所示,圖中狀態0、1、2、3分別表示正常狀態、滾珠故障、內圈故障、外圈故障。

圖5 實驗一的診斷結果Fig.5 Diagnosis Result of the First Experiment
圖5中,藍色“O”為測試數據的原始標簽,紅色“*”為診斷結果,兩者重合表示診斷結果正確,兩者不重合表示診斷結果錯誤。對比圖5中三幅圖可以看出,基于融合特征的診斷精度明顯高于兩外兩種方法。
統計實驗一、實驗二、實驗三分別基于一維數據提取特征FDNN、二維數據提取特征FCNN、融合特征Ffu的診斷精度,結果,如表2和圖6所示。

表2 三組實驗診斷結果Tab.2 Diagnosis Result of the Three Experiments

圖6 三組實驗的診斷結果Fig.6 Diagnosis Result of the Three Experiments
結合表2中數據和圖6所示的柱狀圖可以看出,在三組實驗中,基于FDNN的診斷精度最低,基于FCNN的診斷精度略高于基于FDNN的診斷精度,約高1~2個百分點;基于融合特征Ffu的診斷精度最高,比另外兩種方法的診斷精度高10%以上。以上數據說明了深度神經網絡能夠將FDNN和FCNN有效融合,提取出更加能夠表征故障特性的深層次融合特征,從而得到了最高的故障診斷精度。
研究了軸承故障時的多源異構數據特征融合問題,提出了基于深度神經網絡的多源特征融合方法,使用Softmax分類器對融合特征進行故障分類。經驗證,得出了以下結論:(1)深層神經網絡可以將多源異構數據的特征進行有效融合,提取深層次的融合特征;(2)基于融合特征Ffu的診斷精度比單獨使用FDNN和FCNN的診斷精度高10%以上,驗證了本文故障診斷方法的有效性。