彭 博,張 毅,蹇清平,于 翔
(1.成都工業職業技術學院,四川 成都 610218;2.西南石油大學機電工程學院,四川 成都 610500)
旋轉機械作為現代工業系統中不可替代的工業設備,在工業生產和智能制造中發揮著至關重要的作用[1]。目前,旋轉機械的一般故障診斷方法大多是通過對各種狀態參數的檢測和分析來確定其運行狀態,機械設備的健康狀況需要采集大量的測量數據和信號,使機械系統的健康監測和管理進入機械大數據時代[2-3]。
傳統的智能故障診斷方法大多基于流形學習[4]、支持向量機(SVM)[5]和人工神經網絡(ANN)[6]等方法。但是傳統的智能故障診斷方法都有一個共同的假設,即不同機械健康狀況下的訓練樣本數大致相等,實際上,由于工業生產的固有特點,機械設備失效狀態的采集數據很難獲得,失效樣本的數量往往遠遠少于失效樣本的數量正常條件下的樣品。對于類間不平衡的樣本,傳統的基于最大似然的智能診斷方法性能會嚴重下降。目前,基于機器學習的智能不平衡故障診斷已逐漸成為眾多研究的熱點。文獻[7]針對不平衡故障數據,設計了滾動軸承狀態診斷的兩級故障診斷框架。文獻[8]首次提出了一種異步電動機不平衡狀態下軸承故障的混合診斷方法。然而,上述非平衡故障診斷方法大多基于分類過程,其模型學習過程大多是淺層學習。對于實際的故障診斷模型,故障診斷效果依賴于專家知識和人工特征。
為了解決淺層學習的問題,深度自動編碼器(DAE)模型能夠學習重構輸入輸出數據的有效特征,因此得到了廣泛的應用。文獻[9]構建了一種基于稀疏去噪自動編碼器的感應電機故障診斷的深度神經網絡算法。文獻[10]提出了一種基于小波自動編碼器和極限學習機的滾動軸承智能故障診斷方法。文獻[11]提出了一種基于粒子群優化算法的分層去噪自動編碼器(SDAE)算法,稱為單正則化SDAE(MRSDAE)。雖然DAE 在不平衡故障診斷能夠取得一定效果,但是仍舊存在過度擬合的情況,并且該方法的泛化能力較弱。
為了解決上述問題,提出一種基于深度Laplacian正則化自動編碼器(DLapRAE)的不平衡旋轉機械故障診斷,將Laplacian正則化項合理地引入到深度自動編碼器(DAE)的原始目標函數中,以平滑故障診斷模型中數據的流形結構,從而提高故障診斷框架的泛化性能,使其更適合于不平衡數據的特征學習和分類。通過軸承實驗驗證了提出方法的有效性。
在每次迭代中更新神經網絡的權重時,通過引入拉普拉斯正則化矩陣來調整各層參數,這樣不僅可以確保實際輸出值和標簽的誤差盡可能小,同時也要使相同種類的樣本之間的距離近或異類樣本之間的距離較遠。為此,對受過訓練的網絡進行了迭代更新,以提取更有助于故障識別的敏感特征。

為了使同質數據更接近,異質性樣本的分離更加明顯。本文將拉普拉斯正則化項添加到一般AE的損失函數中,從而使所提出模型的泛化能力更強。其中,將拉普拉斯正則化項R定義為等式(7),在低維空間中獲得足夠平滑的投影,并且該矩陣可以維持原始空間數據的流形結構。

式中:W—圖的鄰接矩陣;L—拉普拉斯矩陣;D—對角矩陣。
與其他正則化技術相比,拉普拉斯正則化是基于流形學習的光滑假設,利用嵌入的目標,可以將同一類高維數據的鄰域嵌入到低維空間中。換句話說,這種約束可以使所提取的特征類內距離更緊,類間距離更分散,從而使所提取的特征的廣義性能優良。
為了使每層提取的特征更易于分類,將新定義的拉普拉斯AE損失函數與拉普拉斯正則化相結合:

式中:J—一般AE 的損失函數,是拉普拉斯正則項的調整參數;R—拉普拉斯正則項。因此,采用新跨度損失函數JLap來使學習特征的類內距離和類間距離更加的不同。在訓練樣本較少的情況下,JLap的目標更適合分類。通常,其參數調整因子ε的范圍為0到1。
訓練網絡的目標是找到JLap的最小值,并且可以通過梯度下降法優化目標函數。因此,其迭代方程寫為:

式中:β—學習率。在每個子功能找到最后一層的殘差后,將迭代獲得所有更新的權重。
顯然,上述拉普拉斯自動編碼器是淺網絡。由于訓練樣本中包含的健康特征的復雜性,僅通過一個隱藏層很難學習具有良好表示能力的故障特征。因此,堆疊了多個拉普拉斯自動編碼器,并添加了分類層以構建深拉普拉斯自動編碼器神經網絡。具體來說,當堆疊多層拉普拉斯AE時,將拉普拉斯AE的前一層的輸出用作對拉普拉斯AE的下一層的輸入。最終,每層拉普拉斯自動編碼器的編碼過程可以表示為:

式中:a(l)—第l層的輸出;z(l)和z(l+1)—第l層和第l+1層的輸入。
同理,多層神經網絡的解碼過程定義為:

式中:a(n+l)—最深的隱藏單元的輸出,是輸入的最高階表達式。每層的訓練都是無監督的,也就是說,將應用自動編碼器使得輸出值等于輸入值。
多層拉普拉斯自動編碼器堆疊后,最后一個隱藏層的輸出可以視為原始輸入的近似值。這里選擇BP作為分類層,分類層中神經元的數量為分類的數量。DLapRAE 的基本步驟可以總結如下:
(1)以無人監督的方式訓練Laplacian 自動編碼器神經網絡的第一層;
(2)將上述拉普拉斯自動編碼器的層用作拉普拉斯自動編碼器的下一層的輸入;
(3)重復步驟(2),完成拉普拉斯自動編碼器的所有訓練;
(4)將最后一個隱藏層的輸出用作分類層的輸入,分類層中神經元的數量是健康狀況類別的數量,為下一步監督的微調做準備。
可以通過使用預訓練來建立深度拉普拉斯自動編碼器,并且每一層中學習的特征都是數據特征的不同順序表示。同時,有必要通過標記的樣本來監督網絡,以提高DLapRAE的性能,監督學習算法致力于進一步調整預訓練的神經網絡。經過多次迭代,權重和偏移量得到優化,其過程描述如下。
(1)為了進行預訓練,使用前饋傳遞將標記的樣本(x(i),l(i))輸入神經網絡。綜上所述,采用前向傳播算法獲得每一層的激活值;
(2)對于輸出層l,殘差定義如下。

式中:?a(l)JLap—偏導數。
(3)對于l=nl-1,nl-2…2層,該層的殘差如下所示:

(4)計算偏導數被描述為

這樣,可以根據等式13~式15稍微調整網絡參數。完成了預訓練和監督的微調DLapRAE神經網絡,實現了無監督的自動學習和監督的微調的有機結合。不同的隱藏層可以學習不同的功能。因此,深度拉普拉斯自動編碼器具有完整的拓撲結構和強大的非線性擬合能力。深度拉普拉斯自動編碼器模型,如圖1所示。

圖1 深度拉普拉斯自動編碼器Fig.1 Deep Laplacian Automatic Encoder
根據上述討論,這里提出的基于DLapRAE的旋轉機械不平衡故障診斷方法,如圖2所示。其故障診斷方法的主要實現步驟如下所示。

圖2 故障診斷示意圖Fig.2 Fault Diagnosis Diagram
(1)信號采集和數據處理階段。可以通過不同的傳感器和數據采集卡采集旋轉機械的振動信號,得到健康狀況不同的滾動軸承的樣本集,然后分別將訓練樣本集和測試樣本集進行歸一化。
(2)預訓練DLapRAE 階段。設置網絡結構參數,包括DLapRAE N 的數量,神經元數量,正則化系數等,從而構建DLapRAE,然后將訓練樣本的原始信號值輸入到DLapRAE中進行逐層訓練;
(3)有監督的微調網絡結構階段。通過輸入少量帶標記的訓練樣本對DLapRAE的參數進行反微調,對獲得的參數進行微調,以完成網絡參數的訓練。
(4)在DLapRAE階段進行故障診斷。測試樣本會輸入到經過訓練的DLapRAE中,并且其網絡輸出是診斷結果。
為了驗證所提出的不平衡故障診斷方法的有效性,用凱斯西儲大學(CWRU)軸承測試臺模擬的滾動軸承實驗數據來驗證所提出方法的有效性,實驗設備[12],如圖3所示。本實驗收集的數據是在以下實驗條件下進行的:電動機負載為3hp,采樣頻率為48kHz,轉速為1730r/min,并且利用驅動端軸承上的加速度傳感器采集模擬各種工況的機械設備的振動信號。電火花加工滾動軸承(EMD)故障等級分別為0.18mm(輕微故障級)、0.36mm(中度故障級)和0.54mm(嚴重故障級)。

圖3 軸承測試臺Fig.3 Bearing Test Bench
該實驗模擬了滾動軸承的10 種健康狀況,即球輕微失效(BS),內圈輕微失效(IRS),外圈輕微失效(ORS),球中等失效(BM),內圈中度故障(IRM),外環中度故障(ORM),球延遲故障(BL),內環延遲故障(IRL),外環延遲故障(ORL),正常狀態(N)。每個健康狀況通過1024個振動信號被截取為一個樣本,每種故障狀況可使用100個樣本。其中,為了反映故障數據集的平衡和不平衡,分別構造了兩個故障數據集B(平衡數據集)和UB(非平衡數據集),如表1所示。
如表1 所示,兩個數據集(B 和UB)由不同的平衡度數據組成。在數據集B中,每個滾動軸承的健康狀況的50%用于訓練樣本,其余樣本用于測試樣本。由于每種健康狀況的訓練樣本數量相同,因此數據集B是平衡數據集。在實際的工業應用中,故障樣本比正常樣本更難收集,因此減少了數據集B的故障樣本中訓練樣本的數量,從而構成了模擬健康數據集失衡的數據集UB。

表1 凱斯西儲大學的平衡的數據集B和不平衡數據集UBTab.1 Balanced Data Set B and Unbalanced Data Set UB of Case Western Reserve University
在上述滾動軸承故障數據集中,不同健康狀況下振動信號的時域波形,如圖4所示。從圖4可以看出,傳統的時頻域分析方法更難于量化不同程度和類型的故障。換句話說,它在很大程度上依賴于大量的專業知識和運行經驗。因此,需要一種智能的故障診斷方法來量化故障診斷結果。

圖4 振動信號的時域波形Fig.4 Time Domain Waveform of Vibration Signal
目前,基于機器學習的智能故障診斷方法已被廣泛使用。為了提高不平衡數據集的診斷精度,首先提出了一種新型的深度學習算法(DLapRAE),并提出了一種基于DLapRAE的旋轉機械故障不平衡診斷方法。
提出模型的參數為:神經元的層數可以設置為[1024-200-100-1024-100-10]。此外,根據提出的故障診斷方法和數據集B,可以通過網格搜索來傳遞調整正則化參數ε,然后,正則化調整因子對DLapRAE的影響,如圖5所示。可以看出,正則化調整因子ε=0.6更合適。因此,考慮到算法的穩定性和收斂速度,DLapRAE的參數設置,如表2所示。

圖5 正則化調整因子對DLapRAE的影響Fig.5 Effect of Regularization Adjustment Factor on DLapRAE

表2 DLapRAE的參數設置Tab.2 Parameter Setting of DLapRAE
為了進行實驗比較,利用現有的一些深度學習模型(如其他標準DAE(Deep Auto-Encoder)、DRAE(Deep Regularization Auto-encoder)和DSAE(Deep Sparse Auto-Encoder)分別與構建的DLapRAE算法進行比較[13-15]。
在本節中,進行了兩個實驗案例研究。因此,具體實驗條件描述如下。
實驗1:對于數據集B,不需要信號預處理或人工特征提取,并且將歸一化的振動數據直接用作上述四種類型的故障診斷模型的故障診斷輸入;
實驗2:對于數據集UB,可以將歸一化的振動數據直接用作上述四種類型的故障診斷模型的故障診斷輸入,而無需進行信號預處理或人工特征提取。
根據圖2的診斷流程圖,分別使用提出的故障診斷方法(DLapRAE)和基于故障診斷方法的DAE,DRAE和DSAE對數據集B進行診斷和分類。因此,基于上述四種診斷方法的測試樣品的識別結果,如圖6所示。


圖6 不同診斷模型的三維特征可視化Fig.6 3-D Features Visualization for Different Diagnostic Models
從結果可以看出,對不同的深度學習故障診斷方法,其原始信號可以直接輸入到深度學習方法中。在圖6中,基于DAE的故障診斷方法的診斷準確性低于DRAE,DSAE和其他故障診斷模型。然而,基于DLapRAE的故障診斷方法的準確率接近100%,可以證明該方法可以完全消除不同健康狀況的干擾,準確識別滾動軸承的10個健康狀況。各種故障類型的平均診斷準確性描述為以下公式,診斷詳細信息,如表3所示。

表3 基于不同故障診斷模型的數據集B的平均精度Tab.3 Average Accuracy of Data Set B Based on Different Fault Diagnosis Models

式中:N—故障類型總數;
Hi—各種故障的診斷準確性。
為了驗證所提出的故障診斷方法的特征提取能力,通過t-分布隨機鄰域嵌入(t-SNE)技術將上述四種診斷方法提取的最后一層特征簡化為3-D可視化,分別比較了DLapRAE提取的敏感特征和DAE,DSAE和DRAE的其他深度學習方法。以實驗1為例,由于提取的DLapRAE(100維)、DAE(100維)、DSAE(100維)和DRAE(100維)的敏感特征均為高維數據,因此采用t-SNE進行可視化。然后,通過t-SNE學習不同故障診斷模型的特征三維可視化,如圖6所示。其中PC1、PC2和PC3分別代表前三個主成分。從圖7可以看出,與其他三個特征相比,DLapRAE所學習的深度特征可以更容易地識別輸入數據。


圖7 基于不同故障診斷模型的數據集B的診斷結果Fig.7 Diagnostic Results for Dataset B Based on Different Fault Diagnosis Models
造成上述現象的原因可以歸納為:(1)該深度學習模型具有較強的從輸入數據中學習表征信息的能力。(2)拉普拉斯正則化可以使提取的特征分類性能更加明顯。
在實驗2 中,DLapRAE 能夠識別不平衡數據(數據集UB)。同樣,DAE、DRAE和DSAE也用于非平衡數據集的分類,作為對比實驗。根據圖2的診斷流程圖,四種方法對檢測樣本的識別結果,如圖8所示。


圖8 基于不同故障診斷模型的數據集UB的診斷結果Fig.8 Diagnosis Results of UB Data Sets Based on Different Fault Diagnosis Models
與數據集B的診斷準確性相比,基于四種診斷方法的數據集UB的準確率逐漸降低。DLapRAE的診斷準確性為0.896,DRAE的診斷準確性為0.726,DSAE 的診斷準確性為0.758,而DAE 的診斷準確性為0.862。由于拉普拉斯正則項,DLapRAE獲得的下降程度得到緩解。因此,所提出的DLapRAE的性能優于其他三種不平衡故障診斷方法。同時,為了評估提出的故障診斷方法的特征提取能力,使得四種診斷方法提取的最后一層特征可以通過t-SNE技術簡化為三維可視化。基于不同故障診斷模型的特征的三維可視化,如圖9所示。從圖9可以看出,除了DLapRAE,很難將10種軸承故障與其他三種類型的診斷模型分開。


圖9 基于不同故障診斷模型的UB數據集診斷結果Fig.9 Diagnostic Results of Dataset UB Based on Different Fault Diagnosis Models
為了評價不同故障診斷方法提取的特征的分離性能和聚類性能,采用了兩個參數,即類間協方差Sb和類內協方差Sw,用計算他們來反映樣本的分類和聚類程度。
在聚類分析中,類內距離Sw可以描述每種類型的樣本分布的緊湊性,而類間協方差Sb可以用來定義類與類之間的分離程度。設特征向量為{v1,v2…vd},d為特征向量的目標維,因此Sw和Sb分別定義為式(17)和式(18)。

式中:—第r類的樣本特征向量的平均值(r∈L=1,2…l);所有特征向量的平均值。
顯然,類間協方差Sb可以用于描述不同類之間的離散程度,而類內協方差Sw可以用來表示同一類內的聚類程度。

因此,上述四種診斷方法的計算結果,如表4所示。

表4 不同診斷方法對不同特征的定量評價Tab.4 Quantitative Evaluation of Different Characteristics by Different Diagnostic Methods
根據特征評估標準,Ei(i=1,2)越大,分類結果越好。
結果表明,評價指標表示DLapRAE學習到的特征區分和聚類效果。
為了解決傳統深度自動編碼器存在的過度擬合以及泛化能力弱等問題,提出一種基于深度Laplacian正則化自動編碼器的不平衡旋轉機械故障診斷。
通過實驗結果分析可得出如下結論:
(1)提出的方法可以完全消除不同健康狀況的干擾,對不同健康狀況、故障類型以及數據樣本比例均能夠實現高精度的診斷,說明該方法具有更好的泛化性能。
(2)DLapRAE所學習的深度特征可以更容易地識別輸入數據。證明該深度學習模型具有較強的從輸入數據中學習表征信息的能力。
(3)引入的拉普拉斯正則化可以使提取的特征分類性能更加明顯,從而有效提升對不平衡數據集的故障診斷精度。