張小剛,丁 華,王曉波,楊亮亮
(1.太原理工大學機械與運載工程學院,山西 太原 030024;2.煤礦綜采裝備山西省重點實驗室,山西 太原 030024)
滾動軸承是旋轉類機械傳動系統的基本部件,長期的高速運轉,軸承的內圈、外圈、和滾動體等部位容易發生故障,這直接影響到整臺設備乃至整個生產線的安全[1]。因此,對軸承進行監測和診斷成為一項至關重要的任務。基于振動信號的分析是最常見的傳統故障診斷方法,包括小波分析[2]、經驗模態分析法[3]和局部均值分解法[4]等。然而基于振動信號處理的特征提取方法,在面對多工況交替、故障信息耦合嚴重、模式不明且多變的機械海量信號時,會導致其監測診斷能力與泛化性能欠佳[5]。近年來,深度學習模型CNN在軸承故障診斷方面的應用發展迅猛,顯著的提高了故障識別準確率[6-7]。
傳統的深度學習模型大多都是基于淺層的,如果網絡層數不斷加深,它在更新參數時層與層之間的權重不能更好的優化,會導致訓練精度不變或下降。為了解決這個問題,文獻[8]在2015年提出了深度殘差網絡(ResNet),它避免了深層網絡在訓練時所存在的缺陷。目前ResNet已經在圖像處理方面得到了廣泛應用。受其啟發,將深度殘差網絡應用于基于振動信號的故障診斷,能夠從更加復雜和多變的振動信號中捕捉更好的特征集合[9]。因此,通過深度殘差網絡實現滾動軸承的故障分類,并對分類結果進行對比實驗與分析。
深度殘差網絡的核心在于殘差學習模塊,它的主要思想是在訓練深層卷積神經網絡的過程中保存了部分原始輸入信息,從而轉移了學習目標,避免了由網絡深度而引起的分類精度飽和問題。殘差學習模塊主要由卷積層,BN層和ReLu組成,卷積層利用多個不同的卷積核提取原始振動信號的主要特征,實現特征降維。其公式可以表示為:

在對軸承進行故障診斷時,采用了預激活殘差學習模塊,它首先通過批量歸一化層(BN)將數據集中在[0,1]范圍內。其次,利用Relu進行預激活。最后,通過卷積層對預激活后的數據進行卷積運算,殘差學習模塊的最終輸出y可表示為:

式中:x—輸入;F(x,Wc)—包含BN層,Relu和卷積層路徑的非線性函數;Wc—這條路徑要優化的參數。
設計的殘差單元模塊具體內部參數,如表1所示。

表1 殘差單元模塊參數Tab.1 Residual Unit Module Parameters
預激活殘差學習模塊有恒等殘差模塊和卷積殘差模塊兩種。當上一層的輸出尺寸和下一層的輸入尺寸相互匹配時,采用恒等殘差模塊,如圖1(a)所示。反之,需要在捷徑加入一個卷積層來匹配上一層的輸出,即卷積殘差模塊,如圖1(b)所示。其中,捷徑上的卷積核大小設為(1×1),移動步長設為(1×2),卷積核數量N視具體結構而定。

圖1 殘差學習模塊Fig.1 Residual Learning Module
構建的ResNet基本結構,如圖2所示。ResNet共有13個卷積層,其中第一個卷積層采用寬卷積核,目的是為了提取短時特征。優點是它可以自適應的學習面向故障診斷的特征,提高分類精度[6]。卷積核的大小設為(64×1),移動步長設為(1×16),卷積核數量設為32。其余卷積層是由4個殘差模塊組成,每個殘差模塊包含3個卷積層。池化層有最大池化層和平均池化層兩種,大小均為(2×1),移動步長均為(1×2),它們的主要作用是減少了中間層輸出樣本尺寸的大小和后面層參與訓練參數的數量,加快了模型訓練速度。同時為了防止過擬合,在平均池化層后面添加一個Dropout。全連接層將平均池化層輸出的特征矢量首尾連接組成一維向量。Softmax分類器主要實現目標故障分類。

圖2 深度殘差網絡基本結構Fig.2 Basic Structure of Deep Residual Network
ResNet故障診斷算法流程,如圖3所示。

圖3 故障診斷算法流程Fig.3 Fault Diagnosis Algorithmic Flow
首先將原始樣本按半重疊的方式分割成多個不同子樣本作為模型的輸入。之后將子樣本按0.64:0.16:0.2的比例劃分為訓練子樣本,驗證子樣本和測試子樣本。最后針對不同的子樣本先后完成模型的訓練,驗證和測試。在模型訓練時,比較實際輸出和期望輸出的誤差。當誤差不滿足給定要求時,對模型反向更新權重。當誤差滿足給定值時,輸出訓練模型。在模型驗證時,算法在每一輪迭代過程中會不斷的調整網絡的超參數,當完成一輪迭代更新后,算法會使用驗證子樣本進行一次驗證,測試模型的改進效果,以更好的評估此模型的優劣。模型測試主要是將測試子樣本直接作為訓練模型的輸入,通過訓練模型實現軸承目標故障的分類。
為了驗證模型的可行性,選取了美國凱斯西儲大學的開放軸承數據庫的樣本進行實驗驗證,實驗臺,如圖4所示。實驗平臺包括一個2馬力的電機(左側),一個轉矩傳感器(中間),一個功率計(右側)和電子控制設備。使用電火花加工技術在軸承上布置了單點故障,故障直徑分別為7、14和21mils。實驗中,加速度傳感器分別安裝在電機殼體的驅動端和風扇端,用來采集故障軸承的振動信號。

圖4 CWRU實驗臺Fig.4 CWRU Test Bench
實驗選擇了采樣頻率為12khz,負載為2hp,故障直徑分別為7mils、14mils和21mils下的10種軸承狀態數據,具體樣本組成信息,如表2所示。由表2可知,實驗數據共由1000個樣本組成,樣本長度為1000。在訓練前,通過半重疊式的樣本切割方式形成1999個子樣本,并將其劃分為1280個訓練子樣本,320個驗證子樣本和399個測試子樣本。模型訓練采用python軟件中的Keras框架,批處理個數為32,epochs為5000,損失函數采用交叉熵損失函數,使用adam優化算法,其中學習率設為0.001。

表2 樣本具體組成信息Tab.2 Sample Specific Composition Information
ResNet訓練后訓練集和驗證集的準確率曲線,如圖5所示。

圖5 模型訓練和驗證的準確率曲線Fig.5 Accuracy Curve of Model Training and Verification
從圖中可以看出,在模型訓練過程中,隨著epochs的不斷增加,訓練集的準確率收斂于1;驗證集的準確率雖然在訓練過程中有波動,但是總體收斂趨勢表現良好。這表明ResNet模型在訓練過程中能夠更好學習到振動信號之間的特征關系。通過混淆矩陣更加清晰的顯示測試集對滾動軸承狀態的識別狀況,如圖6所示。從混淆矩陣可以看出,測試集中45個故障直徑為7mils的滾動體損傷樣本中有1個樣本被誤判為故障直徑為7mils的外圈損傷,其余九種滾動軸承狀態均分類正確,這表明了提出的ResNet模型具有較高的軸承故障識別率。

圖6 測試集識別結果Fig.6 Test Set Recognition Results
利用當前主流的流行學習算法(t-SNE)[10]將每一個殘差模塊,最大池化層和平均池化層輸出的高維特征映射到二維特征,并將其進行可視化,降維可視化結果,如圖7所示。其中,不同的顏色代表不同的軸承故障類別。從圖中可以看出,隨著層數的不斷加深,相同狀態的數據點很好的聚集在一塊,不同狀態的數據點逐漸分離。以上結果表明,深度殘差網絡具有出色的特征提取能力。

圖7 T-SNE降維可視化結果Fig.7 Dimension Reduction Visualization Results of T-SNE
為了驗證提出的ResNet模型與其它故障診斷模型的識別性能,選取了深度神經網絡(DNN)、深度置信網絡(DBN)和四層的卷積神經網絡(CNN-4)進行對比試驗。其中,DNN和DBN是由輸入層,兩個隱藏層和輸出層組成,其神經元個數分別為1000,100,100,10。CNN-4是由四個卷積層,四個最大池化層和全連接層組成。其中,第一個卷積核大小為(64×1),移動步長為16,其余卷積核大小均為(3×1),移動步長均為1,最大池化層大小為(2×1),移動步長為2。全連接層由32個神經元組成。所有對比模型均采用Softmax分類器。對比結果,如表3所示。

表3 不同模型的分類精度(%)Tab.3 Classification Accuracy of Different Models(%)
從表中可以看出,DNN和DBN模型對軸承狀態的綜合識別率較差,其原因在于淺層神經網絡模型的特征學習能力有限,不能學習到更加有用的特征。相比DNN和DBN模型,CNN-4模型在診斷精度和穩定性均體現了較大的優勢,其原因是它通過局部連接和權值共享保留了重要的參數,減少了大量參與訓練的權重計算,達到了良好的學習效果。但是,與ResNet相比,ResNet通過多個殘差模塊相互堆疊,并且對其進行殘差和卷積運算,使軸承狀態達到了最高為99.75%的綜合識別率。因此,ResNet模型學習到的特征具備很好的分類特性,能夠很好的運用在軸承的故障診斷中。
針對傳統故障診斷方法診斷效率低,耗費時間長等缺點,將深度殘差網絡成功的應用在滾動軸承的故障診斷中。首先將原始樣本進行半重疊的樣本分割,其次將分割后的子樣本劃分為訓練子樣本,驗證子樣本和測試子樣本,最后通過對深度殘差網絡進行訓練、驗證和測試,實現了滾動軸承的故障分類。經過與其它故障診斷模型做對比實驗,表明了深度殘差網絡在滾動軸承的狀態識別上具有較高的準確率。同時,利用t-SNE降維可視化證明了殘差網絡具有很強的特征提取能力。然而,深度殘差網絡結構較為復雜,有大量的參數需要參與訓練,訓練花費時間較長,并且模型的訓練參數選擇需要經過反復的試驗才能確定,所以將模型結構參數進一步優化成為下一步研究的重點。