顧 鑫,唐向紅,2,3,陸見光,2,3,黎書文
(1.貴州大學 現代制造技術教育部重點實驗室,貴陽 550025;2.貴州大學 機械工程學院,貴陽 550025;3.貴州大學 公共大數據國家重點實驗室,貴陽 550025;4.貴州理工學院 機械工程學院,貴陽 550003)
滾動軸承是旋轉機械中的核心部件,它的穩定運轉是保證設備正常工作的重要前提,一旦軸承出現故障,不僅影響設備的正常運行,還會對工人的生命安全造成隱患[1]。因此,研究軸承的故障診斷具有重要意義。近年來,隨著大數據和人工智能的興起[2],基于深度學習的軸承故障診斷也隨之成為研究的熱點課題[3]。深度卷積神經網絡作為深度學習算法中的典型代表之一,在軸承故障診斷的研究中取得了一定的進展。李恒等[4]通過對輸入的振動信號進行短時傅里葉變換,利用深度卷積神經網絡診斷軸承故障,結果表明該方法有效的實現了“端到端”的故障診斷。文獻[5]中通過對振動信號先進行離散小波變換再通過卷積神經網絡對故障進行分類識別,實驗證明了該方法的有效性。文獻[6]提出一種卷積降噪自編碼器和深度CNN結合的軸承故障方法,從而實現軸承故障的準確分類。文獻[7]在LeNet-5的基礎上提出基于一維深度CNN的軸承故障診斷方法,實驗結果表明,該方法不僅有效的識別故障類型而且還提高了模型的抗噪性能。曲建嶺等[8]提出了基于CNN的層級化軸承故障診斷方法,結果表明該方法具有良好的故障識別性能和泛化性能。上述研究在軸承故障診斷方面取得了較好的效果,深度卷積神經網絡通過逐層交替的卷積層和池化層提取特征,在特征提取方面發揮出了良好的特性,但是,深度卷積神經網絡采用梯度下降的方法來尋找最合適的權重值,這導致訓練過程會耗費大量的時間,因此,深度卷積神經網絡可以作為一個良好的特征提取器。極限學習機ELM是在2006年由Huang等[9]提出的一種單隱層的神經網絡學習算法,因其具有訓練速度快和泛化性能好等優勢被廣泛應用在各個領域[10-11],可以作為模型的分類器很好的彌補深度CNN訓練時間長的缺點。綜上所述,本文提出一種基于深度CNN和極限學習機ELM相結合的故障診斷方法。首先利用深度CNN的強大自適應提取特征的能力提取振動信號的特征,然后構建ELM分類模型,借助其訓練速度快的優勢,實現對軸承故障類別的快速有效的分類。實驗結果表明,該方法可以實現實時高效的“端到端”軸承故障診斷。
卷積神經網絡CNN是一類包含卷積計算且具有深度結構的前饋神經網絡,是深度學習的代表算法之一。近年來,卷積神經網絡CNN被廣泛應用在各個領域,比如:在語音識別、人臉識別、自然語言處理甚至腦電波分析等方面均有突破[12]。一個典型的CNN網絡通常包含輸入層、卷積層、池化層、全連接層和輸出層,其結構如圖1所示。

圖1 典型的CNN網絡結構示意圖
卷積層中的每個卷積核都代表著一個特征圖,這些卷積核通過一組權重來卷積前一層的輸入并組成一組特征輸出,成為下一層的輸入。卷積操作過程的數學表示為:
(1)

卷積層的后面常接入的是池化層(下采樣層),池化層會對卷積層得到的特征圖進行降維操作,同時在一定程度上也控制了過擬合。常用的池化方法有: 最大值池化(max-pooling)、平均值池化(mean-pooling)、全局最大池化(global average pooling)、隨機池化(stochastic-pooling)等[13]。池化層一般只進行降維操作,沒有參數,不需要進行權值更新。池化層的數學表達式為:
X=f(αdown(x)+b)
(2)
式中:X為輸出;f(·)為激活函數;α為乘性偏置,down()為下采樣函數;b為偏置項。
經過前面的卷積層和池化層后,會接一個全連接層進行匯合,然后通過Softmax分類器進行分類。假設有M類的分類問題,Softmax 分類的數學模型表示為:
(3)
式中:S是最終輸出,W是卷積核的權重矩陣;b是偏置項。
極限學習機ELM是一種單隱層前饋神經網絡結構的學習算法,最初是由新加坡南洋理工大學的Huang教授等人提出的[9,14]。它通常由輸入層、隱藏層、輸出層組成,其中,輸入層的神經元個數由輸入向量的維數決定,輸出層的神經元個數由輸出的類別決定[15-16]。其網絡結構如圖2所示。

圖2 ELM分類器網絡結構示意圖
假設有N個不同的隨機樣本(χm,tm),m=1,2,…,N,
其中:
χm=[χm1,χm2,…,χmn]T∈Rn
tm=[tm1,tm2,…,tmn]T∈Rn
則樣本的線性表達式為:
Wβ=Y
(4)
其中,W表示神經網絡隱藏層的輸出向量:
(5)
Y表示樣本的實際輸出向量:
(6)
h(χ)=g(ω·χ+b)
(7)
式中:g(·)為激活函數;ω為輸入權重;b為偏置。
則β可以表示為:β=WTY,其中,WT是W的廣義逆矩陣。
本文提出的DCNN-ELM模型結構如圖3所示。

圖3 DCNN-ELM模型結構示意圖
具體的算法步驟如下:1)CNN的輸入:采用重疊取樣的方式對振動信號進行取樣,直接輸入到深度CNN中;
2)深度CNN特征提取:采用逐層交替的卷積層和最大池化層提取特征,并將此特征輸入到Flatten層展平成一維特征向量,該特征向量通過全連接層做一個特征空間變換,把前面提取到的特征加以提取整合。
3)ELM分類輸出:將步驟2)提取整合到的特征向量作為極限學習機ELM的輸入并搭建ELM模型加以訓練,利用訓練好的ELM模型測試故障類型得出分類準確率的結果。
為驗證本文所提方法的有效性和泛化性,采用CUT-2軸承實驗平臺采集振動信號對本文方法進行實驗,實驗平臺裝置如圖4所示。該實驗平臺采用的軸承型號為6900ZZ,滾動軸承的故障通過電火花加工技術點蝕在軸承內圈、外圈、球體上,故障直徑為0.2 mm和0.3 mm,軸承故障位置如圖5所示。為全面采集軸承故障的振動信號,振動信號由X、Y、Z軸三方向的加速度傳感器在1 500 r/min的轉速下采集得到,采樣頻率為2 kHz。
本次實驗的具體樣本數據集如表1所示,共10種軸承故障類型,分別為正常軸承、內圈故障(故障直徑0.2 mm)、外圈故障(故障直徑0.2 mm)、滾動體故障(故障直徑0.2 mm)、內圈故障(故障直徑0.3 mm)、外圈故障(故障直徑0.3 mm)、滾動體故障(故障直徑0.3 mm)、外圈和滾動體組合故障、外圈和內圈組合故障、滾動體和內圈組合故障,每類故障類型包含400個樣本,每個樣本包含1 024個數據點。故障樣本按照隨機70%的訓練集和30%的測試集進行訓練和測試。

圖4 CUT-2軸承實驗平臺裝置

圖5 軸承故障位置

表1 CUT-2 樣本數據集
經多次實驗測試,最終確定的模型參數如表2所示。

表2 DCNN-ELM模型參數
本次實驗在Keras框架下完成,硬件環境為:Windows7 64位操作系統,Intel(R)Core(TM)i7-6700 CPU,主頻3.40 GHz,內存8 G。
為驗證本文所提方法(DCNN-ELM)的有效性和泛化性,將其與極限學習機(ELM),支持向量機(SVM)以及 DCNN-SVM算法在分類準確率、查準率、召回率、F1-Score等4個方面進行比較。在支持向量機SVM模型中,提取時頻域上的六類特征作為輸入,并對其進行數據標準化,采用線性核函數進行分類。其余參數設置均與本文方法相同。為避免實驗結果的偶然性,每種算法均重復進行10次取平均值,結果如圖6所示:
由圖6可知,極限學習機ELM模型的各項評價指標均為最低,這是因為極限學習機為單隱層的學習算法,不能很好的提取特征來對軸承故障進行分類。支持向量機SVM模型不僅由于其本身的淺層結構限制了模型性能的提升,而且其需要人工主觀提取特征,過度依賴專家經驗,不具有自適應性能。值得注意的是,本文提出的DCNN-ELM模型的各項評價指標均高達99%且均略高于DCNN-SVM模型,這得益于深度卷積神經網絡強大的自學習提取特征能力。

圖6 不同方法的性能
為了凸顯本文在分類識別階段所用ELM分類器的優勢,分別計算了softmax分類器、支持向量機SVM分類器在平均診斷精度、訓練時間、測試時間的具體數據,為避免實驗結果的偶然性,每種算法均重復進行10次取平均值,結果如表3所示。由表3可知,本文在分類識別階段使用的ELM分類器在平均診斷精度方面高于SVM分類器,在訓練時間上明顯低于SVM分類器和Softmax分類器,這是因為ELM算法在訓練迭代過程中需要調整的參數量少,從而縮短了計算時間。因此,綜上所述,本文所提方法可以有效的識別故障類別并可以達到實時性的識別要求。

表3 不同分類器的性能數據
為了進一步直觀展示本文所提出的DCNN-ELM模型對各個故障類別的識別結果,引入混淆矩陣對分類結果進行展示,如圖7所示。由圖可知,本文所提模型除對個別故障類別的其他故障診斷精度均可以達到100%,可見,本文所提方法對各故障類別具有良好的識別效果。

圖7 DCNN-ELM模型的分類混淆矩陣
1)提出并實現了一種基于深度CNN和極限學習機ELM的自適應故障診斷方法,該方法結合了深度CNN強大的有效提取特征的性能和極限學習機ELM快速分類的優勢。
2)提出的方法能有效的識別軸承的故障類型,在較短時間內達到較高的診斷精度,滿足魯棒性和實時性的應用要求,為滾動軸承的故障診斷方法提供了新的思路。