陳科, 段偉建, 吳勝利*, 邢文婷
(1.重慶交通大學交通運輸學院, 重慶 400074; 2.重慶市公安局交通管理局, 重慶 400054;3.重慶工商大學管理科學與工程學院, 重慶 400067;)
齒輪傳動在航空、風力發電機及精密機械等設備應用廣泛,然而,大量機械故障是由齒輪故障引起[1],既會產生大量的經濟損失,甚至會影響人身安全,因此亟需對齒輪箱中齒輪進行狀態實時檢測和齒輪故障診斷[2-3],這對人身安全和機械設備的穩定運行具有重要的意義。齒輪故障信號不僅有非平穩調制特性[4],而且齒輪運行工況常有噪聲對其影響,因此振動信號信息復雜、時變性強,其故障振動信號在設備采集時能量變化大,增大了提取故障特征的難度[5]。
針對以上問題,Soualhi等[6]使用傳統分類器對齒輪進行了故障診斷。但是在手動提取齒輪的故障特征時,傳統分類器和信號處理技術對數據的處理能力有限,學習到數據的高維特征比較困難,而且診斷的過程中容易產生局部最優的情況,致使診斷效果偏差[7]。堆疊降噪自編碼根據網絡結構,對有噪聲干擾的輸入數據進行自適應特征自動提取[8-9]。因此,該神經網絡可以應用于對齒輪箱齒輪故障診斷。Lu等[10]根據采集的單一傳感器振動信號,應用堆疊降噪自動編碼器進行了軸承故障診斷。但是上述文獻中,大多使用單一傳感器收集故障數據,導致數據具有局限性,不能全面表達被測物體的故障狀態[11],而且信號采集系統在單傳感器出現故障時便不能正常采集振動信號,系統的可靠性和容錯性相對較低,對比單傳感器,多傳感器的信息融合診斷提供了更豐富和全面的故障信息,更好地反映被測對象的狀況;在某個傳感器失效時,正常傳感器繼續收集齒輪故障信息。其次運用一種神經網絡進行診斷,診斷結果有不確定性。
基于以上問題,提出了多深度學習模型決策融合的齒輪箱故障分類方法,構建了基于卷積神經網絡(convolutional neural networks,CNN)和改進堆疊降噪自動編碼器(stacked denoising autoencoders,SDAE)的混合模型,混合模型能夠自動提取故障特征,避免傳統故障診斷技術容錯性差、人工提取信號特征困難、需要人工經驗等弊端。同時采用兩個傳感器進行信號采集,能夠解決單傳感器可靠性、容錯性較低等問題,為齒輪故障診斷提供更多有效的故障信息。
多傳感器獲取的振動信號蘊含了豐富的齒輪故障信息,憑借CNN具有局部連接、權值共享、降維以及SDAE具有自動從噪聲數據中提取魯棒故障特征,客觀地反映數據特征等優點,提出了一種基于多深度學習決策級融合的齒輪故障診斷分類方法。該模型具體步驟是,首先利用多傳感器采集齒輪箱故障振動信號,將連續小波變換后的時頻信號作為CNN的輸入,將傅里葉變換后的頻域信號作為SDAE的輸入,把兩種網絡的診斷輸出歸一化作為Dempster-Shafer (D-S)證據理論的BPA值,基于加權思想改進兩個神經網絡的證據,根據組合規則進行決策融合。該研究的技術路線圖,如圖1所示。

圖1 多深度學習模型決策融合的齒輪箱故障分類技術路線圖Fig.1 Technical roadmap of gearbox fault classification based on decision level fusion of multi-deep learning models
Adam算法是一種可以動態改變參數學習率的優化算法,通過反向微調網絡,使損失函數值最小化[12]。該算法能處理非靜態的故障輸入數據,還能在梯度彌散的情況下取得不錯的優化效果。而且,Adam優化算法具有較高的計算速度,適合處理網絡模型大規模參數的優化問題。為避免過擬合現象的發生,引入添加Dropout[13]機制的堆疊降噪自動編碼器,用dropout技術訓練模型,降低模型過擬合的風險。此外,在隱層前加入批正規化層[14],起到加速模型收斂、控制過擬合,緩解梯度消失或者爆炸的作用。因此,利用Adam優化算法和Dropout技術,給出多深度學習模型決策級融合的齒輪箱故障分類方法訓練過程,具體如下。
步驟1通過連續小波變換獲取大量帶標簽的故障信號時頻圖樣本,另外通過快速傅里葉變換生成故障信號頻域圖樣本。將各樣本集劃為訓練樣本集、驗證樣本集和測試樣本集。
步驟2構建CNN和SDAE模型,設置學習率、批量大小等超參數。
步驟3用訓練樣本對CNN和SDAE模型進行訓練,通過網絡多層結構自動提取故障特征。
步驟4利用Adam優化算法優化混合模型,使得模型逐漸收斂,能夠輸出理想的診斷精度。
步驟5對測試樣本集進行識別,將神經網絡的輸出值進行歸一化作為每種故障模式的BPA值送入決策融合模塊。
步驟6通過改進的D-S證據理論實現融合,得出各故障模式的分類結果。
CNN匯集了權值共享、池化操作等機制,可以揭示原始二維信息中的本質特征。網絡由卷積層、池化層和全連接層等組成[15],結構如圖2所示。

圖2 深度卷積網絡結構圖Fig.2 Structure of deep convolution network
卷積層用于提取數據局部特征。輸入卷積層為X,屬于RA×B,A、B為輸入數據維度,輸出為
(1)


(2)
式(2)中:max為選取函數自變量的最大值;x為激活函數的自變量。
池化層不僅能特征降維和減少計算量,而且還能控制過擬合。最大池化是最常用的池化方式,輸出表達式為
(3)
式(3)中:pcn為池化層第cn個輸出;S為池化層尺寸。
全連接層在CNN中具有重新組合局部特征的作用,其數學表達式為
h(x)=f(b0+k0x)
(4)
式(4)中:x為特征向量;k0為權重;b0為偏置。
在全連接層上應用softmax分類器可以對齒輪箱故障齒輪的振動信號進行識別分類,輸出診斷分類結果。

(5)

(6)
式(6)中:θ為編碼網絡參數集合;W為權重矩陣;b為偏移向量。


圖3 SDAE的模型結構Fig.3 Model structure of SDAE

(7)
式(7)中:θn+1為網絡輸出層參數;g(·)為分類器的激活函數。
假如xm的狀態類別為ym,SDAE使用最小化交叉熵損失函數LSDAE實現網絡微調,應用Adam優化算法微調網絡各項參數。

(8)
式(8)中:θ為SDAE的參數集,θ={θ1,θ2,…,θn+1};M為樣本數。
研究發現SDAE可以有效改進分類效果,能從含噪聲樣本中自動提取魯棒性的齒輪故障特征[18]。
以往研究中,信息融合常使用D-S證據理論決策融合方法,但是傳統證據理論融合診斷方法存在部分異常的證據容易導致證據之間發生沖突,使得融合診斷結果不準確或者發生誤診的問題,為了解決這個問題,采取兩種方法減小證據間沖突,首先運用兩種神經網絡與證據理論結合,將神經網絡的輸出歸一化為證據理論基本概率分配值BPA,歸一化公式為
(9)
式(9)中:m(Ak)為Ak故障的BPA;y(Ak)為實際輸出;Es為輸出誤差,其計算公式為
(10)
基于加權的思想提出一種改進的D-S證據理論,用來改進證據,步驟如下。
步驟12個證據E1和E2之間的相似系數d12可表示為
(11)
式(11)中:Bi、Ci分別為證據1、2下的故障;m1、m2為兩種證據的基本概率分配值;d12∈[0,1],相似系數值的大小對應相似程度的高低,且dij=dji。
步驟2其他證據對證據Ei的支持度S(mi)為
(12)
式(12)中:n為證據數量,如果證據之間相似,則彼此支持程度也越高。
步驟3將支持度歸一化后得證據Ei的可信度,即
(13)
可信度大小對應了證據可信程度的高低。根據融合規則對改進的證據進行信息融合,可得到齒輪不同故障的綜合診斷結果。
本實驗以二級減速齒輪箱為研究對象,通過識別其故障狀態驗證提出方法的有效性。齒輪箱傳動系統,如圖4所示。

圖4 齒輪箱傳動系統示意圖Fig.4 Schematic diagram of gearbox transmission system

圖5 齒輪故障試件Fig.5 Gear fault test piece

圖6 裂紋故障振動特性Fig.6 Vibrationcharacteristics of crack fault
設置加速度傳感器采樣頻率10 kHz,采樣時間32 s,電機轉速1 400 r/min。加工4種齒輪模擬齒輪4種典型狀態,即正常、點蝕、剝落、裂紋,齒輪故障加工試件如圖5所示。針對4種齒輪狀態,齒面剝落、點蝕、裂紋分別加工故障程度不同的4個齒輪采集多組故障信號,齒面剝落加工4個矩形長度不同,尺寸為2 mm(寬度)×1 mm(深度)的齒輪,齒根裂紋故障加工于一個齒根處,4個齒輪初始裂紋傾角為70°,裂紋深度為1~4 mm。不同故障齒輪振動信號時域圖、頻譜圖、小波時頻圖,分別如圖6、圖7、圖8所示。

圖7 點蝕故障振動特性Fig.7 Vibration characteristics of pitting fault

圖8 剝落故障振動特性Fig.8 Vibration characteristics of spalling fault
在進行CNN故障診斷實驗前,對信號預處理需要對數據進行One-Hot 編碼方式編碼,CNN每種故障取200個樣本,樣本長度為1 024,SDAE中1 024個采樣點為一組數據,每種故障狀態采集250組樣本。SDAE和CNN的模型參數,分別如表1、表2所示。
為了得到理想的CNN診斷模型,設置合適的超參數很關鍵,通過試驗,將最小批量設置為16、學習率為0.005、Dropout率為0.5、MaxEpochs為25,每輪迭代次數為113。通過連續小波變換轉變成二維時頻圖樣本輸入CNN模型中進行訓練與驗證,最終得到訓練過程中的準確度曲線與損失曲線,如圖9所示。可以看出,隨迭代次數增加,CNN診斷正確率不斷升高,并趨于相對穩定,誤差不斷下降并趨近于零,當達到設置的最大迭代次數Epoch=2 825時,CNN模型驗證集得到95.86% 的診斷精度,程序運行測試集達到92.12%的故障診斷率,實現了良好的預期診斷。
將時域信號作為SDAE的輸入數據進行訓練時效果并不理想。因此,SDAE將頻域信號作為網絡輸入,自動進行特征提取,提取完成后,對網絡隱含層進行訓練和微調,各隱層前添加批正規化(batch normalization,BN)層,正常的SDAE屬于無監督網絡,預訓練部分是以無監督的方式進行學習,不需要標簽,在微調部分引入標簽使得網絡逐漸收斂,并采用Adam優化算法更新權值直到損失函數達到最小。
經過100次迭代的訓練,如圖10所示,標簽1、標簽2、標簽3、標簽4分別對應齒輪4種故障狀態,即:正常、裂紋、點蝕、剝落,SDAE測試集實際分類能大概率正確分類故障齒輪。SDAE測試集的正確率曲線,如圖11所示,曲線從迭代次數40左右開始趨于平緩,到達迭代次數100時,最終故障診斷正確率為91%。

表1 SDAE模型參數Table 1 SDAE model parameters

表2 CNN模型參數Table 2 CNN model parameters

圖9 CNN訓練過程驗證集正確率曲線與損失曲線Fig.9 Correct rate curve and loss curve of verification set in CNN training process

圖10 SDAE測試集實際分類與預測分類結果Fig.10 Actual classification and predicted classification results of SDAE test set
齒輪箱齒輪常見狀態情況有裂紋、正常、點蝕、剝落,神經網絡輸出層有4個神經元,每個神經元對應一種狀態,輸出誤差對應不確定狀態,當齒輪發生裂紋故障時,故障理想輸出為1,其余故障輸出為0,即(1,0,0,0),將測試集故障數據進行網絡測試,測試組的樣本數據是齒輪發生裂紋故障時的數據,得到裂紋、正常、點蝕、剝落的輸出結果,如表3所示。

表3 2個神經網絡的輸出結果Table 3 Output results of two neural networks
利用式(9)、式(10)歸一化表3的輸出結果得到兩個證據的BPA值,如表4所示。

表4 2個證據的基本概率分配值(改進前)Table 4 Basic probability distribution values of two evidences (before improvement)
通過式(11)~式(13)計算兩個證據之間的相似系數、支持度、可信度,以可信度為權重,對表4證據進行加權修改,得到新的BPA值,如表5所示。最后根據融合規則進行融合,融合結果,如表6所示。
從表3~表6可以看出,經過改進的證據理論融合后,經過兩個神經網絡的實際故障的BPA值進一步提高,達到了98.42%,其他類型故障概率基本為0。將隨機組成的400組測試集數據用上述改進的證據理論融合方法進行故障診斷分類,得到了相同的趨勢,改進的證據理論融合方法能夠融合不同的神經網絡輸出結果,這樣避免了網絡的單一化,保證了故障信息的多樣性。

圖11 SDAE測試集正確率曲線Fig.11 Accuracy curve of SDAE test set

表5 2個證據的基本概率分配值(改進后)Table 5 Basic probability distribution values of two evidences (after improvement)

表6 融合后各故障模式的BPA值Table 6 BPA value of each fault mode after fusion
(1)基于神經網絡深度學習,將CNN和改進SDAE和改進的D-S證據理論相結合應用于齒輪箱齒輪的故障診斷分類。通過改進證據,解決了證據理論因證據沖突影響診斷結果的問題。其次將兩個深度神經網絡的輸出結果作為改進證據理論的輸入進行信息融合,使得實際故障的BPA進一步提高,使診斷結果更加準確。
(2)基于CNN和SDAE混合模型基礎上,提出齒輪箱齒輪故障診斷識別分類方法,將Adam算法和Dropout等技術用于網絡模型,既解決了參數優化問題,又提高了泛化能力。并且,采用多種深度學習網絡,能夠挖掘出故障更多的關鍵信息,避免單一網絡的局限性。