吳春志,吳守軍,馮輔周,朱俊臻
(陸軍裝甲兵學院車輛工程系,100072,北京)
旋轉機械是指主要依靠旋轉動作完成特定功能的機械,典型的旋轉機械有齒輪箱、減速機、汽輪機、燃氣輪機、風機、發電機、發動機等。以齒輪箱為例,作為傳動系統的關鍵部件,其廣泛應用于風力發電機組、煤礦開采設備、車輛傳動機構等很多重要的機械設備。齒輪箱故障可能會造成生產停滯,甚至導致人員傷亡[1]。齒輪箱的主要故障有不平衡、軸承不對中、松動及齒輪部件的斷裂磨損等[2-3]。因此,對旋轉機械進行在線監測與故障診斷成為系統設計和維護中非常關鍵的環節[4-5]。
在齒輪箱的實際工作中,運行工況多變,在實際工作中采集齒輪箱的振動信號,遠比臺架試驗中得到的信號受噪聲干擾嚴重[6]。但是,由于條件有限,在實際應用環境中得到特定故障信號有一定的難度,因此由人為在臺架試驗中注入故障是進行不同故障模式信號收集、建立故障診斷模型最直接有效的手段[7]。如何平衡臺架試驗與實際環境應用間的矛盾,是擺在故障診斷模型進一步應用的難題。
深度學習是近年來人工智能領域研究的熱點,作為代表的卷積神經網絡以其特有的網絡結構和訓練方式,直接以原始信號作為輸入,模擬輸入和輸出之間的復雜關系,減少了對專家經驗的依賴,也無需人工提取特征,在旋轉機械故障診斷中應用也越來越廣泛[8-11]。但是,傳統的深度學習模型魯棒性差,診斷準確率易受噪聲影響,為此,一些學者從數據和算法兩個方面,提出了對噪聲有一定抵抗能力的深度學習故障診斷模型。文獻[12]使用自編碼器先對信號降噪再輸入到一維卷積神經網絡(1-DCNN)模型中實現降噪,但需要訓練兩個模型,而且測試信號的信噪比僅為1 dB。文獻[13-16]提出了具有一定抗噪性的深度學習模型,可以不對數據進行處理,但是,測試信號的信噪比最低僅為0 dB,對低于0 dB的強噪聲干擾沒有研究或者診斷效果較差。
本文在文獻[17]改進的1-DCNN模型基礎上引入多尺度的概念,提出多尺度卷積神經網絡(MSCNN)模型。該模型可以降低訓練集信號間隔的敏感度,提高診斷的準確率[18]。同時提出一種高幅值截斷(HAT)的頻譜信號處理方法,處理后的頻譜信號作為訓練集訓練MSCNN模型,然后在不同的信噪比測試集中進行測試。將本文模型與集合經驗模態分解(EEMD)降噪方法、直接以振動信號和頻譜信號作為輸入的MSCNN模型以及使用1-DCNN模型的方法進行對比,以不同信噪比測試集中的精確率和召回率的調和平均值為評價指標,采用具有豐富故障模式的PHM2009齒輪箱故障數據集在強噪聲干擾下進行測試,驗證本文模型的抗噪能力,同時使用加權梯度類激活映射(Grad-CAM)方法可視化顯示模型的分類權重。
將傳統用于二維圖像識別的卷積神經網絡模型改造成用于一維信號的1-DCNN,如圖1所示。一個完整的CNN模型包括了輸入層、CNN層組(由卷積層和池化層組成)、全連接層、輸出層等幾個部分。

圖1 1-DCNN網絡結構圖
為了提高特征提取的維度,將多尺度的概念引入1-DCNN中,即增加多種步長移動方式,以提取信號不同尺度的特征,擴充特征維度,得到MSCNN模型,如圖2所示。其中,convd1、convd2、convd3分別代表移動步長為1、2、3的卷積核。不同的CNN層組搭配不同移動步長的卷積核,可以使卷積后得到不同尺度的特征量。不同尺度的特征之間差異性相對較大,這增加了特征提取的豐富程度。

圖2 多尺度卷積神經網絡模型
在網絡進行全連接之前,卷積層保留了丟失的空間信息,Grad-CAM方法[19]可利用最后一層卷積層的梯度信息,然后將信息反向傳播到其他卷積層,以此來了解該卷積中每個特征圖對特定分類做出決策的重要性,即權重。將卷積層的特征圖與其對應的重要性權重相乘后,就得到了所分類的特征定位圖。與CAM方法不同,Grad-CAM方法不需要將網絡修改為平均池化重新訓練,對于含有全連接層的一般網絡可直接使用,具體可分為以下6個步驟。
(1)假設Lc,Grad-CAM∈cu×v是類別c的定位圖,其中u和v是其寬度和高度。
(2)在輸出層之前計算類別c的梯度yc。

(4)分別對Q個特征圖的梯度求像素平均,獲得該特征圖的重要性權重,計算公式如下
(1)
式中:αc,q為第q個特征圖對類別c決策的重要性;Z為Aq的像素數;Aq(i,j)為Aq中(i,j)處的像素值。
(5)將Q個特征圖與其對應的權重αc,q相乘再求和就得到了Lc,Grad-CAM。對類別c有正向貢獻的特征值應該被關注,而負向貢獻的應該舍棄,因此增加一個修正線性單元(ReLU)作為激活函數,將小于0的特征值置0,由此可得
(2)
(6)將得到的Lc,Grad-CAM重采樣,匹配輸入的樣本大小,即可得到網絡對樣本的分類權重定位圖。
本文以PHM2009 Challenge Data數據庫的斜齒輪故障為例進行分析。該數據集是PHM協會在2009年國際競賽的全套齒輪箱數據。斜齒輪箱結構如圖3所示。斜齒輪嚙合模式下共有8種包含齒輪裂紋、斷齒,軸承滾動體、內圈、外圈以及軸的不平衡、鍵槽磨損等單一及復合故障模式(Spur1~Spur8)[20]。采樣頻率為66.67 kHz,采樣時間為4 s,采樣點數為266 656。為了優化模型的運算速度,在有限數據樣本內包含更多周期的信號,對原信號進行降采樣1/3處理。取樣本數據段長度為1 600點,可以包含2~3個周期的振動數據。

圖3 PHM 2009 Challenge Data斜齒輪箱結構
齒輪箱在試驗中測得的振動信號本身就包含一定的噪聲,并不是純凈的故障模式振動信號,但是相對于實際應用情況,試驗臺得到的信號信噪比相對較高,因此為了模擬實際工作中可能遇到的噪聲情況,在信號中添加不同信噪比的高斯白噪聲。
信噪比RSN的定義如下
(3)
式中:Psingal和Pnoise分別代表信號和噪聲的有效功率;Asignal為信號的平均幅值;Anoise為噪聲平均幅值。信噪比的單位為dB。為了更好地顯示噪聲對信號的影響,列出信號幅值與噪聲幅值的比值Asignal/Anoise,該比值與信噪比的關系如表1所示。
為了更直觀的展示不同信噪比的含噪信號,以Spur2信號為例,圖4顯示出不同信號比下含噪信號、噪聲信號以及含噪信號的頻譜。結合表1和圖4可知,當信噪比為0 dB時,噪聲信號和原信號的幅值比為1∶1,此時頻譜圖還能基本保未加噪聲時的形狀(如圖4c所示),但當信噪比繼續減小,尤其是減小到-10 dB時,噪聲幅值已經是原信號的3倍(如圖4h所示),頻譜圖中已經看不到原信號大概形狀,低幅值的頻率都湮沒在噪聲中。因此,若使提出的抗噪模型有效果,則至少應滿足在0 dB時保持較高的診斷精確率。

表1 信號噪聲幅值比與信噪比關系
在時域中進行降噪處理很難完全將加入的噪聲分量剔除出去,由圖4可知,在信噪比取一定范圍內,含噪信號的頻譜圖整體趨勢是不變的。如果將幅值小于某一定值的頻率直接置0,只考慮幅值較大的幾個頻率值,將調整后的頻譜信號作為輸入,將在一定程度上減弱噪聲的影響。以PHM2009齒輪箱的正常信號Spur1(35 Hz轉速下低負載)為例進行分析。

(a)RSN=0 dB含噪信號
圖5是進行HAT處理的流程,在求取頻譜后,按照幅值從大到小的順序排列,然后取前k個為有效值,第k個值為α,然后將小于α的值置0,得到最終的HAT頻譜向量(該頻譜向量的長度為原樣本經過求取頻譜后再經HAT處理后的數據點數,用符號N表示)。通過實驗發現,k值過大起不到降噪效果,過小會影響樣本的有效數據量。在本次研究中k值統一取30,整個數據集α的確定以正常信號下第30個頻率值的平均幅值為準,本數據集中α為0.029。采用HAT處理數據集后,減弱了頻譜中幅值低的頻率成分對分類的權重貢獻,減少低幅值噪聲信號對信號的干擾,但是依然保留了0值所在的位置信息。降低了加噪信號和原信號之間的差異,突出高幅值頻率成分的權重貢獻。

圖5 HAT處理頻譜信號流程
Spur1在加入不同信噪比噪聲數據后進行HAT轉換可得到圖6,可以看出在信噪比為0 dB時,數據結構變化不大,但是當信噪比繼續增大到-5 dB甚至-10 dB時,HAT后的數據也幾乎湮沒在噪聲信號里。HAT轉換后的頻譜不止是特征數值上的信息,還包括了特征的位置信息。

(a)RSN=5 dB
本節中采用未作處理的直接以振動信號進行輸入的Raw-MSCNN模型、經過EEMD降噪的振動信號作為輸入的EEMD-MSCNN模型、以原始頻譜信號作為輸入的Frequency-MSCNN模型和本文提出的HAT-MSCNN模型以及作為對比的HAT-CNN模型(在后續圖表中省略MSCNN和NN),在試驗臺取得的振動信號組成的訓練集中進行訓練,在添加不同信噪比高斯白噪聲的測試集中進行測試,對PHM2009齒輪箱故障數據做故障診斷研究,具體流程如圖7所示。

圖7 5種模型訓練和測試的流程圖
在Raw-MSCNN和EEMD-MSCNN模型中,輸入數據都是基于時域信號,樣本長度為1 600點,為了保證模型的一致性,在應用Frequency-MSCNN、HAT-MSCNN和HAT-CNN時取樣本長度為3 200點,然后求得頻譜信號長度為1 600點,測試集信噪比與表1設置一致。兩種深度學習網絡卷積核大小都設置為21和11,學習率為5×10-4。1-DCNN兩個層組的卷積核數量為8和15,MSCNN為6和10,這樣在全連接層的神經元數量都為6 000,保證了特征提取數量的一致。
抗噪模型至少應在信噪比為0 dB時保持較高的診斷精確率。因此本文采用t分布領域嵌入算法(t-SNE)分析在RSN=0 dB時,測試集樣本在不同模型下全連接層的聚類效果,得到圖8。其中t-SNE的參數設置為PCA模式,最大迭代次數10 000,學習率為500。
t-SNE關心的是學習維持數據的局部結構,降到2維空間時會保留數據的流形結構,類間的距離遠近不代表真實數據的分類距離,是一個聚類示意圖。由圖8可知,HAT-MSCNN和Freuqency-MSCNN在信噪比為0 dB時分類效果最好,其他模型在聚類過程中都有重疊,分類效果較差。

(a)RAW (b)EEMD (c)Frequency
由于在增加了高斯白噪聲后,模型的診斷的精確率和召回率偏差較大,因此本節采用二者的調和平均值F作為評價指標,其計算方法如下
(4)
式中:參數β一般取1;Precall是召回率;Pprecision是精確率。
表2比較了幾種模型在不同信噪比噪聲信號中的F值,由表2可知,HAT-MSCNN和Frequency-MSCNN相較于其他幾種模型,在較強噪聲干擾(RSN=-4 dB)時仍能保持較高的診斷性能。當信噪比較低時,尤其是HAT-MSCNN,在RSN=-6 dB時,F值達到了89.1%,在RSN≥-4 dB時,F值超過了98%。HAT-CNN模型在RSN≤-4 dB時無法分類故障,說明1-DCNN對數據加噪敏感。因此,在強噪聲環境下,HAT-MSCNN具有更高的抗噪性和故障特征學習能力。

表2 幾種模型在不同信噪比噪聲信號中的F值比較
使用Grad-CAM方法得到的本文模型對不同故障類型分類權重的可視化結果如圖9所示。圖9表明,本文模型對不同故障類型關注的側重點不同,幅值較高的特征部分更加突出,減少了可能會被噪聲影響的幅值較低的頻率成分對分類的干擾。

(a)Spur1 (b)Spur2
圖10是本文模型對Spur5不同信噪比的測試信號的分類權重,結合圖9e可知,本文模型對于分類成Spur5的故障模式,更加關注其250點和800點左右的成分,這兩個點附近對應的頻率在頻譜中幅值占比較高。在不同信噪比的噪聲信號中,本文模型準確地找到了這兩個頻率段的特征。

(a)RSN=0 dB (b)RSN=-2 dB
本文提出一種強抗噪性的故障診斷模型HAT-MSCNN,實現了在強噪聲干擾下齒輪箱多種復合故障的診斷識別。首先使用高幅值截斷的策略構建訓練集,然后輸入到多尺度卷積神經網絡模型進行故障診斷,同時使用Grad-CAM方法可視化顯示分類權重。經HAT處理后的信號突出了幅值較高的頻率成分,降低了低幅值頻率成分被噪聲耦合后對模型診斷的影響。實驗結果表明,直接以頻譜信號作為輸入的診斷模型雖對噪聲有一定的抵抗能力,但HAT-MSCNN模型在信噪比為-4 dB時,診斷準確率為98.6%,而在信噪比為-6 dB時,診斷準確率依然能保持在90%左右,遠高于其他模型。因此,HAT-MSCNN模型可以有效減少噪聲對診斷模型的影響。