談為智,馮 驍,邱 祺,丁婷婷
(1.合肥工業大學 管理學院,合肥 230009;2.江蘇省儀征中學,江蘇 揚州 211400)
高端裝備的意外故障往往會造成嚴重的經濟損失,甚至危害人員的生命安全[1]。軸承作為機械裝備的關鍵部件之一,其能否正常運轉對于高端裝備能否健康工作起到了至關重要的作用[2]。因此,預測軸承剩余使用壽命,并依據預測結果確定最佳維修時間,優化維護計劃受到了工業界與學術界的廣泛關注。如何提高軸承剩余使用壽命的準確性和魯棒性是一個值得思考的問題。
目前應用于剩余使用壽命預測的方法主要有以下2類:基于模型的方法和數據驅動的方法[3]?;谀P偷姆椒ㄖ饕ㄟ^構建一個數學模型來描述機械設備的退化過程,該方法能在一定程度上反映外部可測變量與內部物理性質之間的關系[4]。如謝宏遠等[5]采用了基于粒子濾波和遺傳算法的氫燃料電池剩余使用壽命預測方法,能夠在實現長期預測精確度的基礎上提高計算效率,并且得到了較為精確的預測結果。焦自權等[6]提出一種改進粒子濾波算法的狀態跟蹤與剩余使用壽命預測估計方法。實驗結果表明,該文提出的改進算法具有計算效率性能優良、狀態跟蹤擬合度好及預測精度高等特點。但是,在建立數學模型時需要大量關于特定物理系統的專家知識,并且所建立的模型僅適用于特定工況條件下的工業部件[7]。實際工作過程中的工業部件工作環境往往十分復雜,不能采用簡單的數學模型來預測剩余使用壽命。
伴隨著傳感器技術和物聯網技術的迅速發展,豐富的歷史運行數據可以被收集到。數據驅動的方法得到了廣泛的應用,并展示出很好的前景。數據驅動方法通常分為統計學方法和機器學習方法。傳統的數據驅動方法通常包括以下2步:特征提取和模型構建[8]。在特征提取階段,目前提取的特征通常分為以下3類,包括時域特征、頻域特征和時頻域特征。例如Behzad等[9]選擇了一個新的頻域特征:高頻帶寬均方根,用于滾珠軸承剩余使用壽命估計。與應用其他常用特征的結果相比,應用新特征可以更準確地估計軸承的剩余使用壽命。在模型構建階段,人工神經網絡、支持向量機、灰色預測方法和馬爾科夫模型等都是常用的剩余壽命預測模型。例如Elasha等[10]將回歸模型和多層人工神經網絡模型相結合,以預測運行中的風力渦輪機齒輪箱的剩余使用壽命。所提出的方法通過案例研究得到了較好的評估結果。然而,相關特征的提取和選擇通常需要相關領域的專家知識,因此模型的泛化能力存在一定的局限性。此外,傳統的機器學習模型不能自動提取非線性特征,且維度詛咒也是一個值得注意的問題。
深度學習方法能夠學習原始數據中的非線性深度特征,從而吸引了各行各業的廣泛關注,并在自然語言處理、圖像識別等領域取得了巨大成功。本文將主要介紹與研究相關的堆疊降噪自編碼器及卷積神經網絡。堆疊自編碼器旨在通過恢復輸入過程變量數據來學習分層隱藏特征表示。此外,為了從損壞的數據中恢復原始輸入數據,以增強模型魯棒性,Vincent等[11]已將降噪自編碼器(Denoising Autoencoder,DAE)用于特征提取。本文將多個降噪自編碼器的隱藏層堆疊到SDAE中,以便從軸承振動數據中獲取深層特征表示。卷積神經網絡中的卷積核能夠實現局部權值共享,并逐層挖掘相鄰數據間的共性規律。例如,張繼冬等[12]將全卷積層神經網絡用于軸承剩余壽命預測。實驗結果表明,與傳統的先人工構建性能退化指標、再預測的方法相比,所提方法大幅提高了剩余壽命的預測精度。一維卷積神經網絡(One-Dimensional Convolutional Neural Network,1DCNN)是卷積神經網絡(Convolutional neural Network,CNN)的一種變體,不同于接收矩陣輸入的標準CNN,1DCNN的輸入是一個向量。目前,1DCNN被廣泛應用于處理變化的一維信號以獲得短期動態特征,其還可以平滑輸入向量的波動。但是,由于溫度、負載等外部環境的變換,軸承轉子等系統的退化模式往往不是單一的,采用單一大小的卷積核容易遺漏局部重要特征。因此,通過利用大小不同的卷積核,可以使提取的特征更加全面有效。例如孫鑫等[13]提出了一種基于多尺度卷積神經網絡的軸承剩余壽命預測方法。實驗結果顯示,該方法具有更高的魯棒性與穩定性。為此,本文提出了一種基于SDAE和MS1DCNN的剩余使用壽命預測模型。首先,SDAE用于從添加了一些噪聲的過程數據中分層學習深度的降噪特征。之后,MS1DCNN用于捕獲不同退化模式對于軸承剩余使用壽命的影響。為了驗證提出模型的優越性,本文將提出的方法應用于PHM2012挑戰賽的軸承剩余使用壽命預測任務中,并取得了良好的預測效果。
在實際工業系統的數據采集和傳輸過程中,由于工業設備內部老化、外部環境干擾等各種原因,導致收集到的軸承振動數據中往往存在大量噪聲。為了增強自編碼器模型的魯棒性,在輸入模型訓練前需要先向原始輸入數據中加入噪聲。其結構圖如圖1所示。

圖1 降噪自編碼器結構圖

式中:ht為學習到的隱藏層特征;sigmoid為激活函數;We,be分別為權值矩陣和偏置向量。解碼階段用于產生和原始輸入維度相同的原始數據表示,其計算過程如下


堆疊自編碼網絡的核心思想是通過訓練每一層編碼器抽象出更為穩定的特征表達。在結構上,典型的堆疊自編碼器(Stacked Denoising Autoencoder,SAE)由多個無監督自編碼器和反向傳播神經網絡監督層組成。其結構圖如圖2所示。
由圖2可知,第1個自編碼器的隱藏層特征,將作為第2個自編碼器的輸入特征,并借此獲得更深層次的特征表示以提升模型的穩定性。當然,第2個自編碼器的隱藏層特征或許還是不能夠很好地反映原始數據的特性,可以將其作為第3個自編碼器的輸入去獲得更高層次的隱層特征。

圖2 堆疊自編碼器結構圖
1.3.1 卷積神經網絡
卷積神經網絡是利用卷積運算來捕獲動態特征的前饋神經網絡。如圖3所示,傳統卷積神經網絡通常由卷積層、池化層和全連接層3部分組成。

圖3 卷積神經網絡結構圖
在卷積層中,卷積核與輸入矩陣進行卷積操作,然后利用激活函數得到卷積層的輸出矩陣,其計算公式如下

式中:?代表卷積運算,能夠從振動數據中提取有用的信息;Ws和bs分別為卷積核和偏置;fc為非線性激活函數。
池化層的主要操作是對卷積層的輸出矩陣進行降維處理,以去除冗余特征的同時增加網絡的收斂速度。常用的池化操作有最大池化及平均池化等。
1.3.2 一維卷積神經網絡
不同于接受矩陣形式信號輸入的傳統卷積神經網絡,一維卷積神經網絡接受的輸入為一個向量,輸出也為一個向量,其結構圖如圖4所示。因而,在處理振動信號這一類一維時序數據時,一維卷積神經網絡的應用更為廣泛。

圖4 一維卷積神經網絡結構圖
1.3.3 多尺度卷積神經網絡
傳統的卷積神經網絡往往采用單一大小的卷積核來提取隱藏在原始信號中的特征。然而,由于原始信號的數據量較大,使用單一大小的卷積核會導致網絡在自適應的提取特征時遺漏局部重要特征,難以表征不同振動模式對于軸承剩余使用壽命的影響。
考慮到實際工況環境中常常會有噪聲干擾,并且軸承工作的外部環境常常處于變化之中,本文提出了一種結合堆疊降噪自編碼器(SDAE)和多尺度一維卷積神經網絡(MS1DCNN)的剩余壽命預測模型,結構圖如圖5所示。首先進行軸承振動數據收集與預處理,之后將處理后歸一化的數據輸入到SDAE網絡中進行數據去噪,接著通過MS1DCNN來獲取不同退化模式對于軸承剩余使用壽命的影響,以提高模型在不同工況環境下的泛化能力。最后將MS1DCNN輸出的特征使用全連接神經網絡進行回歸預測。

圖5 SDAE-MS1DCNN結構圖
由于SDAE能從損壞的數據中學習隱藏的特征表示,所以可以在一定程度上消除數據噪聲的干擾。如圖5所示,經過預處理的軸承振動數據在輸入SDAE網絡之前需要向其中加入噪聲,加入噪聲后的振動數據便可以輸入到網絡之中進行編碼操作,以獲得第一層隱藏層的特征表示。隱藏層的特征在進行解碼的操作還原出原始信號。這樣第一個DAE便構造完成了。然而,由于第一層隱藏層提取到的特征往往抽象程度不高,不能夠很好地提取出原始信號具有代表性的特征。因此,需要將第一層隱藏層的信號輸入到下一個自編碼器的網絡中。值得注意的是,在第一層隱藏特征輸入到下一層的自編碼器網絡前,仍需對該特征加入噪聲,以增加網絡的魯棒性。
由于軸承快速退化與緩慢退化時所收集到的信號振幅與頻率往往是存在差異的,使用相同大小的卷積核就有可能會遺漏局部重要特征,導致模型準確度低,泛化性能差。因此,本文基于CNN的基本原理,提出了MS1DCNN模型。如圖5所示,在經過SDAE處理之后的最后一層隱藏層特征信號將利用m種不同尺寸的卷積核進行卷積操作,由于不同大小的卷積核具備不同的感受野,不同特征感受野層能夠充分提取不同頻段的振動特征,實現提高模型預測精度。進行了多次卷積池化操作后,將輸出特征輸入全連接層進行最終的回歸預測。
本文中所使用的滾動軸承全生命周期數據來自電氣和電子工程師協會(IEEE)2012年舉辦的PHM數據挑戰賽。其數據在試驗平臺PRONOSTIA進行收集。該平臺可用于評估軸承的故障診斷和預后方法,其可以在幾個小時內加速軸承的退化過程。其實驗裝置包括3個主要的子系統即旋轉子系統、退化生成子系統和數據采集子系統。
在實驗中,獲得了軸承的溫度和振動數據,共進行了在不同電機轉速和徑向力的3種工況下的實驗,工況1和工況2各進行了7個軸承實驗,分別命名為Bearing1_1~Bearing1_7和Bearing2_1~Bearing2_7,工況3進行了3個軸承的實驗,命名為Bearing3_1~Bearing3_3。每種工況選取1和2號軸承作為訓練集,其他的作為測試集。表1列出了不同工作條件下的具體電機速度和徑向力。

表1 數據集工況信息
為了驗證預測精度,采用均方根誤差(RMSE)直接替換為RMSE和平均絕對誤差(MAE)直接替換為MAE這兩個典型指標來分析不同方法的建模性能。RMSE和MAE定義如下

式中:Ttesting為測試集樣本數;代表剩余使用壽命真值的均值;yi和y^i為i時刻剩余使用壽命的真實值和預測值。
3.3.1 參數設置
在樣本數據的劃分上,本實驗遵從PHM2012挑戰賽的樣本劃分規制,將軸承2-2作為訓練集,軸承3-3作為測試集。劃分完訓練樣本后,本小組將對網絡參數進行設置,本小組采用的堆疊降噪自編碼器共有3層,其隱藏層的維度分別為:2 000、1 800、800。另外,實驗中的多尺度卷積神經網絡分別采用3×1,5×1和7×1的卷積核。在卷積神經網絡后接一個全連接層輸出預測值。經過多次實驗和比較,最終確定的模型的2個卷積層的通道數分別為3和6,訓練學習率為0.005,批量大小為30。
3.3.2 實驗結果
為了驗證SDAE-MS1DCNN的剩余使用壽命預測性能,不同的回歸預測方法在本數據集上進行了實驗驗證。具體來說,有支持向量回歸(Support Vector Regression,SVR)等傳統的機器學習方法,也有SAE、DAE、SDAE、1DCNN、MS1DCNN、SDAE-1DCNN等深度學習方法,具體的實驗結果見表2。

表2 各模型預測效果表
由表2中數據可知,傳統機器學習方法SVR的預測結果表現最差,主要是由于SVR的淺層結構難以提取數據中的動態時間特征。SDAE的預測效果好于SAE與DAE,因為一方面SDAE能夠學習深層次的特征表示,另一方面SDAE能夠抵御噪聲對于預測結果的干擾。1DCNN及其變體的預測性能好于SVR和SAE,因為其關注到了特征間動態信息。SDAEMS1DCNN結合了SDAE和MS1DCNN的優勢,能夠在抵御噪聲干擾的同時捕獲全面的動態特征。
為了進一步探究模型抵抗噪聲的能力,本文向SDAE網絡中分別加入了0.1、0.2、0.3、0.4的噪聲系數,其預測效果如圖6所示。
由圖6可知,隨著噪聲的增多,模型的誤差也在逐步增大,但是模型仍然具有較高的準確度與魯棒性,因此可見所提網絡在處理實際工業環境中產生的噪聲數據時,能夠保持較高的預測精度。

圖6 不同噪聲系數下模型預測效果
在SDAE-MS1DCNN模型中,尺度數是一個關鍵的超參數,直接決定了多尺度學習的效果。單尺度學習模型不能適應非平穩的工況環境,但是當尺度個數增加過多時可能導致過度擬合問題,降低模型的泛化能力。為此,本文探究了尺度個數對于學習效果的影響。
如圖7所示,在最開始時,隨著尺度的增加,模型的預測效果不斷提升,由此可見MS1DCNN能夠學習到更加全面的軸承退化特征。但是當尺度數增加到4時模型預測效果開始下降,這可能是由于尺度數過多時模型學習了訓練樣本所獨有的特征,從而導致過擬合。

圖7 不同尺度下模型預測效果
本文提出了一種新的剩余使用壽命預測方法,不同于以往的剩余壽命預測方法,該方法的優點主要如下:首先,通過引入堆疊降噪自編碼器,充分考慮實際工業過程中的數據噪聲對于剩余使用壽命預測結果的影響,增強模型的穩定性與可泛化能力。其次,通過利用多尺度一維卷積神經網絡,使模型能夠在面對變化的工況環境下,仍然擁有較高的預測精度。此外,所提模型在PHM2012挑戰賽的數據集上得到了實驗驗證,實驗結果表明,該方法可以有效地抑制噪聲,并且實驗結果的準確性也明顯優于其他對照模型。在未來,研究者將進一步探索如何以更優的方式融合從不同尺度得到的深度特征,以進一步提高預測精度。