邵佳穎, 張星澤
(合肥工業大學 管理學院,合肥230009)
隨著科學技術的不斷發展,國家注重發展高端高效的智能經濟,其中產業的智能化升級是一大重點[1]。工業領域中,機械設備的精細化與復雜化有增無減,遠程診斷與運維服務模式的實行能夠更好地保障機械設備運行的效率與可靠性。而軸承作為機械設備的關鍵部件,它的可靠運行是整個設備能夠良好工作的不可或缺的條件。由此作為智能故障預測與健康管理(Prognostic and Health Management,簡稱PHM)技術中的重要組成,剩余使用壽命(Remaining Useful Life, 簡稱RUL)預測在軸承的維護工作中不可或缺。
RUL預測技術可大致分為3類:基于失效機理分析(物理)的方法,數據驅動的方法及融合的方法[2]。其中數據驅動方法通常被分為特征提取和RUL預測兩部分。在多數研究中,提取軸承振動信號特征通常使用小波分解、經驗模態分解等方法來提取包括均方根值、方差等時域特征,以及頻譜等頻域特征[3]。但在實際應用中,這些傳統特征存在反映較弱、信息丟失等問題,通常還會導致模型訓練困難及過擬合[4]。同時這些特征提取方法是基于對于信號學的掌握之上的,在RUL領域,很少有人直接使用深度神經網絡來提取特征,特別是軸承的特征。
針對以上兩點,本文提出使用訓練深度神經網絡的方法來提取軸承特征,通過調整神經網絡模型,充分利用無監督學習和有監督學習相結合的優勢,直接提取出更全面、更具有代表性的特征。同時只需要掌握深度學習及機器學習的知識,而不用了解小波變換等信號學原理。最后再選用機器學習的各回歸方法來擬合出軸承的退化模型,從而預測軸承的RUL。
深度置信網絡(Deep Belief Network,簡稱DBN)的基本構成限制波爾茲曼機(Restricted Boltzmann Machine,簡稱RBM)通常是由2層神經元組成[5],分別稱為可見層(v代表)和隱藏層(h代表)。由于二值化RBM不利于連續數據的運算,將其改為實值RBM,值介于0~1之間。a和b則分別是可見層和隱藏層的偏置,w是可見層和隱藏層之間的權重系數。可見層和隱藏層之間存在連接,用于在兩層之間傳遞數據特性信息,而一層內部的神經元之間由于不存在連接,相互獨立。RBM通過可見層接收輸入或者來自前一層發送過來的數據向量,通過最小化內部能量函數將其轉換到隱藏層。

由于數據特征維數較高,Gibbs采樣過程非常耗時,提取有效的深度特征困難,往往會導致RBM的訓練效率低下,由此采用Hinton于2002年提出的對比散度算法。參數更新式如下:

其中α為學習率,且α∈[0,1]。同時,為了增加RBM訓練的穩定性與高效性,引入動量因子m,m∈[0,1],n為迭代次數,則各代參數更新公式為:

對DBN進行逐層貪婪學習時[6],第1層作為第1個RBM的輸入層,訓練得到隱藏層(即第2層),將其隱藏層中的激活值作為第2個RBM的輸入,由此類推,在預先訓練完成后調用梯度下降的反向傳播法根據誤差反向逐層調整系數,減小整個網絡的誤差。

圖1 深度置信神經網絡圖
深度自編碼 器(Deep Autoencoder,DAE)的基本構成自編碼器(Autoencoder,AE)通常是由3層神經元組成[7],分別稱為輸入層(x代表)、編碼層(h代表)和解碼層(r代表),從輸入層到編碼層的特征變換為編碼過程,從編碼層到解碼層的特征變換為解碼過程[8]。a、bE和bD則分別代表輸入層、編碼層和解碼層的偏置,wE是輸入層和編碼層之間的權重系數,wD是編碼層和解碼層之間的權重系數。輸入層和編碼層之間存在連接,用于在兩層之間傳遞數據特性信息;編碼層和解碼層之間存在連接,用于輸入數據特征的恢復與還原。AE通過輸入層接收數據向量,通過最小化輸入層x與解碼層r之間的誤差函數將其轉換到隱藏層。
在AE中,設參數向量為θ={a,bE,bD,wE,wD},輸入層x={x1,x2,…,xi},編碼層h={h1,h2,…,hj},解碼層r={r1,r2,…,ri}。則生成表示的編碼函數為:

對DAE進行逐層貪婪學習時,訓練第一層得到第一個AE,取其編碼層中的激活值作為第二個AE的輸入,以此類推,完成預訓練過程。在預訓練結束后,調用梯度下降的反向傳播算法逐層調整參數,以減少整個網絡的誤差。

圖2 深度自編碼神經網絡圖
設軸承退化為線性遞減模型,分別使用DBN和DAE提取出深度特征,代入RUL模型進行預測,并且提取傳統的時域、頻域、時頻域特征,代入到RUL模型進行對比分析。與此同時,使用不同的回歸模型進行預測,選出最優模型。圖3所示為模型圖。
使用深度置信神經網絡提取特征,輸入原始信號特征進行訓練,輸出數據對應剩余使用壽命,詳細過程為:1)預處理。將原始特征進行歸一化,隨即將輸入樣本分為訓練集和測試集,網絡中每個神經元接受一個特征。2)通過調整參數來比較指標,最后確定各個超參數,即RBM的層數、每層神經元數、每層RBM的學習率和迭代次數、參數更新的次數、批處理的大小。3)進行逐層訓練。將預處理后的訓練樣本灌入DBN網絡中,利用無監督的貪婪學習依次訓練各層RBM。4)微調。通過將每條數據對應的剩余壽命作為標簽,運用有監督的反向傳播算法對整個神經網絡進行微調。5)得出最佳模型。輸出最后一層隱藏層,即為所需深度特征。使用深度自編碼器提取特征步驟上與深度置信神經網絡類似,輸出的最后一層編碼層即為所需的深度特征,不再贅述。
大學生與高中生有很大的不同,大學生屬于學習專業知識的階段,雖然專業知識的學習和提升很重要,但是大學生和高中生不同,大學生學習成績的好壞并不能評判一個人的專業化水平,不能單單以分數評判一個人的成敗,如果只看重專業知識,不利于大學生的全面發展,無法滿足社會上對大學生綜合素質能力的基本需求。很多高等院校更多的站在自己和社會的角度建立目標,高度重視學生對社會應盡的義務培養,但卻忽略了學生自身的綜合發展。人才資源的基本標準考慮的是學生在多個方面的表現,這就要求學生充分發揮自己的潛能,展現自己的才能,不斷地完善自己,成為德智體美勞全面發展的應用型人才。

圖3 剩余壽命預測模型
以SVR回歸為例,SVR是一種具有較強泛化能力的機器學習算法,用于解決數據回歸預測問題。在輸入特征的維數約簡后,基于簡化的特征,設軸承為線性遞減模型,其開始運作時的剩余壽命為L。我們將數據集定義為X={x1,x2,...,xm}。其中:xm為n維向量;m為特征數。并且定義向量Y={y1,y2,...,ym},即剩余壽命作為標簽。將尚未開始工作的軸承生命定為1,完全損壞時為0,在工作中的軸承壽命為運行時長占總工作時長的百分比。再將2.1節中提取的深度特征和傳統特征分別灌入SVR模型,最后通過模型接收新的數據來預測軸承剩余使用壽命。除SVR外,本文也采用了線性回歸模型、集成模型、K-近鄰模型來進行回歸,步驟相同。
滾動軸承全壽命數據來自于PONOSTIA試驗臺,由水平方向和垂直方向等2個加速度傳感器進行數據采集,記錄間隔為10 s,采樣頻率為25.6 kHz[9]。本文取同一狀態下編號為1_1、1_3、1_7的軸承數據用于實驗,并用軸承1_3預測L。第1個軸承共記錄了2803次(即其初始剩余使用壽命為28 030 s),第2個軸承共記錄了2375次,第3個軸承共記錄了1428次。所以總數據量為6606,原始信號特征有2560維。并采用最小最大標準化方法對原始數據進行預處理。
圖4是軸承1在第1000 s時的特征及第10 000 s的特征的變化圖,從圖中可以看出,同一時間內大量特征的表征值類似,說明2560個特征中可能存在大量的特征冗余,特征繁多且波動較大,所以要進行特征的提取。

圖4 軸承原始信號圖
首先,計算出時域特征、頻域特征、時頻域特征,即傳統意義上的統計特征。另外,通過集成經驗模態分解法(EEMD)和小波包變換法(Wavelet Packet Transform,WPT)等2種方法提取時頻域特征。最終提取的傳統信號特征共計70個,其中時域特征為16個,頻域特征為12個,時頻域特征為42個。圖5為軸承1所提取的幾個原始特征隨時間的變化情況。很明顯,第20個和第70個特征在接近軸承報廢時變化巨大。另外將通過歸一化特征減小不同計算方式帶來波動范圍不同的影響。

圖5 軸承1傳統特征變化圖
其次提取深度特征。在本實驗中,軸承原始信號特征為2560維,輸入至網絡為2560個神經元。最終訓練好的DBN模型為6層RBM(2048,1024,512,256,128,64),提取出64個深度特征,相關系數R-square為0.90。同時,最終訓練好的DAE模型為5層AE(1280,640,256,64,32),提取出32個深度特征,其輸出的均方誤差為0.13。圖6分別為軸承1_1幾個深度特征隨軸承運行時間的變化圖,可以看出,除了數值上的區別,DBN特征趨勢相較傳統特征更加平緩且有規律;而DAE特征也在一定程度上能夠更好地表征軸承的退化狀態。

圖6 深度特征變化圖
在提取完三類特征并進行歸一化后分別采用支持向量回歸、線性回歸、集成回歸及K-近鄰回歸等4類回歸模型進行回歸預測。圖7為各特征在4種不同的模型RUL預測圖。可以看出,DBN特征在各個模型上的預測表現都較其余兩者更優,但具體在哪一個模型上表現更佳仍待進一步判別。而DAE特征在SVR回歸時同樣表現不錯,但在剩下3個預測模型中都有在軸承接近報廢時預測無力的問題。傳統特征的預測則表現出更多的振蕩,在預測前期容易出現大幅誤差,在線性回歸與K-近鄰回歸中表現略好。

圖7 RUL預測比較圖
為了更加精確地衡量不同特征回歸的效果,采用多個評價標準進行分析。本文選取了均方根誤差(Root-Mean-Square Error,RMSE)[10],平均絕對百分誤差(Mean Absolute Percent Error,MAPE)[11]及決定系數(coefficient of determination,R2)作為評價指標,計算公式如下:

為了直觀地表現各評價指標的對比,采用直方圖來顯示。
1)誤差分析。由圖8可得,除了Lasso回歸,在所有其他回歸模型中,深度特征的回歸效果最佳,并且在集成方法隨機森林(Random Forest)回歸中傳統特征的預測誤差比DBN特征的誤差要高出524%。而在深度特征的比較中,DBN特征的RMSE在上述任何回歸中都要比DAE特征的更小,說明DBN提取特征能夠更好地減少預測均方誤差。總體來看,KNN的預測效果最好,線性SVR次之,但就深度特征而言,其在線性SVR回歸上表現更好。在圖9中可以看出,就MAPE而言,DBN特征預測效果遠好于傳統特征及DAE特征。同時除線性SVR及KNN外,DAE提取特征的MAPE要高于傳統特征,特別體現在貝葉斯回歸中。這一點也可以在回歸預測圖中明晰,線性回歸中DAE特征在軸承接近報廢時預測值飆升至1.75,這顯然是造成誤差過大的源頭,當然其特征在軸承工作初期的預測效果較傳統特征更好。對比各類回歸可知,線性SVR回歸的MAPE最小,而線性回歸總體(包括Linear、Ridge、Lasso、Bayesian)的預測效果則較為不理想。

圖8 RMSE 對比圖

圖9 MAPE 對比圖
2)決定系數分析。表1為各個預測的R2對比表,決定系數R2愈接近1則代表擬合的效果越好。可以看出,擬合效果較好的為DBN特征在貝葉斯回歸上的預測,所有模型上DBN特征都要略優于DAE特征,同時深度特征都比傳統特征更優。通過比較得出,線性回歸的Linear與Lasso在擬合程度上有非正常值,說明相關性不高甚至負相關。

表1 R2對比表
基于以上結果,本文提出的深度特征提取方法可以提高預測精度,減小預測誤差。就特征而言,DBN特征基本上都相對于傳統特征有進步,而DAE特征雖然在MAPE上表現比傳統特征略差,但綜合其決定系數后也優于傳統特征。就回歸而言,線性SVR、Linear與KNN在某一指標上都有較好效果,但綜合各指標來看,線性SVR表現更為均衡,能夠得到更為穩定可靠的結果。
在《中國制造2025》的導向下,傳統制造業正轉變為智能制造業。健康診斷在制造智能化中起著至關重要的作用,工業界對軸承RUL智能預測的需求日益增長。深度學習技術的發展為軸承RUL預測提供了新的機遇,因此本文提出了一種基于深度學習的軸承RUL預測方法,比較了深度置信神經網絡、深度自編碼器及傳統方法的特征提取對RUL模型的效用。實驗結果表明,基于深度學習的特征提取能夠保留有效信息,增加建模精確性,其中深度置信神經網絡能夠取得較好的效果。
在今后的工作中,我們將改進DBN及DAE模型以提高軸承RUL的精度,同時也計劃提高訓練效率。我們還注意到DBN是基于分布的特征重構,DAE是基于值的特征重構,因此也將考慮采用DBN提取特征、DAE重構特征的方法來進行實驗。此外,結果中深度特征在一定程度上有所冗余,這表明深度訓練模型的普適性不強,將會通過利用更多數據訓練來降低過擬合的可能性。