徐娟,蔣瑞,陳為偉,王東峰,鄭昊天
(1.合肥工業大學 a.計算機與信息學院;b.機械工程學院,合肥 230009;2. 上海航天控制技術研究所,上海201109;3.洛陽軸研科技有限公司,河南 洛陽 471003 ;4.洛陽軸承研究所有限公司,河南 洛陽 471039)
軸承作為旋轉機械的重要組成部件,對許多工業機器的正常運行至關重要,其工作狀況是否正常對整個裝置的性能有很大影響[1],一旦軸承發生疲勞破壞導致失效,會直接影響整個設備的運行,從而影響工業生產以及生命財產安全。軸承的可靠性分析和剩余使用壽命(Remaining Useful Life,RUL)預測至關重要,是當前自動化發展的要求和趨勢[2];然而,由于軸承材料、工況的影響,軸承的使用壽命會表現出不同的退化特點[3],準確預測軸承剩余使用壽命是待解決的難題。
大多數深度學習解決滾動軸承剩余使用壽命預測問題均是基于以下假設:足夠多的數據樣本,訓練集與測試集的數據分布保持一致[4]。然而在實際工況中,滾動軸承退化失效過程可能需要幾個月甚至幾年,收集滾動軸承全壽命周期的數據成本較高;軸承的運行狀態易受其載荷和轉速等因素的影響,振動信號的分布也會受到影響[5]:因此,同一軸承模型即使在相同的工況下,其退化過程可能具有不同的數據分布特征,軸承訓練數據與預測數據之間的數據分布偏差會導致剩余使用壽命預測精度的下降。
遷移學習下的領域自適應方法能有效解決數據分布差異帶來的預測精度下降問題。領域自適應方法適用于源任務與目標任務相同但源域與目標域中數據分布不一致的情況,通過此方法可以從大量帶標簽的源域樣本中學習到需要的知識,并將這些知識遷移到目標域中,從而解決不同數據分布的壽命預測問題。
目前,基于域自適應的剩余使用壽命預測研究取得了豐碩成果:文獻[6]利用來自目標域的標記數據提出了一種監督域適應方法,旨在微調在源域上訓練的雙向長短期記憶(Bi-directional Long Short-Term Memory,Bi-LSTM)網絡,但需要目標標記的剩余使用壽命數據,并且不會針對常見的特征表示進行優化;文獻[7]針對訓練數據和測試數據分布不同,解決領域轉移問題的傳統方法,試圖獲得領域不變特征,提出了一種基于對比對抗域自適應的跨域剩余使用壽命預測方法,但未能考慮目標特定的信息;文獻[8]提出了一種基于動態領域自適應(Dynamic Domain Adaptation,DDA)的機械設備多工況剩余使用壽命預測方法;文獻[9]將領域對抗神經網絡模型與Bi-LSTM網絡相結合,對滾動軸承剩余使用壽命進行了估計;文獻[10]提出了一種新的基于域自適應LSTM-DNN網絡的滑動軸承剩余使用壽命預測方法,通過模糊C均值聚類算法提取多傳感器特征和確定退化發生時間,將提取的多傳感器特征用于退化評估。
現有領域自適應方法在應用到軸承剩余使用壽命預測中往往考慮軸承全生命周期數據的分布差異,然而軸承振動早期數據波動較小,快速退化階段數據才能更好地反映軸承的退化特性,用全生命周期數據進行領域自適應可能會出現負遷移的現象。
針對上述分析,結合深度領域自適應方法,本文提出了一種基于對抗域自適應的軸承剩余使用壽命預測方法。并通過不同工況下軸承疲勞壽命試驗的振動數據對比驗證本模型的剩余使用壽命預測效果。
領域自適應方法大體可以分為3種:
1)特征選擇法。該方法基于源域與目標域數據具有某些相同特征的假設,目標是找出這些公共特征,并以找到的公共特征為基礎構建模型。代表性的方法為結構對應學習(Structural Correspondence Learning,SCL)法[11]。
2)數據分布自適應方法。該方法著眼于源域和目標域的數據分布,利用若干轉換手段使數據在源域與目標域之間的差異最小。具體可分為邊緣分布自適應[12]、條件分布自適應[13]以及將兩者結合的聯合分布自適應[14]。本文方法屬于此種方法。
3)子空間學習法。該方法的基本假設是源域與目標域數據在當前空間維度上的相似性不明顯,利用子空間學習將2個域的數據變換到一個低維的公共子空間中,從而學習到源域和目標域數據的域不變特征[15]。

本文模型分為2個部分:健康階段劃分模塊,使用一種基于等滲回歸[16]的退化數據預處理方法去除原始退化數據中的隨機波動,并識別軸承數據的退化點,截取快速退化階段數據;基于對抗域自適應的進行剩余使用壽命預測。模型整體結構如圖1所示。

圖1 基于對抗域自適應的軸承剩余使用壽命預測模型
2.2.1 等滲回歸算法流程
令y(t)為時間t下的累計退化路徑,y(0)=0,所有監測時間點與對應的退化測量值分別為ti={t1,t2,…,tk}和yi={y1,y2,…,yk},i=1,2,…,k。
等滲回歸假設最能代表數據趨勢的函數是單調的,因此提供了線性回歸的替代方法,對數據擬合為分段常數非遞減(階梯狀)的函數。
原始退化數據經常呈現隨機波動,采用等滲回歸可以消除這些波動,使退化過程呈現單調趨勢。等滲回歸定義為:令X為一個有限集{x1,x2,…,xk}和x1?x2?…?xk,假設f是X的給定函數,那么函數f*為f的等滲回歸,權重為ω。
對于原始退化數據(ti,yi),i=1,2,…,k,監測時間點有一個簡單的順序,即t1 1)若f是等滲的,那么f*=f。 2)若存在某個時刻i,f(xi-1)>f(xi),將這2個值替換為其加權平均值A,即 (1) 2個權重ω(xi-1)和ω(xi)均被替換成ω(xi-1)+ω(xi)。 3)若這組新的k-1值是等滲的,使 f(x1)?…?f(xi-2)?A{i-1,i}? …?f(xk), (2) f*(xi-1)=f*(xi)=A{i-1,i}, f*(xj)=f(xj)。 4)若這組新值不是等滲的,則使用新值和權重值重復上述過程,直到獲得一組等滲值。使用PAVA可以對原始退化數據進行預處理,直到變成等滲數據。最終處理結果如圖2所示,有許多跳躍點。 圖2 PAVA預處理后的退化數據示意圖 2.2.2 退化點識別 由圖2可知,在第1個跳躍點開始退化時,前幾個跳躍點的幅度可能非常小,在此階段仍然處于健康階段。采用單位時間的退化增量確定退化階段的變化點,即當單位時間的增量超過了給定的閾值Δ,軸承開始進入快速退化階段(即檢測出退化點)。為此,構建了一個包含n個退化數據點的滑動窗口,即 (3) 線性回歸模型y*為 y*=Δi·t+ω, (4) 式中:Wi為長度為n的滑動窗口;y*為yi等滲回歸算法后的測量值;Δi為窗口的退化梯度;t為退化時間點。 在滑動窗口上進行擬合,Δi使用最小二乘法計算,即 (5) 對每個窗口,將Δi與Δ進行比較,如圖3所示,當Δi≤Δ時,振動數據被判定為健康階段數據,然后通過合并新的退化數據更新滑動窗口,并重復此過程直到Δi>Δ。此時,Wi的第1個時間點,即滑動窗口的左側,被確定為退化點。 圖3 退化點識別的滑動窗口示意圖 識別出每套訓練軸承和測試軸承的退化點,并截取退化點后的快速退化階段數據作為基于對抗域自適應剩余使用壽命預測方法的輸入。 在使用對抗域自適應前需使用“最小-最大規范化方法”對快速退化階段的軸承振動信號進行預處理,使處理后的全部數據為0~1。最小-最大規范化方法對原始數據進行線性變換,同時依然保持原始數據之間的潛在聯系。 快速退化階段的振動信號數據為V={v1,v2,…,vi,…,vN},vi為快速退化階段的第i個時間點。對快速退化階段數據進行變換得到數據X={x1,x2,…,xi,…,xN}。最小-最大規范化方法的公式為 (6) 式中:xi為快速退化階段進行最小-最大規范化方法變換后的第i個數據。 本文提出了一種對抗域自適應(Adversarial Domain Adaptation,ADA)方法,通過源域和目標域的對抗訓練學習目標域數據的域不變特征,進而在目標域下實現滿意的剩余使用壽命預測。 2.3.1 預訓練過程 1)特征提取器 長短期記憶(Long and Short Term Memory,LSTM)網絡作為循環神經網絡(Recurrent Neural Network,RNN)的強大變體,可以用來處理時間序列數據長期依賴關系,并避免了梯度消失和梯度爆炸等問題。本文使用一個深度LSTM網絡,其具有3個連續的網絡層,能夠自動提取軸承振動數據中反映退化趨勢的特征。為防止過擬合,在每層LSTM網絡后加了Dropout層。 2)剩余使用壽命預測模塊 剩余使用壽命預測模塊是一層門控循環單元。RUL預測器R和特征提取器ES使用預測RUL值與真實RUL值之間的均方誤差(Mean Squared Error,MSE)損失以端到端的方式進行訓練,可以形式化為 (7) 2.3.2 對抗域自適應 對抗域自適應模塊主要由源特征提取器ES、目標特征提取器ET、域判別器D組成。采用訓練好的源特征提取器的權重初始化目標特征提取器。首先,將源域和目標域的輸出特征輸入到對抗性判別器網絡中,以最小化源域和目標域數據的差異;然后,將源域帶標簽的數據和目標域無標簽的數據經過特征提取后輸入到域判別器中。域判別器包含2個全連接層和1個輸出層,因為目標域數據沒有標簽,所以不可能在目標域上直接進行有監督學習。本文使用預訓練的源特征提取器ES和源壽命預測模塊RS分別初始化目標特征提取器ET和目標壽命預測模塊RT的參數。域判別器D被訓練用來區分源特征fS和目標特征fT。同時,訓練目標特征提取器ET以產生目標特征,使域判別器無法將它們與源特征區分開。域判別器D與目標特征提取器ET之間的對抗訓練為 EXT~PT[log (1-D(ET(XT)))], (8) 式中:XS和XT分別為源域和目標域樣本;EXS~PS[logD(ES(XS))]為通過最小化Ladv損失來更新目標特征提取器ET的參數;EXT~PT[log(1-D(ET(XT)))]為通過對抗訓練的方式,最大化Ladv損失來更新域判別器D的參數。最終,訓練后的目標特征提取器ET能夠提取與源域特征差異最小的目標特征fT。 綜上所述,基于域自適應的軸承剩余使用壽命預測算法訓練過程定義為:輸入源域數據DS以及目標域數據DT,并從中各選取m個樣本;利用源域數據預訓練源特征提取器ES,將ES的參數初始化到目標特征提取器ET,提取源域樣本以及目標域樣本的特征fS=ES(XS)和fT=ET(XT);根據(8)式對抗性損失更新域判別器D以及ET,再使用更新后的ET提取目標域數據特征;用RUL預測模塊預測目標域的剩余使用壽命。 本試驗采用的是IEEE PHM Challenge 2012軸承數據,在PRONOSTIA試驗臺(圖4)進行了3種工況下的軸承退化試驗,試驗軸承的工況、樣本大小和數據量見表1。該試驗采集滾動軸承從全新到運行失效全過程的數據。軸承的主要參數見表2,當振動信號的振幅達到20g時試驗停止,默認軸承完全失效。PRONOSTIA試驗臺主要由旋轉部分、退化產生部分(在試驗軸承上施加徑向力)和測量部分組成。旋轉部分包括帶變速箱的異步電動機及其2個軸,電動機功率為250 W,通過齒輪箱傳遞旋轉運動。載荷部分提供載荷,使軸承快速退化。軸承退化的特征基于傳感器的振動和溫度確定。加速度傳感器的采樣頻率為25.6 kHz,每隔10 s記錄一次測量振動信號,每次采集時長0.1 s,數據點為2 560個。 圖4 PRONOSTIA試驗臺 表1 試驗基本條件 表2 軸承的主要參數 選取3種工況下各一組軸承數據分別作為訓練集來訓練模型,然后使用其他軸承數據作為測試集,分別構建了試驗任務A,B,C,具體見表3。 表3 試驗任務描述 采用軸承振動數據的最大幅值為健康指標描述軸承的退化狀態,軸承1_1和1_2的健康階段劃分和退化點的識別結果如圖5所示。由圖5a和圖5c可知,由于隨機波動,原始健康指標不是單調的。使用PAVA去除不同點具有相同權重的隨機波動,結果如圖5b和圖5d所示,經預處理后每套軸承的退化路徑都變成一個具有單調趨勢的階躍函數,跳躍可以看作一段時間內對軸承的沖擊損壞。2套軸承發生快速退化的時間有較大差別,顯然,運行條件對軸承的退化過程有顯著的影響。 (a) 軸承1_1的健康階段劃分 (b) 軸承1_1的退化點識別 軸承振動數據的預處理過程使用n=10的滑動窗口識別軸承全生命周期振動數據的退化點。通過線性最小二乘法回歸模型對每個滑動窗口進行擬合,獲得每個滑動窗口對應的閾值。根據人工經驗的多次試驗選擇,設置最大梯度閾值為0.05,即當出現某個閾值大于0.05時,則對應的滑動窗口的位置為最終退化點位置。 剩余的訓練軸承和測試軸承均使用上述方法進行退化點的識別,將軸承全生命周期的振動數據劃分為健康階段和快速退化階段,選取退化點后的軸承振動數據,即快速退化階段的振動數據進行后續軸承剩余使用壽命預測試驗。 為驗證本文方法的有效性和先進性,進行不同特征提取模型和不同領域自適應模型的試驗對比,表4模型均使用同一數據集快速退化階段的振動數據。 共設計了3種類型的對比試驗:1)使用全生命周期的振動數據和快速退化階段的振動數據分別進行剩余使用壽命預測的消融試驗; 2)用不同領域自適應模型比較剩余使用壽命預測的效果;3)用不同特征提取模型比較剩余使用壽命預測的效果。 表4 不同對比模型介紹 為量化本文模型的性能,選取均方根誤差(Root Mean Squared Error,RMSE)作為評估剩余使用壽命預測模型的指標。均方根誤差反映了測試值偏離真實值的程度,均方根誤差值越小,表示測試精度越高,說明剩余使用壽命預測模型的效果越好。均方根誤差的公式為 (12) 3.3.1 消融試驗 為證明本文方法中軸承數據健康階段劃分的必要性,分別使用全生命周期數據和快速退化階段數據,采用基于對抗域自適應的軸承剩余使用壽命預測模型進行對比試驗,結果如圖6所示,使用快速退化階段數據的RMSE值均小于使用全生命周期數據的RMSE值,這可能是由于健康階段數據和快速退化階段數據樣本量差距過大,而導致模型評價指標難以準確反映預測精度。 圖6 使用/不使用軸承退化階段數據的試驗結果 相比于使用全生命周期數據進行預測,進行軸承數據健康階段的劃分,使用快速退化階段的數據進行剩余使用壽命預測能夠取得更好的預測精度。 3.3.2 不同領域自適應模型 不同領域自適應模型在任務A,B,C下所有軸承的試驗結果如圖7所示,軸承在對抗域自適應模型(圖中用OURS表示)中的RMSE值均小于TCA,GAN模型的RMSE值。TCA,GAN算法通常難以找到源域和目標域數據的域不變性特征,從而影響了知識遷移的效果。本文方法與其他領域自適應方法相比,對不同工況下的軸承間的剩余使用壽命預測具有良好的效果。 3.3.3 不同特征提取模型 不同特征提取模型在任務A,B,C下所有測試軸承的試驗結果如圖8所示, 軸承在特征提取部 圖8 不同特征提取模型的試驗結果 分為LSTM的對抗域自適應模型中的RMSE值均小于特征提取部分為CNN,AE模型的RMSE值。與時間序列相關的特征往往反映了時間序列前后知識的內在聯系,CNN,AE模型通常難以提取到長時間序列數據的內在特征,因此表現較差。 本文提出了一種基于對抗域自適應的軸承剩余使用壽命預測方法。為解決軸承剩余使用壽命評價指標可能因健康階段數據和快速退化階段數據樣本特征差距過大導致模型評價指標難以準確反映預測精度的問題,采用基于等滲回歸算法將軸承全壽命周期數據劃分為健康階段和快速退化階段,選擇軸承快速退化階段的數據進行剩余使用壽命預測。為解決域差異問題,提出了基于對抗域自適應的方法以最小化源特征與目標特征之間的分布差異。對比有無健康階段劃分的剩余使用壽命預測試驗,以及其他領域自適應和特征提取模型與本方法的對比試驗,結果驗證了本文方法的有效性和先進性。 對抗域自適應方法主要保留2個域間的不變特征,可能會從目標特征中刪除特定于任務的信息,以最大程度減少對抗性損失,這可能會影響預測效果;在健康階段劃分中,人工設定的梯度值可能不準確或不具備普適性,如果針對不同的軸承數據能夠自適應地選擇梯度值,此方法的預測精度和泛化能力將得到很大提升。

2.3 軸承剩余使用壽命預測方法

3 試驗與分析
3.1 壽命預測數據集描述




3.2 軸承健康階段劃分與退化點識別


3.3 軸承剩余使用壽命預測試驗設置









4 結束語