聶 磊 ,蔡文濤 ,張呂凡 ,徐詩奕 ,吳柔慧 ,任一竹
(1.湖北工業大學機械工程學院,2.湖北省現代制造質量工程重點實驗室:武漢 430068)
準確預測渦扇發動機的剩余使用壽命是保證其正常工作、降低維護成本的重要手段[1]。目前,壽命預測的方法主要有3類[2-4]:基于物理失效模型的預測方法、基于經驗的預測方法和基于數據驅動的預測方法。物理模型方法需要進行大量試驗,且試驗周期長,成本高,還需綜合考慮設備所經歷的物理、化學、氣動熱力過程,導致物理模型難以精確建立,給該方法的使用帶來了限制;經驗預測法將設備故障和失效數據擬合為統計分布,該預測方法模型復雜度低且只能給出同類設備同工況的預測評估;數據驅動法通過捕捉設備的監測數據與剩余使用壽命(Remaining useful life ,RUL)間的關系來進行壽命預測,該方法通常采用數理統計和機器學習的手段,使用簡便并且模型通用性好,因此受到了廣泛的研究。
針對基于數據驅動的預測方法,學者們開展了廣泛研究。任子強等[5]提出了一種建立復合健康因子(Composite Health Indicator,CHI)的方法并采用線性維納過程構建出CHI 數學模型,使用Bayesian 方法更新模型參數,并模擬出發動機退化軌跡;趙申坤等[6]篩選出渦扇發動機中具有退化趨勢的特征,采用主成分分析法對篩選的特征做數據融合,提取出能表征發動機退化趨勢的1維健康因子(Health indicator,HI),構建出貝葉斯狀態模型用于預測發動機的RUL;Chui等[7]提出一種非主導排序遺傳算法優化遞歸神經網絡和長短期記憶網絡權重的預測算法,并通過渦扇發動機RUL 預測算例來說明方法的有效性;Kang等[8]使用網格搜索優化多層感知機網絡參數預測渦扇發動機RUL,表明了該模型的有效性;宋亞等[9]提出了一種自編碼神經網絡和雙向長短期記憶網絡的混合模型,并基于通用數據集展開測試,表明該混合模型精度優于現有深度學習模型的;張永峰等[10]利用1 維卷積神經網絡提取渦扇發動機的特征,將提取到的高維特征輸入到雙向長短期記憶網絡進行回歸預測,表明該方法優于其他的機器學習或者深度學習模型。
上述文獻所提出的RUL預測可分為2類:將原始高維特征數據融合為1 維健康因子,建立HI 的數學模型用以預測RUL;將原始數據輸入至神經網絡中,依靠其強大的非線性映射能力建立起原始數據與RUL 間的關系。考慮到在航空發動機退化過程中退化率的非線性成分占比大、監測變量維數多和監測數據存在噪聲等特點,本文綜合二者方法所提供的良好思路和特點,將原始高維數據融合成1 維HI,利用SA-1D-CNN-BGRU 網絡建立了HI 和RUL 的關系,并在C-MAPSS的FD001數據集上進行了驗證。
自編碼(Autoencoder,AE)網絡是一種無監督學習的神經網絡,可將輸入數據轉換為低維度表示[11]。典型的自編碼網絡結構如圖1 所示,包含輸入層、隱藏層和輸出層,盡可能地使輸入數據和輸出數據一致,在中間的隱藏層中實現輸入特征的壓縮。

圖1 自編碼網絡結構
網絡中的輸入層為x={x1,x2,…,xn},中間隱藏層為h={h1,h2,…,hm},其中m<n,輸出層為y={y1,y2,…,yn}。在自編碼網絡的編碼與解碼過程中,數據經過如下變換
式中:f、g為激活函數,本文選取的為RELU和tanh;Wy為輸入層和隱藏層中神經元的權重;by為輸入層和隱藏層中神經元的偏置;Wz為輸出層和隱藏層神經元的權重;bz為輸出層和隱藏層神經元的偏置。
堆疊自編碼(Stacked autoencoder,SAE)由自編碼網絡堆疊連接形成,每層均做編碼操作,將前一層的輸出作為下一層的輸入,使其具有更好的低維特征提取能力。
卷積神經網絡最早被應用于機器視覺領域,通過卷積運算提取出圖像中的空間特征,能夠高效地利用數據[12-14]。1 維卷積神經網絡(1-Dimensional Convolutional neural network,1D-CNN)是2D-CNN 的變體,二者處理數據的方法相同,通常應用于自然語言處理和時序數據。考慮到渦扇發動機退化數據的時序特點,本文利用1D-CNN 提取時序數據中的空間特征,其原理如圖2所示。

圖2 1D-CNN原理
循環神經網絡在處理時間序列時,若輸入的時序過長,則循環神經網絡(Recurrent neural network,RNN)不能將之前的信息傳遞到當前狀態,在反向傳播時,容易導致梯度消息或者彌散的問題。長短期記憶網絡(Long and short-term memory networks,LSTM)網絡可解決短時記憶的問題,具有3 個門控單元來實現權重學習調節信息,從而避免梯度的彌散或爆炸。與LSTM 相比,門控循環單元(Gated recurrent unit,GRU)簡化了門控單元數,在一定程度上減少了網絡的參數,進而提升了模型的訓練速度[15]。單個GRU 單元結構如圖3所示。

圖3 單個GRU單元結構
GRU計算公式
式中:tanh 為激活函數;xt為輸入數據;ht-1為上一狀態的輸出;rt為t時刻重置門,zt為t時刻更新門,Wz、Wr和Wh?分別為更新門、重置門和輸出值的權重矩陣。
雙向門控循環單元(Bidireactional gated recurrent unit,BGRU)包含了2 個方向相反的GRU,每個GRU對輸出序列的正序和逆序進行處理,并將各自的輸出合并形成最終輸出。即在每個時刻,BGRU 網絡可以學習到該時刻前后的序列信息,使得BGRU 網絡可以綜合考慮到過去和未來的信息,有助于提升模型的預測性能。其展開結構如圖4所示。

圖4 BGRU展開結構
注意力機制最早在機器視覺領域被提出,近年來被應用于許多領域并取得了巨大的成功[16]。在神經網絡中,隨著模型復雜化過程中,其參數增多且表達能力更強,同時模型信息變得冗雜,帶來了信息過載的問題。為解決這個問題,在神經網絡中引入注意力機制,可以有效地分配一系列權重,使得模型將資源集中在關鍵信息當中,從而提高算法效率。注意力機制計算過程如圖5所示,可分為3個階段。

圖5 注意力機制計算過程
在第1階段,計算每個Q和K的相似性,得到每個K對應的權重系數。在第2階段,為防止結果過大,使用softmax 函數對權值歸一化處理,將其轉化為概率形式。在第3 階段,對不同的權重進行加權求和,得到最后的注意表達式
式中:Ki為輸入向量信息;Q為用于查找關鍵信息的查詢向量;Vi為權重值;ai為每個向量的權重系數。
當K=Q=V時,稱為自注意機制(Self Attention,SA)。
對輸入數據做卡爾曼濾波處理,濾除其噪聲。隨后將濾波后的數據作為SAE 網絡的輸入,通過多個AE層后得到包含輸入信息主要特征的數據。將降維后的特征數據作為SA-1D-CNN-BGRU 網絡的輸入,這當中2 個卷積層可以充分提取輸入數據的空間信息,BGRU 層可提取每一當前時刻的過去和未來的時序信息,通過自注意機制確定關鍵信息的權重,隨后在池化層中過濾信息減小模型的參數計算,接著在全連接層中將特征組合起來,便于識別不同的特征,最后得到輸出。組合模型結構如圖6所示。

圖6 SAE-SA-1D-CNN-BGRU 模型結構
為定量分析組合模型的性能,均方根誤差(Root mean square error,RMSE),式中記為RRMSE,和評分函數(Score),式中記為Rscore,是來評估RUL 預測結果準確性的常用指標。均方根誤差為常用的模型評估指標,評分函數為非對稱函數,是當前對RUL 預測比較有權威的評估指標,該指標對于預測結果大于真實值的滯后性預測會給出較高的評分,即分值越低,表明該方法越好,其表達式分別為
式中:ym為輸出樣本數;yi為樣本真實值;? 為樣本預測值。
本文使用來源于美國國家航空航天局(National Aeronautics and Space Administration,NASA)的公開數據集來評估方法的有效性。該數據集被廣泛用于PHM 研究領域,包含4組渦扇發動機在不同運行條件和不同故障模式的數據,每組數據中包括訓練集、測試集和真實RUL 3部分,原始數據中含有大量的隨機噪聲。本研究選取的數據為FD001,該組數據具體的結構和傳感器信息描述見文獻[17-19],在此不再贅述。
2.2.1 數據預處理
隨著飛機的起降,飛機發動機的關鍵部件不斷地磨損,性能不斷地退化。盡管飛機發動機的物理失效機理十分復雜,準確反映其健康狀態的參數難以獲得,但一些基于在線監測的參數同樣可以表征飛機發動機的退化規律。
剔除7 個在發動機退化中未曾改變和兩個趨勢性不明顯的傳感器數據后,本文選取的12 個狀態參數包括LPC 出口總溫度、HPC 出口總溫度、低壓汽輪機出口總溫度、HPC出口總壓、物理風扇轉速、HPC出口靜壓、燃油流量與Ps30 之比、修正風扇轉速、旁路比、排氣焓、HPT 冷卻液排放、LPT 冷卻液放氣。以上狀態參數均具有單調性,可以共同作為飛機發動機剩余使用壽命預測的特征。在實際情況中,噪聲可能來源于環境的改變,導致測量過程中氣流、溫度、濕度、壓力等因素的影響,這些噪聲源在發動機運行不同階段都會存在,最后在傳感器觀測到的數據中產生了綜合效應。因此采集的發動機數據中噪聲的影響不可忽視。由于測量數據中含有噪聲,對這些數據融合后得到的綜合健康因子仍然含有噪聲,使得綜合健康因子序列的局部變化起伏很大,難以正常描述設備的性能退化,因此本文首先采用卡爾曼濾波對數據做平滑處理,部分結果如圖7 濾波后傳感器數據所示。進一步的,去除濾波后數據的量綱,防止量綱不統一對后續處理的影響。接著采用SAE 網絡提取原始數據中的主要特征,并將其作為HI 來表征渦扇發動機的健康狀態,具體結果如圖8FD001 訓練集HI所示。隨后給訓練集的RUL 確定標簽,本文將RU 值設置為分段線性函數,如圖9 RUL標簽設置所示。首先渦扇發動機發運行前期處于平穩狀態,此時的RUL 值可看作不發生變化,然后發動機開始線性衰退。對于衰退初期RUL 的取值,文本設置130 作為發動機退化初期的RUL 值??紤]到測試集時序長度最小為31,本文設定分割窗口長度為30,用以保證能對每臺發動機的RUL做出預測。

圖7 濾波后傳感器數據

圖8 FD001訓練集HI

圖9 RUL標簽設置
本文選取滑窗的形式輸入文中模型,考慮到測試集中序列長度最小為31,本文窗口的寬度設置為30,即使用前1~30 個時間步的傳感器數據作為1 個序列,第2~31 個時間步的傳感器數據作為1 個序列,依此類推。模型的輸入為劃分的滑窗序列,輸出為每個序列的最后1個周期的RUL標簽。
2.2.2 結果分析
LSTM、PCA-LSTM、PCA-1D-CNN-LSTM 和本文模型對渦扇發動機RUL預測結果如圖10~13所示,虛線為真實壽命,實現為預測的壽命值。在LSTM 模型中,整體上預測結果大于真實結果,其RRMSE=31.37,Rscore=1316,最大預測值為175,遠大于真實值中最大值143。在該模型中,由于輸入數據為原始傳感器數據,數據中存在的噪聲擾動大,對預測精度有較大影響。此外原始傳感器信息過多,存在冗余現象,且LSTM網絡模型的學習能力不足,導致預測精度較差。PCA-LSTM 模型中,預測結果與真實值較為接近,前幾組發動機預測誤差較大,且多數真實值遠大于預測值,其RRMSE=28.97,Rscore=850。在該模型中,不僅對數據做了濾波處理,還采用線性PCA 降維方法將高維的退化數據融合為1 維HI 序列,將該序列輸入至LSTM 網絡中學習其與RUL 間的關系,此時預測精度有了一定的提升,表明降維方法可初步提取傳感器數據中的有效信息,該類型方法有待進一步改進。PCA-1D-CNN-LSTM 模型中,整體預測結果接近真實值,少數預測值偏離真實值,其RRMSE=20.16,Rscore=275。在該模型中,對預測網絡結構做了改進,其中的1D-CNN 和LSTM 網絡分別可提取HI 序列中的空間和時序信息,此時HI 序列的信息得到在1D-CNNLSTM 網絡中得到了充分的學習,預測精度也得到了進一步的提升。在本文模型中,整體預測無較大偏差,在幾組測試集發動機壽命即將結束的RUL 預測中,產生了RUL 小于0 的偏差,但是預測精度得到了極大提高,其RRMSE=16.22,Rscore=225。在本文提出的模型中,不僅采用了非線性的SAE 降維方法代替了PCA降維方法,充分的提取了高維傳感器數據中的主要退化規律,還采用BGRU模型代替LSTM模型,簡化了訓練模型時的參數,同時注意力機制對1D-CNNBGRU 模型提取的特征分配了權重,便于混合網絡模型中的回歸層高效的學習HI 序列和RUL 間的關系,模型的精度得到了更好的提升。模型評估見表1。

表1 模型評估

圖10 LSTM模型預測結果

圖11 PCA-LSTM 模型預測結果

圖12 PCA-1D-CNNLSTM模型預測結果

圖13 SAE-SA-1D-CNNBGRU模型預測結果
綜合分析以上結果,本文分別建立了LSTM、PCA-LSTM、PCA-1D-CNN-LSTM 和本文所提模型用以預測渦扇發動機的RUL,以上方法均實現較高精度的預測,其中PCA-LSTM 相較LSTM 模型的均方根誤差提升了7.65%,評分函數提升了27.54%,PCA-1DCNN-LSTM 模型的均方根誤差相較于前2 種方法分別提升了35.73%和30.41%,評分函數提升了79.79%和67.64%,本文所提模型的均方根誤差相較于前3種模型分別提升了83.46%、73.53%和18.18%,結果證明了本文方法的優越性和有效性。
采用卡爾曼濾波、SAE 網絡和SA-1D-CNNBGRU 混合網絡的方法對渦扇發動機傳感器數據進行預處理和RUL 的預測,可為設備的健康管理與智能運維提供支撐。考慮到本文預測時存在誤差,未來可進一步研究HI 序列的建立方法,充分提取狀態監測數據中的有效信息后利用本文預測模型進行RUL預測;可對每種傳感器監測數據單獨建立模型通過網絡并聯方式提高RUL預測精度。