焦瑞華, 馬 欣, 李曉猛, 董智超
(航空工業西安航空制動科技有限公司,陜西 西安 710048)
隨著對復雜工程系統運行的可靠性和安全性的需求不斷增加,使得相應的維修策略逐步從傳統的事后維修和定期維修向視情維修轉變。而故障預測與健康管理(Prognostics and Health Management,PHM)技術能夠通過預測失效的發生來降低系統風險以實現系統的視情維修,因此在近些年得到越來越多的關注、研究與應用,已經成為可靠性領域的熱點研究方向。而剩余使用壽命(Remaining Useful Life,RUL)的預測是PHM技術中最具挑戰性的核心技術問題,其一般是指系統在當前狀態下還能有效運行直到生命終止的時長[1],能夠為后勤保障人員提供系統失效前安全運行的時間信息,從而有針對性地制定維護與維修方案。因此,精準的RUL預測對于提升系統的可靠性與安全性無疑有著非常重要的意義。
近年來,RUL預測技術發展迅猛并取得了大量的優秀成果。現有的預測方法通常可以分為三大類:基于模型的方法、數據驅動的方法和混合模型方法?;谀P偷姆椒ǖ幕舅枷胧墙⒁粋€能夠描述系統物理特性和失效模式的數學模型,從而實現RUL的預測,它一般可以獲得較為精確的預測結果,但不能應用于缺乏物理退化先驗知識的系統,例如經典的Paris-Erdogan 模型[2],其經常用于軸承、齒輪等的疲勞裂紋擴展的預測。數據驅動的方法能夠基于大量的歷史數據構建輸入和輸出之間的映射關系來預測RUL,從而避免了基于模型方法的缺點,其一般又可以分為基于可靠性模型、基于隨機過程和基于人工智能的方法[3]?;诳煽啃阅P偷姆椒ㄊ菑倪^去故障歷史數據的統計特性角度進行故障預測,其中研究最多、應用最廣的方法就是比例風險模型[4];基于隨機過程的方法是指利用數理統計和隨機過程的相關知識建立隨機過程模型來描述退化軌跡,以得到概率框架下的剩余壽命概率分布,其中研究與應用最多的是Wiener模型[5];基于人工智能的方法往往是利用支持向量機[6]、人工神經網絡[7]和循環神經網絡[8]等深度學習模型來對歷史數據進行訓練,使其滿足一定精度要求后再進行故障預測?;旌夏P偷姆椒ㄍǔJ乔笆鰩追N方法的有效結合,可以充分發揮不同模型的長處并克服單種類方法的局限性,因此,近年來受到大量學者的關注和研究。Acar等[9]構建了一個加權求和公式,將基于高斯過程、支持向量機和徑向基網絡等5種方法的結果進行加權求和來減小預測結果的誤差;Wei等[10]提出了一種結合支持向量機和粒子濾波算法的框架來進行電池的RUL預測。實驗結果表明該方法提高了預測結果的準確性。然而,如何開發一個可靠且有效的混合模型仍然是一個難點。
一般而言,RUL的預測往往是基于大量的測量數據來實現的,而如何從海量的具有過程噪聲的連續采集的監測數據中提取退化特征來監測系統的性能退化趨勢,進而精準地預測出RUL是一個挑戰。支持向量描述(Support Vector Data Description,SVDD)最早由Tax和Duin[11]提出,是一種用于離群點檢測和分類的模型,其一直以來被用于故障診斷的研究。然而考慮到SVDD可以用于檢測待測樣本到SVDD超球面的距離,因此可以用監測數據到故障數據集距離的不斷減小來表征系統健康指標的逐步退化。粒子濾波(Particle Filter,PF)為一種基于貝葉斯估計的非線性濾波算法[12],為了實現RUL可靠預測的同時提供一個大概率的故障時間范圍,PF算法經常被用于RUL預測的研究。例如,Liu等[13]提出了一種基于PF的粒子學習框架來預測鋰離子電池的RUL;Qian等[14]提出了一種改進粒子濾波方法,并將其應用于滾動軸承的RUL預測中。實驗結果證明了這種方法的優越性。
基于上述分析,筆者提出了一種基于SVDD和PF的退化趨勢監測和RUL預測的框架。首先,基于歷史故障數據建立SVDD模型來構建健康指標以監測系統的退化;然后,建立一個可以描述健康指標退化趨勢的退化模型;最后,基于PF算法和自動確定的故障閾值來實現RUL的預測。所提出的方法主要具有以下優點:利用SVDD構建健康指標無須專家的先驗知識,具有同通用性;故障閾值設定方法避免了傳統手工指定故障閾值而可能導致的預測誤差,提升了預測結果的準確性;基于SVDD和PF的預測框架能夠監測系統的退化趨勢并提供準確可靠的RUL預測結果。
SVDD的主要思想是在高維空間中找到要描述的目標數據集周圍的球形邊界,在考慮到異常值存在的條件下,要包含盡可能多的目標數據[15]。 SVDD的算法原理如圖1所示,在三維特征空間中存在一個類別為“1”的目標數據集,定義一個球心為a、半徑為R的超球模型,則SVDD模型訓練的目的是通過最小化R來找到體積最小的超球體,以對目標數據進行準確的描述,使被描述的數據盡可能多地被包含在超球體內,而其中用于邊界描述的數據就被稱為支持向量。

圖1 SVDD算法原理
給定一個訓練數據集xi∈Rd,i=1,…,N,假設存在中心為a、半徑為R的超球模型,則SVDD的優化問題就轉變為

(1)
式中:ξi為引入的松弛因子,目的是防止過擬合;C為用戶定義的固定參數;φ(xi)為能夠將訓練數據xi映射到高維空間的函數。那么上述問題可以通過最優化下面的對偶問題得到解決。

(2)

(3)

(4)
如果D>R,則測試樣本被視為離群值,即不屬于目標樣本這一類;如果D PF的主要思想是基于蒙特卡羅方法利用重要性密度函數對大量隨機粒子進行采樣,并賦予每個粒子一個重要的權重來表示后驗概率密度[16]。假設一個動態系統可以表示為如下的狀態空間模型: (5) 式中:xk為k時刻系統的狀態;zk為k時刻xk的測量值;wk-1和vk分別為k-1時刻和k時刻的過程噪聲和測量噪聲。PF的核心問題是如何構造后驗濾波分布p(xk|z0:k),一般分為預測和更新兩個步驟。在預測階段,k-1時刻的后驗概率p(xk-1|z0:k-1)是已知的,則先驗概率p(xk|z0:k-1)可以通過式(6)得到。 (6) 然后,當測量到k時刻的zk時,對后驗概率進行更新: (7) 式(6)和式(7)的運算依次重復,形成遞歸貝葉斯估計。然后采用蒙特卡羅采樣從后驗概率分別采集帶權重的粒子集樣本集,用粒子集表示后驗分布,將積分轉換為求和形式。具體來說,就是后驗分布通過粒子集近似為經驗估計,可用如下的估計來實現近似: (8) 直接利用復雜系統的大量監測數據來識別系統的健康狀態往往是行不通的。為了識別復雜系統的健康狀態,提出了一種基于SVDD的健康指標構建方法,其核心思想是利用SVDD對故障數據集進行描述,而隨著系統運行時間的推移,健康狀態逐漸劣化最終會退化到故障狀態,從而使測試樣本到SVDD超球面的距離逐漸減小并最終小于SVDD的球半徑。假設采集的系統的故障數據集可以表示為 (9) 式中:n為測量變量的個數;m為測量次數。然后,基于故障相關的數據集建立相應的SVDD模型,則可通過式(10)來計算超球面的半徑。 (10) 在線監測時,一旦獲得新的時刻t的測量值,可由式(4)得到當前監測樣本到故障超球面中心的距離,則可以定義如下健康指標: (11) 為了提供一個高概率的可能發生故障的時間范圍,利用PF算法與本文提出的自適應故障閾值來預測RUL。首先,針對健康指標的退化趨勢擬合一個退化模型,并構建退化模型參數相關的狀態空間方程。 (12) 式中:θk為預測模型的參數;HIk為擬合的健康指標。所有的噪聲都認為是服從高斯分布的。g(θk,k)是用于擬合的退化模型,它可以有多種不同的形式以滿足不同對象的需求,例如:自回歸滑動平均模型、灰色模型等時間序列模型、多項式模型、指數模型、神經網絡模型等。而考慮到所使用對象的潛在特征形式是指數型的[17],此處選用具有良好擬合效果的雙指數模型。一般來說,選擇退化模型的主要依據一方面是通過數據的初步分析,了解數據的特點之后選擇合適的模型;另一方面是可以選擇幾種模型進行實驗,基于實驗結果選擇精度最高的模型。 基于模型(12),引入PF算法來估計退化模型參數θk的概率密度函數。假設HI1:k表示時間序列(1:k)對應的健康指標的觀測值,則健康指標的p步預測的過程如下。 ② 粒子更新?;谑?7)和前一時刻的粒子集計算當前k時刻的粒子權重: (13) ④ 狀態估計。利用新的粒子和權重估計新的預測模型參數。 (14) ⑤ 健康指標預測?;谑?8)可以得出k步超前預測的概率密度函數p(θt+k|z0:t),從而可按式(15)計算預測模型參數的p步預測。 (15) 最終就可以通過式(12)所示模型推導出健康指標的p步預測。 (16) 在進行RUL預測時,故障閾值的選取同樣非常重要。一般都是根據經驗或者專家知識指定一個故障閾值,而提出的故障閾值設定方法無須專家知識,可將其定義為 FT=ζRf (17) (18) 同時進一步可以按照式(19)估計預測的RUL的概率密度函數。 (19) 綜上所述,提出的基于SVDD和PF的RUL預測框架詳細的流程如圖2所示。 圖2 基于SVDD和PF的RUL預測流程圖 所用航空發動機退化數據集是由商業軟件C-MAPSS[18]生成的多組全壽命仿真退化數據,已經被廣泛地應用于RUL預測的研究中。實驗方法為對發動機多次循環運行時的數據進行記錄,形成4個數據集,每一組數據集記錄了100臺航空發動機的退化監測數據。但每一臺發動機的初始磨損程度是不同的。此外,發生故障的精確時間、噪聲的大小和準確的初始磨損量值對研究者來說也是未知的。 選用單一工況和單一故障的FD001數據集進行實驗驗證,雖然共包括了21個監測數據,然而其中有一些監測數據是恒值,并不能為RUL的預測提供任何有用信息。因此,選擇序號為2,3,4,7,8,9,11,12,13,14,15,17,20,21的14個監測數據作為輸入數據。又由于監測數據伴有噪聲污染,因此選用最小二乘濾波(窗口長度設置為30)去除噪聲的影響。為了消除不同監測數據量綱的影響,利用零均值標準化方法對監測數據進行歸一化。SVDD選用高斯核函數,權衡參數C設置為0.02。此外,與故障閾值相關的參數設置為ζ=0.9,則故障閾值可按照式(17)計算得到FT=0.4626。實驗得到的100臺發動機的健康指標如圖3所示。 圖3 100臺發動機的健康指標 由圖3可知,100臺發動機的初始退化有所差異,這符合數據集每一個發動機擁有不同的初始磨損程度的特點。而隨著運行時間的不斷增加,健康指標逐步減小,這表明所構建的健康指標可以反映發動機健康狀況的逐步退化。 隨機選取第40臺和第58臺發動機為例進行分析。首先對第40臺發動機運行到159次循環時進行RUL的預測和分析,實驗結果如圖4所示。綠線為預測開始的時間點,退化特征預測的均值用藍線表示,95%置信區間用粉紅色區域表示。根據圖4在159次循環時預測的健康指標的發展趨勢,即利用前159次循環的數據來更新健康指標退化模型。然后利用外推健康指標直到達到故障閾值為止,以此計算出發動機的壽命終止時間,可以看出估計的發動機壽命終止時間的中位值和95%置信區間分別為178次循環和[165,190]。而真實的終止時間是188次循環,誤差為10,落入了預測的置信區間之內。 圖4 第40臺發動機在159次循環時的預測結果 由于使用的貝葉斯方法具有統計特性,RUL的預測結果是由2000個粒子來近似分布的。在得到發動機的壽命終止時間之后,根據式(18)和式(19)分別計算RUL和其95%置信區間,可以得到RUL預測的中位值和95%CI分別為19個循環和[6,31],而真實的剩余壽命是29個循環,誤差為10,具體的概率密度函數如圖5所示。 圖5 第40臺發動機RUL的概率密度函數 第58臺發動機的預測結果如圖6所示,利用前124次循環的數據來更新健康指標退化模型。然后利用外推健康指標直到達到故障閾值為止,以此計算出發動機的壽命終止時間,可以看出估計的發動機壽命終止時間的中位值和95%置信區間分別為144次循環和[139,148]。而真實的終止時間是147次循環,預測誤差為3。 圖6 第58臺發動機在124次循環時的預測結果 同樣根據式(18)和式(19)分別計算RUL和其95%置信區間,可以得到RUL預測的中位值和95%CI分別為20個循環和[15,24],而真實的剩余壽命是23個循環,具體的概率密度函數如圖7所示。從圖7中可以看出所預測的RUL和真實的RUL非常接近,同樣證明了所提出方法的有效性。 圖7 第58臺發動機RUL的概率密度函數 使用的C-MAPSS數據集已廣泛用于RUL預測的研究中,采用常用的均方根誤差(RMSE)、平均絕對誤差(MAE)和準確度(Acc)進行評價。將所提出方法與一些已有的研究方法進行比較,精確度的計算方法為 (20) 為了說明所提出方法在RUL預測方面的優越性,選擇基于案例分析(IBL)、支持向量機(SVM)、長短期記憶網絡(LSTM)和卷積神經網絡(CNN)的方法作為對比方法。表1列出了這些方法與所提出方法的詳細的對比結果,其中NA表示原文中沒有應用這項評價指標。綜合來看,本文提出的方法取得了不錯的預測性能。此外,所提出的方法無須大量的計算時間和計算資源,還可以提供一個高概率的失效時間范圍而不僅僅是RUL這一單一數值,可以為系統的視情維修提供重要的參考。 表1 多種方法對比結果 針對復雜系統的健康狀態監測和RUL預測的問題,提出了一個基于SVDD和PF的RUL預測框架。通過對航空發動機退化數據集進行案例分析,實驗結果表明所提出的基于SVDD的健康指標構建方法能夠提取可以表征系統健康狀態退化的健康指標,基于PF算法和所提出的自動故障閾值設定方法能夠準確地預測出發動機的RUL。此外,通過與現有方法的對比分析發現,提出的RUL預測框架不僅具有較高的預測精度,同時還可以提供一個可能的實效時間范圍來為維修決策提供更多的有用信息,具有廣闊的應用前景。1.2 粒子濾波


2 基于SVDD和PF的RUL預測
2.1 基于SVDD的健康指標構建
2.2 基于健康指標退化模型和PF的RUL預測




3 實驗驗證
3.1 航空發動機退化數據集
3.2 實驗結果






4 結束語