曹惠玲, 梁佳旺, 崔科璐
(中國民航大學大學航空工程學院學院,天津 300300)
航空發動機剩余壽命預測是發動機健康管理中的重要內容,合理的下發時間預測能夠降低風險發生的概率,減少維修成本[1]。航空發動機結構復雜、工作環境惡劣,難以通過物理模型來描述其衰退過程[2]。目前依據大量狀態監測數據的數據驅動方法是一種使用較為廣泛的剩余壽命預測方法。廠家QAR詳細記錄了發動機每次飛行循環的多種狀態參數,這些數據中隱含了反映發動機健康狀態的信息[3]。與以往僅以EGTM(排氣溫度裕度)作為性能指標相比,綜合發動機多源性能參數的健康指數能夠更為準確的表征發動機當前性能衰退狀況。在實際情況中,同一機型發動機不同個體之間存在出廠制造差異,在使用維護過程中也由于不同的維修等級、飛行環境等因素造成個體間衰退規律不同。所以如何體現個體差異性成為預測過程中需要面對的重要問題。在剩余壽命預測研究領域,基于相似性的預測方法能夠較好的對比分析個體間的差異性。
基于相似性的預測方法已經在多個領域得到應用,如股票價格、醫療診斷、語音識別、軸承剩余壽命等,通過與大量歷史樣本發展趨勢進行對比學習,能夠取得良好的預測效果[4]。在航空發動機剩余壽命預測中,通過對比發動機退化序列之間的相似性,認為與服役樣本具有相似退化模式的歷史樣本能夠提供更有價值的參考。在大量歷史數據樣本下,通過對比樣本之間時間序列相似性來預測系統剩余壽命,是一種能夠很好地解決個體差異性的預測方法。李強將時間序列相似性匹配方法引入到地震預報中[5];Zhang等通過相似性壽命預測方法對NASA提供的C-MAPSS渦扇發動機仿真數據進行研究,預測結果遠優于神經網絡方法[6];任博等在歐幾里得函數基礎上通過引入衰退系數構建相似性函來預測風電機剩余壽命[7];申中杰等提出一種基于相對特征和多變量支持向量機的方法來預測機械設備軸承剩余壽命[8]。
目前通過對比衰退序列相似性來預測航空發動機剩余壽命的研究還比較少,關鍵問題之一就是難以找到足夠的全周期衰退數據樣本。針對Trent700發動機機隊具有多源監測數據以及大量全壽命周期歷史樣本的特點,將多源性能參數通過狀態空間模型融合為表征發動機退化狀況的健康指數;通過聚類分析重構健康指數序列;對比測試發動機與歷史發動機退化序列的相似度,賦予相似樣本不同權重來預測發動機剩余壽命。
對于航空公司而言,導致發動機下發的主要原因包括:發動機性能衰退、時壽件到壽、葉片裂紋或燒蝕、某些參數超限等。在很多情況下,性能衰退是導致發動機下發的重要原因。對于因性能衰退導致下發的發動機而言,由于衰退程度無法直接測量,通常會比較實際與出廠EGTM來判定發動機衰退狀態,這種方法簡單易行,在航空公司得到了廣泛應用。但EGTM閾值標準是根據使用經驗制定的,設定太低會造成壽命件過度損耗,設定太高會浪費發動機剩余壽命;并且EGTM會受到季節溫度變化、發動機水洗等因素影響,造成其短期變化較為明顯,但這種變化并不代表發動機整體性能的變化[9-10]。發動機的多種狀態參數能從不同的側面表現其退化狀況,所以對于發動機這樣的復雜系統來說,融合多個狀態參數的信息能夠更為準確地反映系統狀態。所以引入了發動機健康指數(engine health index,EHI)代替EGTM來表征發動機的健康狀態。
通過現階段飛行監測系統得到航空發動機的多源監測數據,并且各類參數都是嚴格連續的,滿足構成時間序列的需求,為數據融合提供了良好的數據基礎[11]。為構建EHI,首先需要對多源監測數據進行相關分析,選取與發動機性能衰退相關性最強的幾個性能參數來表征發動機健康狀態。
相關分析常用方法包含協方差及協方差矩陣、圖表相關分析、一元回歸及多元回歸、相關系數、信息熵及互信息五種。依據監測數據特點,選取相關系數法進行相關分析。相關系數是反應變量之間關系密切程度的統計指標,取值區間在1~-1之間。1與-1分別表示完全正相關或負相關,取值為0表示完全不相關,相關系數通常用表示。
(1)
式(1)中:sxy為樣本協方差;sx和sy分別為樣本和的標準差,計算公式如下:
(2)
(3)
(4)
通過統計分析軟件SPSS對發動機飛行循環數與各性能參數分別進行相關性分析,選取相關性最強的五個性能參數EGTM(發動機排氣溫度)、ΔN3(高壓轉子轉速偏差值)、ΔFF(燃油流量偏差值)、ΔP25(壓氣機2.5級壓力偏差值)、ΔP30(壓氣機出口壓力偏差值)融合為表征發動機衰退狀態的健康指數EHI。
航空發動機在運行過程中,根據廠家所提供的面向客戶的預警記錄,發現少數時刻由于監測探頭損傷,數據記錄錯誤等因素影響,會造成監測數據出現異常值,為保證后續預測的準確度,需要對原始數據進行異常值篩選。選取狄克松(Dixon)判別法對異常值進行處理。狄克松判別法是一種用極差比雙側檢驗來剔除異常值的方法[12],根據數據量將數據序列分為若干區間,每個子區間可認為是獨立同分布的。該準則采用極差比的方法,在每個子區間中,設樣,根據其值的大小排序,假設x1 xn-xn-1>D-α(n) (5) x2-x1>D-α(n) (6) 式中:D-α(n)為Dixon所給的臨界值,D為子區間數據統計檢驗量,α為顯著水平,一般取0.05或0.01。若式(5)、式(6)成立,則說明xn、x1為異常值,應剔除,剔除后分別將xn-1與x2作為極大值和極小值繼續比較。在雙側對比中如果對比結果小于D-α(n),則對比停止,該側不再存在異常值。 圖1中數據為機隊中某臺發動機EGTM原始監測數據,通過狄克松判別法剔除異常值后如圖2所示,可以看到該方法比較有效地剔除了原始數據中的粗大誤差值。 圖1 EGTM隨飛行循環變化趨勢Fig.1 EGTM trend pattern with flight cycle 圖2 去掉粗大誤差后的EGTMFig.2 EGTM after removing the gross error 在得到與發動機性能衰退密切相關的五個性能參數后,利用狀態空間模型對性能參數進行融合,人為地建立系統健康指數來表征發動機當前狀態。 ZEHI=ft(x1,x2,…,xn) (7) (8) 式中,ZEHI為構建的發動機健康指數EHI,ZEHI=1代表發動機處于完全健康狀態,ZEHI=0表發動機因性能衰退而下發;x1,x2,…,xn為發動機在t=1,2,…,m時不同的性能參數值;K為模型系數矩陣。在計算過程中選取機隊中5臺初始性能良好的新發全壽命周期數據作為訓練樣本,x1,x2,…,x5分別為1.2節中選取的五個性能參數,每臺發動機前20個循環性能參數對應的健康指數為1,因性能衰退下發時刻前20個循環對應健康指數為0。得到模型系數矩陣K后將機隊中每臺發動機全周期數據代入,得到每臺發動機的健康指數時間序列。 多種性能退化參數變量已被轉化為表征航空發動機健康狀態的單一指標量—EHI。健康指數與發動機飛行循環構成典型的一維時間序列,利用面向一維時間序列相似性對比的預測方法來預測服役樣本的剩余壽命。QAR詳盡地記錄了每次飛行循環的監測數據,但對于同一性能參數,每次飛行循環之間由于飛行環境不同以及監測誤差等因素影響造成相鄰兩點數據相差較大,這種短期波動對于著重于長期發展趨勢的壽命預測研究來說沒有太大參考價值,并且會在計算序列相似度時增加計算時間和計算誤差,所以需要對健康指數時間序列進行聚類分析。 對于任意兩個EHI時間序列之間的相似性度量應滿足:對短期波動不敏感,但是能夠有效地反映長期趨勢。采用K-means聚類算法對EHI時序數據進行聚類分析。K-means算法也稱為K-均值算法,是聚類分析中的一種經典算法,具有簡單、快速、適合處理大數據集的特點[13]。預測流程框架如圖3所示,具體計算過程如下: (1)給定總量為的數據集,令I=1,選取個初始聚類中心Zj(I)(j=1,2,…,k)。 (2)計算剩余的每個數據點與聚類中心之間的距離,D[xi,Zj(I)(i=1,2,…,n)],如果滿足D[xi,Zj(I)]=min{[xi,Zj(I)],i=1,2,…,n}則xi∈ci。 (3) 計算k個新的聚類中心: (9) 即取聚類中所有元素各自維度的算數平均數。 (4)判斷:若Zj(I+1)≠ZJ(I),則I=I+1,重復(2);否則結束。 其中準則函數定義如下: (10) 式(10)中,G為所有對象平方誤差總和,p為數據對象,mi是簇Ci的平均值,準則函數使生成的結果盡可能緊湊獨立。距離D計算通常使用歐式距離法: D(X,Y)= (11) 則函數J收斂時得到新的健康指數序列EHIoi(i=1,2,…,k)。 通過對EHI時序數據完成聚類分析后,采用時間序列相似性匹配方法進行壽命預測,也就是對比預測樣本序列與歷史樣本序列之間衰退趨勢的相似性,計算流程如下: 2.2.1 對比時間序列 相似度的算法通常有歐氏距離法、動態時間彎曲距離法(DTW)等[14-15],由于歐氏距離法具有普遍適用、計算速度快的特點,采用歐式距離法[16]計算相似度: (12) 即分別計算測試樣本序列EHIoi與歷史數據庫中每個歷史發動機樣本EHIpi在0~k點序列段之間相似度,在EHIpi中p=1,2,…,m,代表歷史數據庫中的m個歷史樣本,j=1,2,…,k,…,n,代表每臺歷史樣本序列點數。 2.2.2 樣本權重分配 與預測樣本衰退過程相似度最高的歷史樣本在剩余壽命預測時應享有最高的參考比重,所以預測前需要對相似的歷史樣本賦予相應的權重,在預測過程中選取歷史樣本庫中相似度最高的臺發動機作為參照樣本。 (13) (14) 2.2.3 剩余壽命預測 L個樣本在k點處對應的剩余壽命RULi為已知,賦予L個樣本剩余壽命不同權重,可得到測試樣本剩余壽命RUIo: (15) 圖3 相似性剩余壽命預測模型框架Fig.3 Similarity residual life prediction model framework 在本文所研究的航空發動機剩余壽命預測問題中,使用的數據是航空公司QAR記錄的發動機最大起飛推力下的監測數據。該數據為機隊中Trent700系列發動機在不同飛行環境下的全壽命周期狀態監測數據,部分數據如表1所示。 表1 部分監測數據Table 1 Partial monitoring data 數據庫共包含28臺因性能衰退導致下發的發動機全壽命周期狀態監測數據,將其中23臺作為歷史樣本,另外5臺作為測試樣本。在本文中,首先通過狀態空間模型將所有樣本與發動機性能衰退相關性最強的性能參數EGTM、ΔN3、ΔFF、ΔP25、ΔP30轉化為能夠表征發動機退化水平的健康指數,構成發動機性能衰退的一維時間序列;然后對健康指數序列進行聚類分析處理;最后計算測試樣本序列與歷史樣本序列之間的相似度,依據樣本間相似度大小配以不同參照權重來預測剩余壽命。 通過狀態空間模型將多個性能參數融合為健康指數EHI來表征發動機當前健康狀態。 根據1.3節中所給方法得到模型系數矩陣KT。 (16) ZEHI=-1.791+0.038x1+0.1434x2+0.273x3+0.119x4+0.2473x5 (17) 通過訓練模型得到機隊中每臺發動機健康指數時間序列,圖4所示為機隊中某臺發動機健康指數序列趨勢圖。可見,數據點并不是非常集中,究其原因認為,不同航班發動機起飛時大氣環境存在較大差異;監測數據在測量記錄過程中存在一定程度誤差;某些性能參數值隨自身性能的影響波動比較大;發動機在維修后性能恢復程度不同等等,這些因素均會導致發動機健康指數序列存在波動[17],而這種波動也恰好真實反映了發動機在使用過程中的實際情況。 圖4 EHI隨飛行循環變化趨勢Fig.4 EHI trend pattern with flight cycle 通過健康指數表征的航空發動機性能退化過程是一種典型的一維時間序列。根據2.1節所給方法對序列進行聚類處理,根據計算得到:當類間距離取97時,既能得到很好的聚類效果,又能在相似度對比時具有較高準確度。利用歐氏距離法計算測試發動機序列與樣本庫歷史發動機序列的相似度,圖5為測試發動機與部分歷史發動機衰退過程時間序列對比,歷史樣本1與測試樣本具有較高的相似度,與歷史樣本2、歷史樣本3與測試樣本相似度較低。 圖5 EHI序列對比Fig.5 EHI sequence comparition 通過相似度計算選擇與測試發動機相似度最高的5臺歷史發動機作為參照樣本,依次按照相似度大小通過2.2節所給方法賦予這5臺發動機不同權重值。根據2.3節所給方法在測試樣本全壽命周期80%處進行預測,在序列相似性匹配過程中分別使用了EHI序列與EGTM序列,并與發動機的實際下發循環進行對比,預測結果對比如表2。 由上可見,通過將多源參數融合為健康指數構建的時間序列預測結果平均誤差為4.6%,其中單臺最大誤差為6.4%,最小誤差為2.8%;通過單參數EGTM構建的序列預測結果平均誤差為7.9%,單臺最大誤差為9.3%,單臺最小誤差為7.2%。從 表2 預測結果Table 2 Forecast result 測試樣本預測結果來看,通過EHI序列預測的誤差都要小于通過EGTM序列預測的誤差,這也表明了使用健康指數來表征發動機性能衰退狀態的優越性。 基于相似性的預測方法適用于難以建立準確退化模型的復雜系統中。針對航空發動機退化模式具有較大個體差異性的特點將相似性壽命預測方法引入到航空發動機剩余壽命預測研究中。 (1) 通過狀態空間模型將多源監測數據融合為健康指數,相比單性能參數來說健康指數能夠更為準確地表征發動機衰退狀態。 (2) 利用K-means聚類方法構建新的健康指數時間序列,可有效地縮短計算時間,提高相似性匹配準確度。 (3) 通過歐氏距離法計算樣本之間相似度,根據相似度大小賦予歷史樣本不同參照權重,使壽命預測更為準確。 (4) 對比單參數與健康指數兩種預測方法,結果證明后者具有更好的預測結果,同時能夠給航空公司發動機維修決策制定提供可靠依據。

1.3 健康指數融合
2 基于相似理論的剩余壽命預測
2.1 時間序列聚類分析
2.2 序列相似度計算


3 實例分析




4 結論