戴邵武,陳強強,丁 宇
(1.海軍航空大學, 山東 煙臺 264001; 2.空軍93381部隊, 黑龍江 拉林 150223)
航空發(fā)動機是武器裝備的重要組成部分之一,其工作狀態(tài)直接影響著飛行質(zhì)量,是保證飛行安全的重要部件之一[1]。排氣溫度參數(shù)是航空發(fā)動機工作狀態(tài)的重要參數(shù),在一定程度上反映著航空發(fā)動機的工作性能。因此,對多個連續(xù)飛行架次的排氣溫度裕度(Exhaust gas temperature margin,EGTM)進行預測分析,是研究航空發(fā)動機的重要環(huán)節(jié)之一,其預測結(jié)果可反映航空發(fā)動機的性能走勢,為后續(xù)的管理及故障檢測提供了理論依據(jù)[2]。
在EGTM數(shù)據(jù)預測方面,自回歸移動平均模型(Auto Regression Moving Average,ARMA)作為經(jīng)典的時間序列預測模型發(fā)展較為成熟完善[3];ARMA模型是傳統(tǒng)的時間序列建模方法,可以看作是自回歸模型(Auto Regression,AR)和移動平均模型(Moving Average,MA)的結(jié)合[4]。其擴展形式還有自回歸積分滑動平均模型(Autoregressive Integrated Moving Average Model,ARIMA)等[5]。傳統(tǒng)的預測分析方法具有理論模型精確、簡單快捷等優(yōu)點,但針對復雜的非線性非平穩(wěn)時間序列的預測方面,存在著一定的精度限制,制約了其精度。
隨著人工智能算法的不斷發(fā)展,機器學習理論逐步成熟完善,在時間序列預測方面得到廣泛的應(yīng)用。在EGTM預測方面,一些神經(jīng)網(wǎng)絡(luò)算法如極限學習機(Extreme Learning machine,ELM)[6]、支持向量機(Support Vector Machine,SVM)[7]、灰色BP神經(jīng)網(wǎng)絡(luò)[8]等得到應(yīng)用創(chuàng)新。但受到航空發(fā)動機工作環(huán)境、機動特性等多方面因素影響,其EGTM數(shù)據(jù)序列具有很強的非線性及非平穩(wěn)性,此時單一的神經(jīng)網(wǎng)絡(luò)算法的回歸精度會受到一定限制。
本文針對EGTM數(shù)據(jù)進行了分析研究,針對單一SVM對非線性、非平穩(wěn)EGTM數(shù)據(jù)預測精度不足的問題,借鑒MEEMD算法原理,通過改進EMD方法對原EGTM數(shù)據(jù)序列進行處理,降低了EGTM時間序列的復雜程度,并有效抑制分解過程中的模態(tài)混疊現(xiàn)象,然后通過對分解得到的時間序列進行分別預測并匯總,得到EGTM數(shù)據(jù)的預測結(jié)果。
在時間序列分解方面,經(jīng)驗模態(tài)分解方法于1998年由Huang N.E提出,是一種新型的信號分解方法,在非線性、非平穩(wěn)信號的處理中具有良好的效果[9]。EMD算法將復雜信號分解為多個固有模態(tài)函數(shù)(Intrinsic Mode Function,IMF)和一個余項(Residual Series)。EMD分解的表達式為:
(1)
式(1)中:st為原始信號;imfi(t)為第i個IMF分量;rn(t)為分解得到的余項。待分解信號可表示為分解得到的子序列之和。
在分解過程中,根據(jù)IMF判據(jù),判斷IMF分量的標準為:① 信號中零點數(shù)和極值點數(shù)相等或至多相差1個;② 極大值包絡(luò)線和極小值包絡(luò)線的均值相等且為0。
在EMD算法中,分解過程中存在的一大問題是模態(tài)混疊現(xiàn)象,即同一個IMF分量中出現(xiàn)了不同尺度和頻率的信號,或同一尺度及頻率的信號被分解到多個IMF分量中。多個模態(tài)混雜在若干個IMF分量中,影響了IMF分量的物理意義,不利于后續(xù)時間序列預測模型的建立。借鑒MEEMD方法對模態(tài)混疊問題的處理[10],對EMD算法進行改進,其步驟為:
步驟1針對原始信號st,分別添加均值為0且互為相反數(shù)的白噪聲信號序列ni(t)和-ni(t),用ai表示噪聲幅值,i表示添加的白噪聲對數(shù),即:

(2)

(3)
步驟3將步驟2中已分解的多個IMF分量從st中分離出來,得到剩余信號,即:
(4)
步驟4對剩余信號r(t)進行EMD分解,得到所有IMF分量。
在MEEMD中,主要解決時間序列的去噪問題,因此MEEMD方法引入了排列熵概念(Permutation Entropy,PE)以評價時間序列的復雜程度[11]。通過設(shè)定排列熵值,對分解過程中得到的各個分量進行排列熵判斷,將排列熵大于設(shè)定值的序列視為異常信號,濾除了排列熵大于設(shè)定值的序列。這一設(shè)定解決了如何濾除無用IMF序列的問題,而在時間序列分解過程中,分解的每一項子序列均包含了原始時間序列的信息,此時若對分解得到的時間序列進行濾除,則遺漏了部分時間序列信息,破壞了原始時間序列的結(jié)構(gòu)。因此通過改進的EMD方法,既解決了EMD分解過程中模態(tài)混疊的問題,同時保證了分解序列的完備性,使其更適用于時間序列預測過程中的時間序列分解問題。
SVM于1995年由Vapnik等人首次提出,是機器學習算法的典型代表。SVM以統(tǒng)計學習為理論基礎(chǔ),通過非線性映射,將原始空間樣本數(shù)據(jù)映射到高維特征空間,從而實現(xiàn)其理論分析[12]。支持向量回歸(Support Vector Regression,SVR)是SVM的一種表現(xiàn)形式之一,主要解決SVM的回歸問題。其思路如下:
針對訓練集(x1,y1),(x2,y2),…(xm,ym),xi,yi∈R,可構(gòu)建線性回歸函數(shù)為:
y=f(x,ω)=ω·x+b
(5)
線性ε-非敏感損失函數(shù)|y-f(x,ω)|ε(ε為不敏感系數(shù),主要針對SVR的回歸精度進行調(diào)控)為:

(6)


(7)
其約束條件為:

(8)
引入拉格朗日函數(shù):

(9)
求解公式中的參數(shù),簡化回歸函數(shù)為:
(10)
引入核函數(shù)的概念,式(10)可轉(zhuǎn)換為:
(11)
相比EMD方法而言,改進EMD算法能夠有效抑制EMD方法在分解過程中所產(chǎn)生的模態(tài)混疊現(xiàn)象,同時減少分解過程中的計算量,縮短了分解時間,并保留了時間序列的完備性。改進EMD算法產(chǎn)生的IMF分量也小于EMD分解方法,更適用于時間序列分解問題。
針對EGTM數(shù)據(jù)序列的非線性和非平穩(wěn)性,單獨使用SVR進行時間序列預測時具有一定的難度,并存在預測模型不準確、預測精度不高等問題。在本文預測模型中,首先使用改進EMD算法對EGTM數(shù)據(jù)序列進行分解,通過排列熵概念對其分解得到的子序列進行判斷,以降低EGTM數(shù)據(jù)序列的復雜程度;然后針對改進EMD方法分解后的每個IMF分量及余項,分別構(gòu)建單個的SVR預測模型并進行預測,從而提高預測精度。采用改進EMD方法進行時間序列分解之后,其誤差量級為10-14,表明了改進EMD分解結(jié)果具有很好的完備性,可以完整的表達出時間序列包含的全部信息。因此,分解后的各個IMF分量及趨勢項的組合,可以完全擬合原時間序列[13]。針對分解之后的IMF分量進行特性分析可知:在分解過程中,隨著分解次數(shù)的增加,IMF的階數(shù)不斷增加,相應(yīng)的IMF分量波動頻率不斷降低,即低階的IMF分量對應(yīng)的是高頻信號。利用改進EMD算法處理原時間序列,可以準確得到時間序列在不同時間段的波動特征,簡化時間序列預測模型,在一定程度上提高時間序列預測精度。改進EMD-SVR算法流程框圖如圖1所示。

圖1 改進EMD-SVR算法流程框圖
針對IMF分量及余項分別構(gòu)建SVR預測模型的過程中,影響模型預測精度的主要因素是核函數(shù)的選取以及核函數(shù)參數(shù)g與懲罰參數(shù)c的設(shè)置。其中,核函數(shù)一般選擇RBF核函數(shù)和線性核函數(shù)[14]。g與c的選擇,一般采用交叉驗證(Cross Validation,CV)方法[15]。首先在大的范圍粗略確定最佳參數(shù),然后縮小CV的范圍及步長,在更小的合理區(qū)間內(nèi),以更高的精度確定最佳的g與c。在圖1的基礎(chǔ)上,改進EMD-SVR具體步驟如下:
步驟1將待分析的時間序列進行改進經(jīng)驗模態(tài)分解,得到分解后的各分量(IMF1,IMF2,…,IMFn)及余項rn。
步驟2對所有的IMF分量及余項建立SVR模型。
步驟3對各個分量進行預測。
步驟4將多個預測值進行累加得到最終預測值。
步驟5分析預測結(jié)果,驗證預測模型。
某型發(fā)動機每月的起飛EGTM觀測值為例,在選擇樣本時,對其進行數(shù)據(jù)處理,每隔200個循環(huán)獲取發(fā)動機的一個EGTM觀測值,到第14 800個循環(huán)結(jié)束,共計74個采樣點[16]。對該EGTM數(shù)據(jù)構(gòu)建SVR預測模型,以驗證時間序列重構(gòu)算法的有效性。針對原始EGTM數(shù)據(jù)序列,在預測過程中選取前60個數(shù)據(jù)點作為訓練集,余下14個數(shù)據(jù)點作為測試集,通過構(gòu)建SVR預測模型對測試集數(shù)據(jù)進行準確預測。以平均絕對誤差(Mean Absolute Error,MAE)和均方根誤差(Root Mean Squared Error,RMSE)為指標來衡量預測算法的預測能力[17],其表達式分別為:

(12)

(13)
式中:Xreal,i為數(shù)據(jù)序列中第i個數(shù)據(jù)的真實值;Xpre,i為數(shù)據(jù)序列中第i個數(shù)據(jù)的預測值;n為數(shù)據(jù)點的總數(shù)。
實驗中選擇的某型發(fā)動機原始EGTM數(shù)據(jù)序列如圖2所示。

圖2 EGTM序列
如圖2所示,原EGTM數(shù)據(jù)序列具有較大的非線性與非平穩(wěn)性,此時直接建立其SVR預測模型時存在著模型精度不高、預測難度過大等問題。分別采用EMD方法及改進EMD方法對原始EGTM數(shù)據(jù)序列進行時間序列分解, EMD分解之后的各序列如圖3所示,改進EMD分解之后的各序列如圖4所示。

圖3 EMD分解結(jié)果

圖4 改進EMD分解結(jié)果
由圖3和圖4可知,原始EGTM數(shù)據(jù)序列經(jīng)過EMD分解之后,共分解得到5個IMF分量及1個余項;經(jīng)過改進EMD分解之后,共分解得到3個IMF分量及1個余項。說明了改進EMD分解能夠有效抑制分解過程中的模態(tài)混疊現(xiàn)象,同時具有較少的IMF分量,簡化了后續(xù)預測過程,更適用于對其進行時間序列預測。
以排列熵作為衡量信號復雜度的標準,EMD分解及改進EMD分解得到的各IMF分量的排列熵如表1所示。

表1 各序列的排列熵
如表1所示,對兩種分解方法得到的子序列的排列熵進行分析,相比EMD分解而言,改進EMD方法具有較少的IMF子序列,且其排列熵值與EMD分解的子序列基本一致,沒有明顯的變化,證明了子序列的時間序列復雜程度相近,均可有效的構(gòu)建預測模型。
根據(jù)EMD及改進EMD分解之后的各IMF序列及余項,分別構(gòu)建各自的SVR預測模型,選擇RBF核函數(shù)及線性核函數(shù)進行時間序列預測,利用交叉驗證方法確定核函數(shù)參數(shù)及懲罰參數(shù)。確定準確的SVR預測模型之后,得到EMD分解后的各IMF分量及余項的RMSE及MAE指標如表2所示,改進EMD分解后各IMF分量及趨勢項的RMSE及MAE如表3所示。

表2 EMD分解后的預測誤差

表3 改進EMD分解后的預測誤差
由表2和表3可知,隨著IMF階數(shù)的增加,其序列的排列熵也隨之降低,即序列的復雜程度降低,此時預測誤差也隨之減小,證明了兩種分解算法中降低IMF序列復雜程度的合理性。結(jié)合對兩種分解算法完備性的分析,分解得到的所有子序列重構(gòu)之后,與原時間序列的誤差量級為10-14,因此,將表2和表3中各序列的預測結(jié)果相加,即可得到EGTM數(shù)據(jù)序列的預測結(jié)果,如圖5所示,與EGTM數(shù)據(jù)序列的測試集和單個SVR預測模型進行對比,兩種算法的預測結(jié)果分別記為EMD-SVR與I EMD-SVR。

圖5 預測結(jié)果
為驗證改進EMD-SVR算法的準確性,對單個SVR、EMD-SVR及傳統(tǒng)的ARMA模型的預測指標進行分析,其中,ARMA模型采用AIC準則進行定階,確定其AR及MA的模型階數(shù)[18]。將所得到的預測結(jié)果與真實值進行對比,其RMSE、MAE見表4。

表4 四種算法的預測誤差
結(jié)合圖5與表4進行分析可知:由于原始EGTM數(shù)據(jù)序列的非線性及非平穩(wěn)性,序列的復雜程度較高,此時基于ARMA構(gòu)建的預測模型不能對其進行準確預測,說明了針對復雜時間序列而言,傳統(tǒng)的預測模型存在著模型不準確、預測精度不高等問題。而基于機器學習方法的SVR算法,其預測效果比ARMA模型有著一定程度的提升,表明了神經(jīng)網(wǎng)絡(luò)在時間序列建模中的優(yōu)越性,相比ARMA模型而言,預測模型更加準確,預測指標得到提高,然而,受限于隨機誤差序列的復雜程度,SVR算法的能力也受到了限制。對比兩種時間序列分解方法的預測結(jié)果并進行對比分析可知:兩種分解方法對時間序列進行分解之后,通過將原時間序列分解為多個IMF分量及余項,在一定程度上降低了原序列的復雜程度,此時對分解之后的時間序列建立預測模型,能夠有效地提高預測模型的準確性,從而降低預測難度。與單一的SVR預測方法相比,EMD-SVR的RMSE降低了77.76%,MAE降低了80.62%,有效提高了預測精度。而改進的EMD-SVR方法,通過在EMD分解過程中加入成對的隨機噪聲序列并進行分析,有效抑制了模態(tài)混疊現(xiàn)象,所得到的子序列具有更好的物理意義,IMF子序列的減少,在一定程度上提高了預測精度,與EMD-SVR預測方法進行對比,其RMSE降低了16.12%,MAE降低了19.2%;同時,由于改進EMD算法得到的IMF分量減少,在一定程度上減少了預測模型的構(gòu)建過程,減少了預測過程中的數(shù)據(jù)運算,優(yōu)化了預測過程。
本文通過改進EMD方法對EGTM數(shù)據(jù)序列進行分解,得到多個時間序列復雜程度較低的IMF分量及余項,有效降低了EGTM數(shù)據(jù)序列的非線性及非平穩(wěn)性;對分解得到的各個子序列分別建立其對應(yīng)的SVR預測模型,并將所得結(jié)果進行匯總分析,完成EGTM數(shù)據(jù)序列的預測工作。采用相同的數(shù)據(jù)與SVR、EMD-SVR預測方法進行對比分析,得以下結(jié)論:
1) 以排列熵作為時間序列復雜程度指標分析,通過改進EMD方法對EGTM數(shù)據(jù)分解,可有效降低EGTM數(shù)據(jù)序列復雜程度,有利于建立更精確的預測模型。
2) 相比于經(jīng)典ARMA模型,機器學習在EGTM數(shù)據(jù)序列的預測中模型更加準確,具有更高的預測精度。
3) 通過改進EMD-SVR方法對EGTM數(shù)據(jù)進行預測,能夠有效抑制EMD分解過程中的模態(tài)混疊現(xiàn)象,減少分解過程所得到的IMF分量個數(shù),優(yōu)化了預測過程。改進EMD-SVR的預測結(jié)果更加有效貼近EGTM數(shù)據(jù)序列的細節(jié)趨勢,在預測精度上也有著很大的提高,具有理論應(yīng)用價值。