(中國民航飛行學院 航空發動機維修培訓中心,四川 廣漢 618307)
對于航空發動機來講,壓氣機的喘振會導致強烈的機械振動和熱端超溫,在極短的時間內就可能會造成發動機部件的嚴重損壞。現役的民航渦扇發動機多采用可調放氣閥門(variable bleed valve, VBV)放出部分壓氣機空氣以達到防喘的目的,所以可調放氣閥門的工作狀態對飛行安全的影響很大。相關研究結果表明,在飛機起飛和巡航段,如果VBV閥門的開度過大,有可能導致飛機飛行推力下降超過10%,引起飛機發動機推力失控事件的重大事件;在巡航和慢車速狀態時,如果VBV閥門開度過小,易引起發動機的增壓機喘振故障;在起飛、巡航和慢車狀態中,如果VBV閥門開度振蕩不定,會導致發動機推力下降超過10%,并且易發生喘振故障現象。因此研究可調放氣活門對于發動機監控,從而及時發現不良變化預防飛行事故具有重大的意義。
另一方面,隨著我國航空事業的發展,航空發動機已不再依賴統一定期以及事故后的維修方式,而是轉變到根據每一架航空飛機的實時狀態來定點視情維修。而這種更為精確的維修方式,要求對飛機每一個部件工作參數是否正常地了解,可以以較少的經濟時間成本換取更可靠的飛行過程。然而國內所用的民用渦扇發動機基本全部由國外公司生產,其部件特性、結構參數與控制特性等均無從得知,因此無法建立對發動機進行視情監控和故障診斷的數學模型[1]。
近年來,我國航空公司開始利用飛機快速存儲記錄器數據(QAR)數據實施飛機性能監控。QAR數據包括用于飛行狀態性能判斷的各個設備實時溫度、閥門開度、飛行速度、旋轉速度等100多個參數。同時,QAR譯后數據庫還有其他功能,包括飛行航跡和飛行剖面的圖形化查看以及飛行數據導出為Excel文件等。因此可以通過對QAR數據的挖掘,即利用系統的輸入輸出參數對發動機的系統進行辨識,構造一個相對真實的反映對象的數學模型[1]。
本文即是根據QAR數據中的參數來辨識航空發動機閥門VBV的數學模型,也稱工作基線,即處于良好工作狀態的發動機在標準狀態下VBV與其控制參數之間的函數關系。VBV的控制參數較多,定性工作基線模型為:
VBV=f(N1K12, N2K25, VSV, TAT, T2.5, TLA, N1 ACT, P0)
其中:
N1K12為低壓轉子修正轉速與額定轉速的百分比(%);
N2K25為高壓轉子修正轉速與額定轉速的百分比(%);
VSV為可變靜子葉片的角度(°);
TAT外界大氣溫度(℃);
T2.5為高壓壓氣機進口溫度(℃);
TLA為油門桿角度(°);
N1為低壓轉子實際轉速與額定轉速的百分比(%);
P0為外界大氣靜壓(PSIA)。
根據CFM56-7B發動機生產廠商CFM公司的文獻[2],綜合考慮影響VBV開度的各種因素,排除的次要參數,最終將CFM56-7B發動機的VBV的定性工作基線模型簡化為:
VBV=f(N1K12, N2K25,VSV ,TAT, T2.5)
本文辨識過程中所有參數樣本均來源于實際的QAR數據。選擇了一架BOEING737-800飛機左右兩臺發動機(這兩臺發動機CFM56-7B的裝機時間均為2015年5月,CSN均為4 200),收集了他們在2018年1月共25個航班,共50組QAR解碼以后的數據。每次航班的數據由于飛行時間的不同,共有7 500到12 000條數據不等。在使用時依據了以下的原則預先對數據進行篩選[3]。
1)選用發動機循環數較少的數據;
2)選用發動機性能良好的數據;
3)剔除有顯著差異的數據。
除此之外,為了排除數據單位對最終結果的影響,對所有數據進行了歸一化處理。為了簡化計算,數據量進行了4倍壓縮。最終,所用的數據經過了篩選、剔出和壓縮等預處理操作,保證了數據的可靠和統一。
早在60年前,國外就開展了飛機工作性能與故障性診斷結合起來統一研究。我國30年前,也開始了同樣的工作。比如,我國中國民航學院的林兆福教授就提出,可以應用正交實驗設計原理及最小二乘法曲線擬合原理來建立航空發動機工作基線[4]。哈爾濱工業大學的鐘詩勝教授又進一步提出,利用多元非線性回歸的方式,采用高斯牛頓迭代法對多元非線性回歸方程進行回歸分析[5]。再之后,中國民航大學的曹慧玲教授采用支持向量機回歸算法,開始用廠家監控系統數據和飛機快速存儲記錄器數據兩種方式對基線進行挖掘分析[6]。
對于航空發動機這樣的復雜非線性系統,要對其進行系統辨識是比較困難的事情。針對這樣的非線性模型,可使用的先進辨識算法有以下幾類,分別介紹如下。
Volterra泛函級數具有鮮明的物理意義,切合非線性動力學的工程系統。但這種方法需要相當高的參數才能保證辨識結果的精度,計算比較困難。
NARMAX 模型即帶外生變量的非線性自回歸滑動平均模型。這種方法在實際中,可將給定的模型辨識問題簡化為最小二乘估計問題,因此得到較為廣泛的應用。但缺點是最近模型的精度取決于正確的模型結構。
人工神經網絡算法(ANN)具有逼近任意非線性函數的能力。但訓練算法、網絡類型等需要實行指定,比較依賴先驗知識,結果也不能提供簡潔顯性的知識表達。
模糊邏輯算法理論上可以以任意精度逼近任意一個定義在致密集上的非線性函數。但實際還有考慮算法的可操作性和模型的可解釋性。
支持向量機VSM和人工神經網絡一樣,是一種新興的通用學習工具,具有強大的非線性逼近能力。可以在有限樣本的情況下,得到現有信息的最優解。但VSM得到的模型不能提供明確的數學表達式,難以分析系統的動穩態性能。
常規的遺傳(GA)算法不需要先驗知識,可以并行計算,全局尋優。可以快速高效地解決復雜高維和高非線性問題,具有非常突出的優點。后來GA算法發展出遺傳編程(GP)算法,可以自動生成程序來解決問題。使用GP算法進行系統辨識,不需要對模型結構進行任何假設,可以在多目標下自動尋找適合的模型結構,同時優化模型結構和參數。
在GA和GP算法基礎上,進一步發展了基因表達式編程(GEP)算法。這是一種基于生物基因結構和功能發明的一種新型自適應演化算法。具有GA和GP算法的優點,編碼方式較為簡單,易于進行遺傳修飾的操作,并且具有結構和功能上的多樣性。由于GEP在解決復雜的函數發現等問題上具有較好的性能,故在科學計算和商業應用等領域取得了廣泛的應用[7]。
由于飛機發動機可調放氣閥門VBV工作基線是一個多維,強非線性的復雜曲線。采用前面5種系統辨識方法,會遇到缺乏先驗知識,數據量大,容易陷入局部最優,不能生成確定的數學表達式等種種問題。相比其他算法,GEP算法具有以下優點[8]。
1)具有強大的表達復雜問題的能力和快速高效的搜索能力,辨識結果不易陷入局部最優解。
2)不依賴于先驗知識,可以自動搜索所有可能的非線性模型空間。
3)能夠產生任意復雜度的模型結構,發現具有最優性能的動態表達式。
4)還可以進行多目標進化,使目標模型可以在復雜度和精確度之間實現平衡。
因此本文采用GEP算法來解決飛機發動機可調放氣閥門VBV工作基線系統辨識這一問題。
基因表達式編程的算法流程如圖1所示。首先,隨機產生一定數量的染色體個體(初始種群),然后,依據待解決的問題要求,計算個體的適應度。然后按照個體適應度進行選擇,選中的個體進行有修飾的復制,留下具有新特性的后代。接下來,這些新的個體也要經歷相同的發展過程:基因組的表達,計算適應度,選擇和有修飾的復制,該過程重復若干代,直到發現一個優良解[9]。

圖1 GEP算法流程
將GEP算法用于工作基線函數挖掘具體工作,就是將5個VBV控制參數和可能的函數關系構造到初始染色體中,編碼形成表達式樹,計算表達式對應的適應度,選擇適應度最好的染色體進行變異、插串、根插串、單點重組、兩點重組、基因重組等操作,使染色體不斷改變,越來越適應VBV數據所呈現的規律,直到最終匹配。適應度最高的染色體對應的表達式就是工作基線函數。
在對工作基線函數GEP算法編程中,所使用的開發軟件是Matlab語言。這是美國Mathworks公司開發的高級技術計算語言和交互環境,廣泛用于算法開發、數據可視化、數據分析和數值計算中。算法中具體設置如表1所示[10]。

表1 VBV工作基線函數挖掘中GEP算法相關設置
算法中適應度的判別采用殘差平方和SSE,即擬合數據和原始數據對應點的誤差平方和。計算公式如下:
當SSE的值越接近0,說明擬合數據越接近于原始數據,模型的預測越成功,擬合度越高。以SSE為適應度進行判別,可以讓進化過程朝著擬合優度越來越大的方向進化。以一組數據進行迭代計算的適應度變化曲線如圖2所示。

圖2 適應度變化曲線
當程序迭代到300代,適應度達到0.98,此時擬合出運行曲線如圖3(a)所示。將擬合出的曲線圖3(a)和QAR中實際測出的曲線圖3(b)對比,可以看出曲線的形狀基本一致,僅在少部分地方有些出入。圖3(c)進一步給出了擬合曲線和實測曲線之間的誤差曲線,可以看出誤差量很小,基本接近于零。說明GEP算法辨識VBV工作基線,誤差小精度高,高效可靠。

圖3 QAR實測曲線,GEP算法擬合曲線及兩者誤差
圖3的結果是GEP算法針對一個航班一臺發動機的壓縮數據,經過300代的迭代計算后,挖掘出的可調放氣活門的開度VBV的工作規律。該規律經過表達式譯碼,寫成公式為:
VBV=F(a,b,c,d,e)=0.2957+4Δ(d)+

0.0049c+0.0047e
其中:a,b,c,d,e分別代表低壓轉子修正轉速與額定轉速的百分比N1K,高壓轉子修正轉速與額定轉速的百分比N2K,外界大氣溫度TAT,可變靜子葉片的角度VSV,高壓壓氣機進口溫度T2.5這5個控制參數。
從上述擬合公式可以看出,可調放氣活門的開度VBV與可變靜子葉片的角度VSV關系最為密切,公式中2、3、4項都和VSV直接有關,對VBV最終數值其決定性的作用。說明VBV主要受VSV數據的影響。
另外,從公式可以看出,可調放氣活門的開度VBV除了受可變靜子葉片的角度VSV的影響外,同時也受低壓轉子修正轉速與額定轉速的百分比N1K,高壓轉子修正轉速與額定轉速的百分比N2K,外界大氣溫度TAT,高壓壓氣機進口溫度T2.5四個參數的影響,但影響相對較小。在這4個因素中,低壓轉子修正轉速與額定轉速的百分比N1K相對其它因素影響更大,在公式中第4、6項均和N1K有關。而高壓轉子修正轉速與額定轉速的百分比N2K,外界大氣溫度TAT,高壓壓氣機進口溫度T2.5這幾項和最終可調放氣活門的開度VBV有一定的關系,但整體影響較小。這些規律和實際中的直觀影響相符,說明上述由GEP算法擬合出來的基線方程是貼合工程實際的。
但是該基線方程是由一次航班的一個發動機數據擬合出來的。為了深入討論擬合結果的普遍性,將基線方程應用到其它航班數據中進行驗證,驗證時采用了以下指標:
確定系數(R2):
其中:
確定系數R2越接近于1時,說明該擬合模型的擬合優度越高。由于確定系數會隨著模型自變量數目增加而增加,為了讓最終效果更精確,對確定系數進行修正,進一步采用修正確定系數adjustedR2。
修正決定系數(adjustedR2):
殘差平方和(SSE):
殘差平方和(SSE)越小,擬合結果與實測數據之間的誤差越小,說明擬合結果越準確。
均方誤差(MSE):
均方根誤差(RMSE):
均方誤差(MSE)、均方根誤差(RMSE)和殘差平方和(SSE)一樣,用來反映所得的擬合模型數據和實際數據之間的差異程度,數值越小說明兩者越接近。
使用前面GEP算法擬合出來的模型公式,對隨機選取的兩次航班不同日期共50組的發動機數據進行檢驗。分別計算了確定系數(R2)、修正決定系數(adjustedR2)、殘差平方和(SSE)、均方誤差(MSE)、均方根誤差(RMSE),其結果如表2所示。
由表2中結果可知,50組數據利用函數模型進行驗證所得到的結果相差不大,說明擬合函數總體可靠。確定系數(R2)和修正決定系數(adjustedR2)除去唯一一個數據以外,其余均高于0.95以上,說明函數的擬合優度好,擬合數據對實測數據的解釋程度高;均方誤差(MSE)在0.010 2~0.023 0之間,平均0.014 8;均方根誤差(RMSE)在0.105 0~0.144 3之間,平均0.120 8,表明擬合函數數據分散在實際曲線附近,離散度很小,與實際曲線契合程度非常高。
通過對民航渦扇發動機QAR數據的挖掘,利用GEP算法找到了一個相對真實的民航渦扇發動機可調放氣閥門(VBV)的工作基線數學函數。驗證結果表明,GEP算法挖掘得到的結果精度高,誤差小,在有限樣本條件下對于民航渦扇發動機VBV工作基線的非線性建模具有很高的準確性,所構建的模型可以滿足民航對可調放氣活門進行監控和故障診斷的需要。

表1 GEP算法擬合模型對隨機選取發動機數據組檢驗結果