袁偉良, 盧朝陽*, 盧 衛,何 庶
(1.南京航空航天大學民航學院,南京 211100;2.中國東方航空江蘇有限公司飛行部,南京 211100)
在中國民用航空業迅速發展的今天,飛行安全成為行業內外人士關注的焦點,飛行品質也成為中外學者研究的熱點。此外,飛行品質作為表征飛機完成指定飛行任務的準確度及飛行員的技術水平的參數,找到一種成熟有效的飛行品質評估方法,對于防范飛行事故,提升飛行人員的飛行技術,提高飛行安全具有重要意義。
近年來中外學者對飛行品質的評價做出大量的研究。肖艷平等[1]對橫航向飛行品質的評價指標和研究方法做了重點分析。王越等[2]提出了將矩形起降航線分為五邊四彎,篩選評估指標,并將高級飛行教員多年的飛行教學經驗與實際飛行操作相結合,建立飛行學員飛行品質評估指標體系。王奔馳等[3]采用非線性映射方法提取飛行品質評估數據,然后將層次分析法與TOPSIS(technique for order preference by similarity to an ideal solution)法相結合確定綜合權重對起飛階段的飛行品質進行評估。Zhong等[4]提出了一種基于模型的方法,定義了飛行品質相關術語,形成并提出了基于模型的不同情況下的飛行品質評估方法。同年,Wang等[5]設計了比例模型飛行試驗的飛行質量評價標準,在實驗環境下反映飛機的飛行質量特征。Humphreys-Jennings等[6]使用工程飛行模擬器測試飛機的飛行和操縱質量,從而可為增強飛機可控制和操縱特性提供解決方案。
對于上述幾種評價方法大都以主觀評價或實驗模擬為基礎。主觀評價難以避免人為主觀因素對飛行品質評價的影響,而以實驗仿真數據為基礎的研究,缺乏可靠性和說服力。科學合理的評估方法和全面的評價體系以及有力的數據支撐才是評價飛行品質的關鍵。美國的Tledyne以及法國的Airbus等國外公司有效分析飛行中記錄的數據[7-8],并可以通過相關數據分析軟件給出飛行品質評估報告,提高運行安全和性能。趙新斌等[9]基于“風險為概率與嚴重度乘積”的思想,從輕、中、重、綜合等4個角度度量飛行品質,并運用快速存取記錄數據進行論證。但是僅從事件發生概率和事件嚴重度兩大要素,不考慮事故征候,不夠全面。萬健等[10]提出一種基于快速數據存取記錄器超限事件的民航飛行安全風險評價方法,但是并未考慮不安全事件和安全隱患事件對民航飛行安全的影響。汪磊等[11]基于機載快速存取記錄器數據和小波分析方法,單純的以著陸階段駕駛桿與俯仰角參數為分析對象評價航線飛行員的飛行操作水平。
由于在整個飛行過程中,起飛爬升和進近著落階段是最重要,也是最為危險的兩個階段。根據研究表明,65%的飛行事故發生在起飛爬升和進近著陸階段[3],為此將研究的重點放在起飛和著陸階段。此外,機載快速存儲記錄器(quick access recorder, QAR)記錄了大量的飛行數據,QAR數據存儲航空器在執行飛行任務時的高度、速度、航向以及飛行員各種操作量等各類重要數據信息,對飛行品質的評估提供了有力的數據支撐。
基于以上分析,為了簡便有效地對民航客機的飛行品質進行準確評估,防止危險事故征候乃至事故的發生,提高飛行品質,提升飛行安全。依據QAR記錄數據,提取起飛爬升階段和進近著陸階段的重要指標,構建主成分分析-粒子群優化算法-支持向量機(principal component analysis-particle swarm optimizatien-support vector machine, PCA-PSO-SVM)評價模型,提出機器學習的方法對飛行品質進行評估。本方法通過PCA綜合評價對QAR記錄數據進行綜合評價,并將數據按比例分類進行標記,將標記的數據輸入PSO-SVM分類模型,采用機器學習的方法對飛行品質進行評估。
參考QAR數據在飛行安全領域的相關研究[12-13]以及主成分分析-粒子群優化算法-支持向量機《波音和空客系列飛機飛行品質監控項目規范》[14],選取起飛爬升階段7個,進近著陸階段9個共計16個評價指標,如表1所示。

表1 評價指標及范圍
主成分分析(principal component analysis,PCA),是將多個變量通過線性變換以選出較少個數重要變量的一種多元統計分析方法,又稱主分量分析[15]。
PCA的主要優勢是能夠處理高維數據,分析變量之間的相關性。通過轉化變量之間的相關關系減少變量數據,實現數據壓縮,同時又能保證不損失原始數據過多的信息。既能夠達到高維數據降維目的,有效處理“維數災難”問題,又能通過少量不相關的數據進行綜合評價。此外,PCA綜合評價能夠有效克服主觀評價的缺陷,評價結果更加的客觀公正。
設有n個樣本,每個樣本有p項指標,則將原始數據寫成矩陣,即
X=(xij)n×p?(x1,x2,…,xp)
(1)
(1)通過線性歸一化或0均值歸一化將原始數據標準化。歸一化處理的目的就是消除不同量綱的影響。所謂0均值歸一化,即矩陣的每一列均值為0,方差為1,公式為
(2)
(2)建立變量的相關系數陣R,也是原始數據矩陣的協方差矩陣。相關系數表明了指標之間的相關性,相關系數矩陣計算R公式為
(3)
(3)求得相關系數矩陣的特征值λj及相應的單位特征向量aj為
aj=[a1j,a2j,…,apj]T,j=1,2,…,p
(4)
式(4)中:λ1≥λ2≥…≥λp>0。
(4)寫出主成分。

(5)
式(5)中:F1,F2,…,Fp分別表示第1,2,…,p主成分。
(5)計算主成分載荷矩陣。

(6)
主成分載荷矩陣用于說明了主成分與指標變量之間的相關聯程度,反映了該變量在主成分中的重要度。
(6)選取k個主成分。方差貢獻率表明了主成分方差在總方差中的比重,比重越大,表明這一主成分所攜帶的原始數據的信息越多。累積方差貢獻率表示主成分包含原始數據的信息量。因此,當前k個主成分的累積方差貢獻率達到85%時,表明前k個主成分基本包含了原始數據所具有的信息,能夠代表原始數據。這樣既減少了變量的個數又便于對問題的分析和研究。第k個主成分的方差貢獻率和前k個主成分的累積方差貢獻率為
(7)
(8)
式中:Var(Fk)為Fk的方差。
根據計算主成分的方差貢獻率以及累計方差貢獻率,選取k(k
F=(F1,F2,…,Fk)=X*(a1,a2,…ak)
(9)
進而,按照方差貢獻率加權求得綜合評價模型為
(10)
通過綜合評分的高低,可以對樣本數據進行比較,給出樣本數據的綜合評價。
提取某航空公司關于B737系列飛機一周的QAR記錄數據,根據監控參數控制點提取我們的指標參數。經過數據預處理,剔除異常和無效數據后,得到統一的QAR評價指標數據337條。隨機選取其中237條統計數據標準化后進行主成分分析。分析結果如表2和表3所示。

表2 特征值、方差貢獻率、累積方差貢獻率

表3 主成分載荷矩陣
由表2可以看出,第一主成分的方差貢獻率達到37.39%,前5個主成分的累積方差貢獻率已經達到89.06%,即前5個主成分已經包含了原始數據信息的89.06%,可以用前5個主成分代替原始數據。
通過表4成分載荷矩陣分析各主成分與指標變量之間的關系,前5個主成分可以充分解釋原始指標變量,第一第二主成分可以解釋11個指標,而第三第四第五主成分對第一第二主成分加以補充。
計算特征向量代入式(5),得到5個主成分,將16維數據降至5維。將標準化數據矩陣代入式(9)得到主成分得分矩陣,將主成分得分矩陣代入式(10),即可得各航班的綜合評分。將綜合評分按照從小到大的順序進行排序,即可得到個航班的綜合排名,評分越小,表明此次飛行的飛行品質越高。
從剩余的100條數據中隨機抽取10條數進行PCA綜合評價,評價結果如表4所示。將評價結果與航評結果相比較,并與6位資深飛行員進行討論,驗證了結果的可靠性。

表4 主成分綜合評價得分
為了提高評估效率,提出一種基于PCA-PSO-SVM的飛行品質評估方法。根據PCA綜合評價排名,按照2∶3∶3∶2的比例將原始數據分為優、良、中、差四類,并標上標簽作為SVM的輸入。以上述10個航班為例,標簽如表5所示。

表5 飛行品質分類標簽
支持向量機(support vector machine,SVM)是一種二分類預測模型,可以協調降低結構風險,近似實現結構風險最小化的方法。
采用“兩兩分類”的方法[16]構建如圖1所示的分類器實現SVM四分類問題,其中實線代表分類器認為輸入樣本的類別。所謂“兩兩分類”,即分別在兩類不同的樣本間構造一個分類器,將兩類樣本進行區分,實現兩兩分類。假如要將樣本分為n類,那么就需要訓練n(n-1)/2個分類器。

圖1 SVM多分類示意圖
對于線性可分的問題,SVM通過構建最優超平面,使兩類樣本與超平面之間的間隔最大化,從而區分兩類樣本。而對于非線性可分的問題,在樣本空間中很難找到甚至找不到一個可以將樣本分開的分類超平面。但是 “核函數”的引入,將原始樣本空間映射到更高維的樣本空間中就能找到這樣一個分類超平面。
假設給定一組n個樣本的訓練樣本集,S={xi,yi},yi={-1,1}(i=1,2,…,n),xi為訓練樣本,yi為樣本的類標簽。目標就是尋找一個最優超平面,即
ωTx+b=0
(11)
式(11)中:ω=(ω1,ω2,…,ωd)為法向量;b為位移項。引入核函數之后,SVM模型為
(12)
式(12)中:αi為拉格朗日乘子,解出α即可求出ω和b,得到最優分類超平面;K(xi,xj)為核函數;c為懲罰因子。
常見的核函數有線性核、多項式核、高斯核、拉普拉斯核以及Sigmoid核。根據以往的經驗,本文選取高斯核,核函數為
(13)
選定核函數后,對參數c(懲罰系數)和σ的優化直接影響分類效果,σ的大小決定支持向量的多少;c的大小決定著擬合程度。對于參數的優化通常采用網格搜索法、交叉驗證法等。本文通過確定參數范圍,以分類準確率為目標,采用隨機權重粒子群算法(random weight_particle swarm optimization, RW_PSO)進行參數尋優,并通過與其他改進粒子群算法相比較,驗證了隨機權重粒子群優化算法的優越性。
粒子群優化算法(panicle swarm optimization,PSO)是一種模擬鳥類覓食的智能優化算法[17],通過初始化最優解,不斷迭代更新逐步找到解空間中的最優位置。
考慮到隨機權重粒子群算法(RW_PSO)的優點,選用隨機權重粒子群算法優化的SVM分類器參數,并將優化結果與權重遞減、自適應權重、異步收縮因子以及原始粒子群四種算法相比較,最終驗證了隨機權重粒子群算法的優越性能。
3.2.1 粒子群算法模型
在D維空間中,存在粒子群X=(X1,X2,…,Xn),n為粒子的個數,初始化粒子的速度和位置分別為Xi=(xi1,xi2,…,xiD)T和Vi=(vi1,vi2,…,viD)T,i=1,2,…,n,i代表第i個粒子。此時,根據目標適應度函數計算出每個粒子的適應度值Pi以及群體的最佳適應度值Pg。
迭代過程中粒子之間通過信息的傳遞和粒子自身的學習,不斷更新粒子的速度和位置,最終得到群體的最優位置。在第k+1次迭代中,粒子速度和位置更新公式為
(14)
(15)
式(14)中:d=1,2,…,D表示維度;ω為慣性權重,在一般的粒子群算法中取值為1;k為迭代次數;c1和c2為學習因子,決定著粒子的自身學習能力和群體學習能力;r1和r2為0~1之間的隨機數。
3.2.2 隨機權重粒子群算法
慣性權重ω的大小決定著PSO算法的全局和局部搜索性能。當粒子接近最優位置時,減小慣性權重ω,防止粒子越過最優位置;當粒子遠離最優位置時,增大粒子的慣性權重ω,加速粒子找到最優位置,而避免陷入局部最優。
隨機權重粒子群算法[18]就恰好可能使得在接近最優位置的粒子獲得小的慣性權重,也能使陷入局部最優的粒子獲得較大的慣性權重而跳出局部最優。相較于其他粒子群算法,隨機權重更有利于跳出局部最優,找到全局最優。
在隨機權重粒子群算法中,ω計算公式為
ω=ω′+sN(0,1)
(16)
ω′=ωmin+r3(ωmax-ωmin)
(17)
式(17)中:ωmax和ωmin分別為慣性權重的最大值和最小值;s為慣性權重的方差;N(0,1)為服從正態分布的隨機數;r3為0~1的隨機數。
以PCA綜合評價的樣本數據為訓練集和測試集,選取平均分類準確率作為適應度函數,即
(18)
式(18)中:ni表示第i類樣本的準確測試個數;Ni表示第i類樣本的個數。適應度函數表示在(c,σ)參數下的平均分類準確率。
PCA-PSO-SVM模型的一般流程如下。
(1)PCA綜合評價,標記樣本數據。
(2)選取SVM核函數,確定參數范圍。
(3)初始化種群,設置慣性權重 和學習因子 和,設置種群規模和迭代次數。
(4)進行SVM訓練,選取適應度函數,計算粒子的初始適應度值和種群最佳適應度值。
(5)根據最佳適應度值更新粒子速度和位置。
(6)判斷是否達到迭代上限,達到則停止迭代,否則返回(4)繼續尋優。
PCA-PSO-SVM流程圖如圖2所示。

圖2 PCA-PSO-SVM流程圖
采集某航空公司2019年12月份一周的關于波音737系列飛機的QAR記錄數據,使用MATLAB2020a軟件進行建模分析,分析過程和結果如下。
選取237條PCA綜合評價數據用于PSO-SVM模型,并將170條數據用于訓練,67條數據用于測試。確定SVM參數范圍均為1~4。初始化PSO參數,設置種群數量為30,迭代次數為200,設置最大慣性權重為1,最小慣性權重為0.4,學習因子c1和c2分別為1.6和1.8。經過多次實驗,得到各粒子群優化算法對參數的優化結果。為比較RW_PSO-SVM與各改進PSO-SVM的分類性能,本文采用十折交叉驗證方法,對237條綜合評價數據進行SVM模型訓練,求得各模型的平均分類準確率。實驗結果如表6所示,適應度變化曲線如圖3所示。

表6 實驗結果

圖3 適應度變化曲線圖
多次實驗表明,隨機權重粒子群算法(RW_PSO)在尋優效率及尋優能力方面相比于其他4種算法優勢較大。
為進一步驗證各改進PSO-SVM的分類性能,采用十折交叉驗證,對237條綜合評價數據進行SVM模型訓練,得到各模型的分類準確率如圖4所示。通過十折交叉驗證可以看出,隨機權重粒子群優化算法(RW_PSO)優化的SVM分類模型的分類準確率高于其他PSO-SVM模型。盡管權重遞減粒子群算法在優化速度是最為優越,但其優化的參數對于SVM分類效果具有很大的波動性,且平均分類準確率也遠不如隨機權重粒子群優化的SVM分類器。

圖4 十折交叉驗證準確率分布圖
綜合考慮到模型的分類準度和模型的收斂速度,選用隨機權重粒子群優化算法優化的SVM模型對100條QAR數據進行分類預測,評估結果如圖5所示。

圖5 樣本分類評估圖
根據對100條數據的評估,得出評估準確率為90%。對于第四類樣本數據的預測準確率為94.1%,而本文中的主要分類目的就是將第四類樣本分類出來。
綜上所述,基于隨機權重粒子群算法對SVM參數優化具有良好的需有能力,PCA-RW_PSO-SVM評價模型,對于飛行品質的分類具有良好的分類性能,可以有效提高飛行品質評估效率。
結合起飛爬升和進近著陸階段的飛行特點,提取共計16個評價指標,提出了一種客觀的基于PCA-RW_PSO-SVM的飛行品質評價模型。通過實驗分析和驗證得出如下結論。
(1)采用PCA綜合評價方法,依據QAR記錄數據對飛行品質進行評估,克服了以往人為主觀因素所帶來的影響,能夠客觀有效地對飛行品質進行評估,評估結果準確。
(2)隨機權重粒子群優化算法在非線性支持向量機參數尋優方面性能優越,全局尋有能力較強,通過隨機權重粒子群優化的SVM分類準確率更高。
(3)基于PCA-RW_PSO-SVM的飛行品質評價模型能夠高效準確地對飛行品質進行分類評估,提高了評估效率,可為飛行講評提供便利和參考。
盡管記錄數據都是在飛行安全的基礎上所采集的,但是此方法能夠有效識別出飛行品質較差的飛行任務,對防止“海因里希事故法則”,預防飛行事故的發生具有重要意義。由于只針對起飛和著陸階段進行評估,研究還有待進一步深入,在今后的研究中將考慮更多的影響因素,豐富評價指標體系,提高評估的可靠性和全面性。