陳寬明, 王楚皓, 夏正洪
(中國民用航空飛行學院空中交通管理學院, 廣漢 618307)
一次完整的飛行過程由起飛前滑行、起飛、爬升、巡航、下降、進近著陸、降落后滑行7個階段組成,航空器在機場場面的運行過程往往被認為是影響飛行效率的關鍵環節。隨著民航交通流量的持續快速增長,大型機場的跑滑系統越來越復雜,航班地面滑行的時間已經超過25 min,嚴重制約著機場場面運行效率的提升,并伴隨有滑行沖突、延誤等問題。航空器滑出時間是指航班的實際起飛時刻與推出開車時刻的時間間隔,它是衡量大型繁忙機場場面運行效率的重要指標。因此,科學準確地預測航空器滑出時間,對于提升機場場面運行效率有重要意義。
外國關于滑出時間預測的研究始于21世紀初,基于起飛隊列長度、跑道、機型等因素構建了滑出時間的多元線性回歸預測模型,±5 min范圍內的預測精度不足70%。現有研究成果主要包括基于仿真模擬和數學建模。仿真模擬通常需要考慮機場的跑道、滑行道構型和滑行沖突種類及解脫方法,同時對進/離港航空器的場面運行過程進行仿真,從而得到離港航空器的滑出時間預測結果。其中比較典型的是Lee等[1]建立的滑出時間快速仿真預測模型,±5 min范圍內的預測精度約為75%。歷史數據往往可以揭示大型機場場面的滑行規律,反映出滑出時間與其影響因素之間的相關性。因此,基于數學建模的方法[2]主要有線性回歸、BP(back propagation)神經網絡、支持向量機、深度學習等,并且通過訓練集、驗證集和測試集的劃分來驗證數學方法對于滑出時間預測的準確率。George等[3]基于航班歷史數據對航空器的滑出時間進行了動態預測,提出了基于強化學習的Q-Learning方法。Gu等[4]提出了基于梯度提升回歸樹(gradient boosting regression tree,GBRT)預測滑行時間。 Yin等[5]從宏觀網絡角度預測航空器滑出時間。
中國滑出時間預測相關研究起步較晚。2016年,馮霞等[6]首次基于排隊論構建了中國單跑道機場的滑出時間預測模型,±5 min內的準確率僅為79%。現有研究成果主要分成兩個方向:一是采用不同的算法來對滑出時間進行預測,主要包括支持向量機(support vector machine,SVM)[7]、貝葉斯網絡[8]、深度學習[9]、BP神經網絡[10]等,旨在提升預測精度。Li等[11]運用多種深度學習的算法來預測航空器滑出時間,±5 min內的準確率可達到90%。二是基于滑出時間的預測結果來對航空器的推出策略進行優化,從而減少推出等待過程中的燃油消耗和污染排放。Lian等[12]提出了基于滑出時間預測的動態推出控制策略。
綜上所述,現有研究成果以單跑道機場為研究對象,分析了可量化的因素對滑出時間的影響。由于缺乏對機場場面運行態勢的深入分析,從而導致影響因素的量化發生偏差,預測結果存在較大差異,并且缺乏討論多跑道機場的起飛使用跑道對滑出時間的影響。鑒于此,分析進/離港航空器場面滑行的時空分布特征,準確定義同時段滑行的進/離港航空器數量、起飛隊列長度、30 min平均滑出時間,并將使用跑道進行數值映射(量化),采用3種機器學習方法對滑出時間進行預測,以期獲得更準確的滑出時間預測結果,為航空器的推出控制策略提供數據參考。
機場場面交通流是影響大型樞紐機場航空器滑出時間的主要因素。離港航空器在機場場面的滑行過程中,常與其他航空器一起爭奪跑道、滑行道資源,有時甚至會因為等待而造成滑出時間的增加,即航空器的滑入滑出過程在時空上是相互耦合、相互依存,會形成較為復雜的機場場面運行態勢,如圖1、圖2所示。

runway為跑道;gate為停機位;time為時間;toff-block為推出時間;ttake-off為起飛時間圖1 離港航空器之間的時空關系Fig.1 Space-time relationship between departure flights

toff-block為推出時間;tland為落地時間;tin-block為滑入時間;ttake-off為起飛時間圖2 進港航空器與離港航空器的時空關系Fig.2 Space-time relationship between inbound flights and outbound flights
圖1中,d0為待研究的離港航空器i,其推出開車時間(actual off-block time,AOBT)和起飛時間(actual take-off time,ATOT)分別為AOBTi和ATOTi。d1、d2、d3、d4分別為與d0有時空交集的4種離港航空器,即任意一種離港航空器都可影響d0的滑出時間。
d1為航空器j“推出早、起飛早”,其推出開車時間和起飛時間分別為AOBTj和ATOTj,與航空器i的推出開車時間和起飛時間的關系可表示為
d1,{AOBTj (1) d2為航空器j“推出早、起飛晚”,與航空器i的推出開車時間和起飛時間的關系可表示為 d2,{AOBTj (2) d3為航空器j“推出晚、起飛早”,與航空器i的推出開車時間和起飛時間的關系可表示為 d3,{ATOTj (3) d4為航空器j“推出晚、起飛晚”,與航空器i的推出開車時間和起飛時間的關系可表示為 d4,{AOBTj (4) 圖2中,d0為待研究的離港航空器i,a1、a2、a3、a4分別為與d0有時空交集的4種進港航空器,即任意一種進港航空器都可影響d0的滑出時間。 a1為航空器j“落地早、進位早”,其落地時間(actual landing time,ALDT)和滑入時間(actual in-off block time,AIBT)分別為ALDTj和AIBTj,與航空器i的推出開車時間和起飛時間的關系可表示為 a1,{ALDTj AOBTi} (5) a2為航空器j“落地早、進位晚”,與航空器i的推出開車時間和起飛時間的關系可表示為 a2,{ALDTj (6) a3為航空器j“落地晚、進位早”,與航空器i的推出開車時間和起飛時間的關系可表示為 a3,{AOBTi AIBTj (7) a4為航空器j“落地晚、進位晚”,與航空器i的推出開車時間和起飛時間的關系可表示為 a4,{AOBTi ATOTi} (8) 通過文獻追蹤可知,現有研究的某些滑出時間影響因素參量表達不太準確,導致預測結果的精度不高。因此,基于機場場面運行態勢分析進/離港航空器滑行的時空分布特征,力求將這些可量化的影響因素描述的更為準確。同時,滑出時間還受到流量控制、惡劣天氣、起飛使用跑道、機型等不可量化因素的影響。 (1)x1為同時段滑行的離港航空器數量,即與待研究對象d0有時空交集關系的所有離港航空器,單位:架次,可表示為 x1=d1+d2+d3+d4 (9) (2)x2為同時段滑行的進港航空器數量,即與待研究對象d0有時空交集關系的所有進港航空器,單位:架次,可表示為 x2=a1+a2+a3+a4 (10) (3)x3為起飛列隊長度,即與待研究對象d0有時空交集關系且起飛時間更早的所有離港航空器,單位:架次,其表達式如式(11)所示。起飛隊列越長,則航空器從跑到外等待至起飛所需的時間就會越長。 x3=d1+d3 (11) (4)x4為30 min平均滑出時間,單位:s,其表達式如式(12)所示。場面滑行的航班越多,則單個離港航空器的滑出時間和30 min平均滑出時間就會越長。 (12) 式(12)中:ti為第i架離港航空器的滑出時間;n為30 min中滑出的離港航空器數量。 (5)x5為離港航空器滑行距離,單位:m,其表達式為 (13) 式(13)中:da,i為航班i滑行路徑的測量長度;db為跑道的測量長度;3 600為以米為單位的跑道長度。 (6)x6為離港航空器起飛使用的跑道。起飛跑道的選擇與該機場的地面運行模式直接相關,對于同一停機位的離港航空器使用不同的起飛跑道,滑行路線以及滑行距離是不同的,滑行所需時間也會不同。但是,由于跑道號不能直接運用于滑出時間預測,可根據其使用跑道的4個方向,使用1~4將其進行量化。 所用數據來源于中南某樞紐機場2018年8月6日—8月19日共計2周的實際運行數據,數據集共有記錄12 103條,包含離港航班6 032架次和進港航班6 071架次;每條記錄由飛機呼號、機型、實際起飛時間、實際撤輪檔時間、實際落地時間、跑道號、停機位等關鍵信息組成。通過對數據整理,刪除重復及異常數據,并根據式(9)~式(13)依次得到同時段滑行的離港航空器數量,同時段滑行的進港航空器數量,起飛隊列長度,30 min平均滑出時間,滑行距離,起飛所用跑道以及實際滑出時間,并使用Minitab軟件對其進行相關性分析,如表1所示。 表1 滑出時間影響因素相關性分析結果Table 1 Correlation analysis results of influencing factors of taxi-out time 根據相關性系數可知,滑出時間影響因素相關性排序為:起飛隊列長度、同時段起飛航空器數量、半小時平均滑出時間、同時段落地航空器數量、起飛所用跑道、滑出距離。其中,顯著相關的有起飛隊列長度、同時段起飛航空器數量和半小時平均滑出時間(相關系數≥0.6);中度相關的有同時段落地航空器數量(0.6>相關系數≥0.3);弱相關的有使用跑道和滑出距離(相關系數<0.3)。 機器學習是一門多領域交叉學科,算法可基于大型數據集進行訓練獲得模型和相關性,根據數據分析結果做出最佳決策和預測。常用的機器學習算法有邏輯回歸(logistic regression, LR)、樸素貝葉斯(naive bayes, NB)、K近鄰法(K-nearest neighbors, KNN)、決策樹(decision tree, DT)、隨機森林、支持向量機、人工神經網絡(artificial neural network, ANN)等。選用RF、SVM、BP神經網絡對離港航空器的滑出時間進行預測,算法流程如圖3所示。 圖3 基于機器學習的滑出時間預測流程Fig.3 Taxi-out time prediction process based on machine learning Step 1數據準備。原始數據的數量和質量直接決定預測模型輸出結果的好壞。將收集的原始數據進行去重復、錯誤修正以及標準化處理。 Step 2相關性分析。對收集的數據進行分析,找出每列數據的最大值、最小值、平均值、方差、中位數等信息;同時確定自變量和因變量,并計算相關系數。 Step 3特征選取。特征的好壞基本上決定了分類器的效果,基于相關性分析結果對自變量進行篩選,選擇更合適的特征。 Step 4歸一化處理。對特征提取結果進行再加工,增強特征表示能力,防止模型過于復雜和學習困難。 Step 5劃分數據集。通常需要將數據劃分為訓練集和測試集,訓練集數據用來訓練模型,測試集用于模型的評估。 Step 6模型訓練。選定合適的算法如隨機森林、支持向量機、BP神經網絡作為分類器,使用訓練集數據對其進行訓練,以最小誤差作為目標函數得到穩定的分類器。 Step 7模型評估。將測試集數據導入到訓練好的分類器中得到預測值,再與真實數據進行對比,從而判定模型的好壞。 通過對樣本數據進行分析,15號跑道起飛的航班架次占比高達91.6%,且平均滑出時間僅為948 s,為該機場的主起跑道。16號跑道起飛的航班架次為4.6%,在離港高峰時可以使用該跑道進行獨立平行離場,平均滑出時間1 092 s,如表2所示。當風向發生改變時(東南風的順風分量超過5 m/s),可使用33號跑道起飛,平均滑出時間為1 339 s; 34號跑道幾乎不用于起飛。可見,離港航班使用不同的跑道起飛,平均滑出時間差異較大。因此,本文將起飛跑道作為滑出時間的一個影響因素,15號跑道對應的數據標識為1,以此類推。 表2 不同跑道的滑出時間分析Table 2 Analysis of taxi-out time of different runways 為討論跑道使用對滑出時間的影響,基于相關性分析結論進行特征選取,構建了兩種離港航空器滑出時間預測模型,如表3所示。 表3 滑出時間預測模型Table 3 Taxi-out time prediction model 以平均絕對誤差百分比(mean average percentage error,MAPE)、平均絕對誤差(mean absolute error,MAE)、均方根誤差(root mean square error,RMSE),以及±1、±3、±5 min的誤差來評價基于機器學習的離港航空器滑出時間預測精度,計算公式分別為 (14) (15) (16) 式中:n為待預測的離港航空器數量;pi為離港航空器i的可變滑出時間預測值;oi為離港航空器i滑出時間的真實值。 研究對象為中國中南某樞紐機場,該機場東跑道3 400×45 m,西跑道3 800×60 m,東西跑道之間間距約為1 590 m,離港航空器可以選擇從15、16、33、34號跑道起飛。通過對該機場2018年8月2周的數據進行整理,刪除重復及異常數據,最終得到樣本數據5 900條,如表4所示。 表4 整理后的樣本數據集Table 4 Sorted sample data set 將所有樣本數據導入MATLAB中并隨機打亂順序,選擇前5 700個數據為訓練集,后200個數據作為測試集,并將其進行歸一化處理。設置隨機森林中決策樹的數量為100,樹的特征個數為34,最大深度為10。設置支持向量機的懲罰系數C為3,Gamma為1.5。設置BP神經網絡最大迭代次數1 000次,學習率為0.01,目標收斂誤差為0.001。用訓練集數據訓練3種算法的分類器,然后將測試集數據代入訓練好的分類器中進行預測,并將結果進行反歸一化,得到預測結果和評估結果,如表5、圖4所示。 表5 滑出時間預測結果誤差分布對比Table 5 Comparison of error distribution of taxi-out time prediction results 圖4 滑出時間預測結果Fig.4 Taxi-out time prediction results 從表5、圖4所示的預測值對真實值的擬合程度來看,3種算法均能完成對離港航班滑出時間的有效預測,且SVM分類器的預測結果效果最好,其次是BP神經網絡和RF。模型1的曲線擬合優化程度R2均大于模型2,采用SVM分類器時擬合優度分別為0.871 1、0.863 9,證明了不相關的因素引入模型后會導致預測結果的擬合程度降低。 根據模型評估標準,3種機器學習均可有效地預測離港航空器的滑出時間,其分類器的優劣排序為SVM、BP神經網絡、RF。模型1的預測效果整體優于模型2,說明引入弱相關性的特征(使用跑道、滑行距離)后,模型的預測準確率會有一定程度的降低;同時,預測結果的平均絕對百分比誤差、平均絕對誤差、均方根誤差均有增加。根據現有民航航班延誤定義標準,航班實際撤輪擋時間超過計劃時間15 min的情況為航班出港延誤。為保障航班的正常運行,在合理的時間余度內選擇±60、±180、±300 s進行測評。基于SVM分類器的離港航空器滑出時間預測效果最佳(模型1),誤差在±60、±180、±300 s的準確率分別為32%、75%、95%,MAPE、MAE、RMSE分別為14.66%,128.39 s,164.63 s。 (1)分析了進/離港航空器在機場場面運行的時空分布特征,準確定義并量化了滑出時間影響因素。 (2)對滑出時間影響因素進行了相關性分析,顯著相關的有起飛隊列長度、同時段起飛航空器數量和半小時平均滑出時間;中度相關的有同時段落地航空器數量;弱相關的有使用跑道和滑出距離。 (3)構建了基于機器學習的航空器滑出時間預測模型,通過對比分析可知,SVM分類器對本文數據的適應度最佳,其次是BP神經網絡和RF。 (4)下一步的研究工作將討論惡劣天氣對滑出時間的影響。1.2 滑出時間影響因素
1.3 相關性分析

2 基于機器學習的離港航空器滑出時間預測
2.1 機器學習算法及步驟

2.2 模型構建


2.3 模型評估
3 滑出時間預測典型實例
3.1 數據準備

3.2 預測結果


4 結論