張兆寧, 查子奇
(中國民航大學空中交通管理學院, 天津 300300)
盡管中國多機場系統的運行模式已經不斷完善,但航班延誤仍然是一個普遍存在的問題,會給航空公司帶來經濟損失、降低旅客滿意度,并影響多機場系統內各機場的運行效率和服務水平。因此,準確預測航班延誤至關重要,這不僅有助于機場、管制單位和航空公司有效應對延誤問題,還可以為定制后續優化措施提供依據。
近年來,中外學者對航班延誤預測的研究已取得了一定的成果。Belcastro等[1]使用可擴展數據挖掘技術,考慮了航班信息和天氣情況,使用并行算法預測航班延誤。Yi等[2]選擇合成少數類過采樣技術(synthetic minority oversampling technique,SMOTE)處理不平衡數據集,利用Boruta算法進行特征選擇,基于Stacking算法對航班延誤進行分類預測。Güvercin等[3]提出“集群機場建模”(cluster airport model,CAM)方法,為每個機場擬合一個通用延誤預測模型。Aljubairy 等[4]考慮了物聯網數據中的未考慮的分布式傳感器生成的信息,并開發合并不同數據源特征的算法,驗證航班延誤與空氣質量指數之間的關聯。Wang等[5]從戰略階段的角度預測航班延誤,提出了一種機器學習方法,并開發3個評估算法性能的指標。Yazdi等[6]應用Levenberg-Marquart算法查找權重并偏置適當的值,并使用機器學習技術對航班延誤進行預測。Qu等[7]利用飛行數據和氣象數據的特點,提出了基于氣象數據融合的深度卷積神經網絡模型。谷潤平等[8]采用數據統計方法,結合時空特征探索航班延誤分布規律,并構建了灰色GA-BP多維航班延誤估計模型。張兆寧等[9]從空中交通網絡流系統角度出發,利用遺傳算法優化BP神經網絡,建立了擁堵預測模型。劉博等[10]基于SMOTE算法和條件生成對抗網絡(conditional adversarial nets,CGAN),提出了一種航班延誤預測模型,用于更準確地預測到港航班延誤情況。丁建立等[11]為提升預測性能,提出一種基于輕量級梯度提升機(light gradient boosting machine,LightGBM)的航班延誤多分類預測模型。屈景怡等[12]為充分利用數據集包含的時間和空間信息,提出了一種綜合考慮時空序列的卷積長短時記憶(convolutional long short-term memory,Conv-LSTM)網絡航班延誤預測模型。
綜上可知,中外學者對單個機場的航班延誤進行預測,但是鮮少有人以多機場系統航班為研究對象,進行延誤預測。且當前航班延誤預測方法,主要是考慮天氣特征、航班信息特征對延誤的影響來進行預測,對于多機場終端區交通態勢對航班延誤的影響考慮較少。
鑒于此,考慮多機場終端區交通態勢對航班延誤的影響來進行航班延誤的預測。通過分析多機場終端區交通態勢,建立能夠描述多機場終端區交通態勢的指標。并采用反向傳播(back propagation,BP)神經網絡對多機場航班延誤時間進行預測,將終端區交通態勢指標、航班信息、天氣環境數據等作為輸入層,航班延誤時間作為輸出層。針對BP神經網絡全局收斂速度緩慢、易出現局部極小值等情況,使用粒子群算法對BP神經網絡模型進行了優化。最后以京津多機場終端區為研究對象,使用粒子群優化的BP神經網絡預測模型進行航班延誤預測,最后進行對比分析,證明了該模型的合理性和有效性。通過建立終端區交通態勢指標和采用先進的神經網絡和優化算法,該研究為提高航班延誤預測的準確性和可靠性提供新的方法和理論支持。
“交通態勢”[13]通常指某一地區或區域內的交通情況和交通流動的現狀、情況、趨勢和特征。對于多機場終端區而言,終端區交通態勢[14-16]是終端區內空中交通活動的一種宏觀表述,目前尚沒有統一的定義,將多機場終端區交通態勢定義為:終端區內航空器數量、運行狀況、相互關系、運動趨勢以及所屬資源的數量、分布和流動性等特征的綜合表現。
多機場終端區的交通態勢變化會影響整個多機場系統內的航班。共用航線和航路點等空間資源可能導致航班延誤在一個機場發生時會波及其他機場,從而影響整個多機場的航班正常運行。因此,了解終端區交通態勢及其運行特征可以幫助準確預測航班延誤,從而更好地應對航班延誤情況。
在多機場終端區中,終端區空域、機場、跑道、進離場點及進離場程序等固態資源,對終端區交通態勢的影響相對穩定。而終端區內的航空器屬于動態資源,航空器的交通活動形成了不同方向和流量的交通流,這些交通流可以被視為態勢中的事件。不同交通流具有不同屬性和形成條件,對終端區交通態勢的影響不同。因此,通過對不同態勢下交通流的流量、流向、分布狀態等屬性進行描述,可以很好地反映終端區交通態勢。
為科學準確地對多機場終端區交通態勢進行刻畫,并為航班延誤預測提供數據源,從態勢影響程度較大的交通流入手,分析每架航空器運行過程中的終端區交通流分布情況和航路節點的擁塞情況等特征參數,以此為基礎建立6個適用于描述整個多機場終端區交通態勢的指標。
(1)跑道排隊長度指數。跑道排隊長度是指目標航空器從跑道上開始滑行或前輪剛剛觸地時,在等待區等待起飛或者等待降落的航空器數量。
(2)進離場航線排隊長度指數。進離場航線排隊長度是指目標航空器從跑道上開始滑行或前輪剛剛觸地時,處于終端區進離場航線上的航空器數量。
(3)走廊口排隊長度指數。走廊口排隊長度是指目標航空器從跑道上開始滑行或前輪剛剛觸地時,多機場終端區走廊口處盤旋航空器的數量。
(4)終端區瞬時流量指數。終端區瞬時流量指數是指目標航空器從跑道上開始滑行或前輪剛剛觸地時,多機場終端區內所有正在運行的航空器數量。
(5)終端區累計流量指數。終端區累計流量指數是指目標航空器從跑道口到終端區進出口點的運行過程中,已經飛離多機場終端區或已經完成降落的和正在終端區內運行的航空器數量。
(6)終端區飽和度。在數值上,它是流量與容量的比值。其中,容量是指單位時間內通過終端區航空器的最大架次。流量是單位時間內通過終端區航空器的架次。
為了討論多機場終端區交通態勢對航班延誤預測準確性的影響,將多機場終端區交通態勢指標計算得到具體的數值作為交通態勢數據,輸入到航班延誤預測模型中。
為了對多機場航班延誤進行預測,首先對多機場系統的數據進行采集和預處理。其次構建了基于粒子群優化的BP神經網絡預測模型,相較于BP神經網絡,PSO算法能夠在更大的空間內搜尋可以大概率防止神經網絡陷于局部最優解的局限性。
針對航班延誤預測,常用的數據源包括航班信息數據和天氣數據,為了增強預測模型的綜合性能,整合多個數據源來預測航班的延誤,主要包括航班數據、天氣數據和交通態勢數據。
2.1.1 數據采集
航班數據取自飛常準航班數據分析平臺,選取的數據為北京終端區內首都機場、大興機場和天津機場2019全年的歷史航班數據,氣象數據來源于氣象局網站,選取的數據為該多機場終端區2019年全年的氣象數據, 交通態勢數據通過上文確立的多機場終端區交通態勢指標計算得到。
航班數據A可表示為A={ai1,ai2,…,aij},其中aij為第i個航班的第j個航班特征,主要包括時間信息、機場信息、航班信息與延誤信息等共21個特征。
天氣數據C可表示為C={ci1,ci2,ci3,…,cil},cil表示第i個航班的第l個天氣特征主要內容包括時間、位置、天氣狀況、濕度、溫度、風速、風向等25個特征。
交通態勢數據S可表示為S={si1,si2,…,sim},其中simj表示第i個航班的第m個終端區交通態勢特征,主要包括排隊長度指數、流量指數等6個特征。
2.1.2 數據預處理
為保證航班延誤預測的準確性,首先對選取的實驗數據進行預處理,對維度較大、不完整、有噪音的數據信息進行初步過濾和降維處理,主要包括特征選擇、數據缺失值處理、特征融合、數據編碼。
(1)特征選擇。在所選取的航班數據、氣象數據、交通態勢數據中并不是所有的特征都對航班延誤存在影響關系,對實驗數據特征進行了篩選,消除了重復和冗余的特征,最終篩選出的特征如表1所示。

表1 特征選擇結果Table 1 Feature selection results
(2)缺失值處理。通過對數據集的檢查,發現特征缺失數據和異常數據在整體數據中只占一小部分,故采用直接刪除的方式進行處理。
(3)數據融合。將特征篩選和缺失值處理后的數據與每一架航班進行對應融合,航班數據A、天氣數據C、對應相同日期進行數據融合,交通數據S對應相同航班號融合到上面的數據中,最終得到完整的航班延誤預測實驗數據。
(4)數據編碼:對于歷史航班數據存在的航班號,出發機場,到達機場,航空公司等信息,屬于離散變量,采用one-hot編碼,將每個特征的每個取值都表示成一個二進制向量。例如,將航班號編碼為長度為N的二進制向量,其中第i個位置表示航班號是否為第i個可能的取值。對于天氣信息、交通信息屬于連續變量,采用數值編碼,將每個特征的數值直接編碼為實數,如將溫度編碼為實數,表示溫度的絕對值。
2.2.1 BP神經網絡
BP神經網絡是一種自組織、自學習的多節點前饋神經網絡,具有誤差反向傳播,主要包括輸入層、隱藏層和輸出層。輸入層,該層的數據通常是過程變量。隱藏層是中間的特征信息提取層,通過連接權重連接網絡。輸出層,需要獲取該層的數據或預測目標數據[17]。其工作流程首先是輸入信號的前向傳播,即誤差輸出的計算是從輸入到輸出,然后是誤差的向后傳播,即權重和偏差的調整是從輸出到輸入。迭代學習用于調整連接權重和閾值的偏差,使誤差沿梯度方向減小,從而確定網絡的各種參數以滿足最小誤差。
2.2.2 BP神經網絡參數選取
在多機場航班延誤預測中,選擇合適的輸入層參數、隱藏層節點數以及適當的模型參數進行預測至關重要。考慮多機場終端區交通態勢對航班運行的影響,將交通態勢數據S、航班數據A、天氣數據C這三類數據視為模型的輸入,航班延誤時間作為模型的輸出,網絡結構如圖1所示。網絡的隱藏層實現了復雜的非線性映射關系,使用sigmoid激活函數作為隱藏層的傳遞函數,以實現輸入層和輸出層之間的非線性映射[18],其計算公式如式(1)所示。隱藏層數設置為1,節點數計算公式如式(2)所示。
(1)

圖1 BP神經網絡結構圖Fig.1 BP neural network structure diagram
(2)
式(2)中:k為隱藏層節點數;λ為輸入層節點個數;β為輸出層節點數;α為[1,10]的常數且取整數。
2.2.3 PSO算法優化BP神經網絡
粒子群優化算法(particle swarm optimization algorithm,PSO)是一種隨機全局搜索算法,它通過對鳥群在覓食過程中的遷徙和聚集行為的模擬以及群體活動規律的抽象建模來實現。PSO算法包含多個解決問題的粒子,每個粒子根據適應度函數不斷更新自身位置和速度,并與其他粒子共享信息和協同進化,搜尋整個空間來找到全局最優解。
BP神經網絡算法是基于誤差函數梯度下降的單點搜索方法,缺乏全局搜索能力。因此,在學習和訓練過程中,它可能面臨魯棒性差、收斂速度慢、泛化能力差等問題。相比之下,PSO算法具有結構簡單、搜索范圍廣、魯棒性強、收斂速度快等優點,能夠尋找大多數全局最優解[19]。為了充分發揮兩者的優點,提出基于PSO優化BP神經網絡的多機場航班延誤預測模型。該模型的核心思想是PSO算法利用其出色的全局搜索能力,不斷更新粒子的速度和位置,以找到最合適的連接權重和閾值。PSO-BP神經網絡預測模型的構建流程如圖2所示。

圖2 PSO-BP優化流程圖Fig.2 PSO-BP optimization flow chart
多機場航班延誤預測具體實現步驟如下。
步驟1構建單隱藏層的BP神經網絡,選擇數據樣本的前80%作為訓練集,將航班數據A、天氣數據C、交通態勢數據S中共26個特征作為輸入層節點,航班延誤時間作為輸出層節點,并按式(2)選取隱藏層節點數。
步驟2初始化粒子群和神經網絡權值,首先需要初始化神經網絡的權值和偏置,并設置粒子群的初始位置和速度。使用高斯分布在[-0.1,0.1]隨機生成初始權值w′,在[-0.5,0.5]隨機生成初始偏置b,最后,將所有的權值和偏置連接起來形成1個向量X0=[w′,b],則粒子群的初始位置X0,particle=X0+隨機擾動,隨機擾動是一個隨機生成的向量,用于在生成初始位置時增加一些隨機性,使得粒子群的初始位置更加多樣化,并將粒子群初始速度設為0.01,以控制粒子在搜索空間中的移動步幅。
步驟3計算適應度函數,將粒子群的位置映射到神經網絡的權值上,計算神經網絡的適應度函數,以平均絕對誤差(mean absolute error,MAE)作為適應度函數。
(3)
步驟4更新全局最優位置和個體最優位置,根據適應度函數的值,更新全局最優位置和每個粒子的個體最優位置。全局最優位置是粒子群中適應度函數值最小的位置,而個體最優位置是每個粒子自己歷史上適應度函數值最小的位置。
步驟5更新粒子速度和位置,根據全局最優位置和個體最優位置,更新每個粒子的速度和位置。具體的更新公式為
vid(t+1)=wvid(t)+c1r1[pbestid-xid(t)]+c2r2(gbestd-xid(t)]
(4)
xid(t+1)=xid(t)+vid(t+1)
(5)
式中:vid(t)、vid(t+1)、xid(t)、xid(t+1)分別為粒子i在t代和t+1代的速度和位置;pbsetid為個體最優位置;gbestid為全局最優位置;w為慣性權重;c1和c2為學習因子;r1和r2為在[0,1]均勻分布的隨機數。
步驟6反向傳播更新權值和偏置,將每個粒子的位置映射到神經網絡的權值上,使用反向傳播算法來更新神經網絡的權值和偏置。
步驟7檢驗停止條件,判斷算法是否滿足誤差達到一定精度的停止條件。
步驟8循環執行步驟3~步驟7,直到算法滿足停止條件。最后采用數據樣本的后20%作為測試樣本來檢驗訓練后的神經網絡模型,輸出測試結果。
采用MAE、決定系數R2和延誤預測準確率P對PSO-BP神經網絡模型的性能和預測精度進行評價。MAE為預測值與真實值之間的絕對值誤差的平均值,MAE越小,表示模型的預測值和實際觀測值之間的誤差越小,模型的預測能力越好。R2是一個用于評估預測模型擬合程度的指標,它表示模型可以解釋目標變量方差的比例,決定系數的取值范圍在 0~1,R2越接近 1,表示模型能夠解釋更多的目標變量方差,預測結果更為準確;反之,R2越接近 0,則表示模型解釋目標變量方差的能力很弱,預測結果不可靠。準確率P是指預測準確的樣本數占總樣本的比值。R2和P的計算公式分別為
(6)

(7)
式(7)中:P為延誤預測準確率;N為預測總樣本數量;NP為預測準確樣本數量。
隨著大興機場的投入運營,京津地區兩地三場的終端區運營模式逐漸成為具有代表性的多機場終端區空域系統。以天津、北京兩地三場為研究對象,選取2019年北京首都國際機場、北京大興國際機場和天津濱海國際機場的歷史航班數據和天氣數據,并考慮了終端區交通態勢對航班延誤的影響,確立終端區交通態勢指標,計算得到終端區交通態勢數據,數據集共包含樣本632 742條,選取數據的80%作為訓練集,剩余的20%作為測試集,最后采用PSO-BP神經網絡模型對多機場航班延誤進行預測。
使用 MATLAB進行計算,此次預測模型網絡結構層次為3層,將選取的26個特征作為輸入層節點,將延誤值作為輸出層節點,根據式(1)可知,隱藏層節點的取值范圍在[7,15],經過相關測試可知,隱藏層節點計算式(2)中常數α取值為5,隱藏層節點數k=10時模型效果最優,訓練次數設為為1 000次,訓練精度達到 0.001,學習率為 0.1。最大迭代次數Tmax=100、種群規模n=30、學習因子c1、c2均為1.5、慣性權重w=0.8。
經過多次迭代,粒子群算法能夠逐漸增強種群個體的適應能力,根據圖3的數據顯示,種群在經過約70代進化后,粒子的適應度已經趨于穩定。PSO-BP預測模型的預測結果如圖4和圖5所示,各項最優指標R2=0.902,MAE=4.263,P=92.31%,延誤預測結果基本接近于真實值。

圖3 進化代數Fig.3 Evolutionary algebra

圖4 PSO-BP預測誤差Fig.4 PSO-BP prediction error

圖5 PSO-BP預測值與真實值對比Fig.5 Comparison of PSO-BP predicted value and true value
為了討論多機場終端區交通態勢特征對航班延誤預測的影響,采用PSO-BP模型,采用不包含交通態勢特征的數據重新對航班延誤進行預測,將得到的預測結果進行對比,對比結果如圖6和表2所示。

圖6 交通態勢特征影響誤差對比Fig.6 Comparison of influence error of traffic situation characteristics

表2 交通特征對預測精度的影響對比Table 2 Comparison of the influence of traffic characteristics on prediction accuracy
考慮多機場終端區交通態勢的PSO-BP預測模型,R2、MAE和P這3個評價指標值均比一般PSO-BP模型要好,且預測準確率提高了29.61%。證明了在對多機場系統內的航班延誤預測的過程中,考慮終端區交通態勢十分有必要。
為了進一步評估PSO-BP模型的性能和預測效果,采用相同的實驗數據集,并使用相同的模型參數,分別采用GA-BP網絡和BP網絡模型進行了延誤預測并通過確定的評價指標對該延誤預測模型的模擬和驗證結果進行評價和對比。具體評價結果如表3所示。

表3 不同模型預測性能對比Table 3 Comparison of prediction performance of different models
根據不同模型的對比結果(表3)可知,PSO-BP模型較普通BP模型和GA-BP模型,PSO-BP模型的R2最高,為0.902最接近于1;MAE最小,為4.363;準確率最高為92.31%,較另外兩個模型預測準確率分別提高了41.96%和24.7%。通過3個評價指標的對比,PSO-BP的預測性能均為最優,證明采用PSO-BP模型對多機場航班延誤預測的優越性。
針對多機場航班延誤預測,考慮多機場終端區交通態勢對航班延誤的影響,使用PSO-BP神經網絡模型對航班延誤進行預測,通過實例分析證明方法的有效性,得到以下結論。
(1)在預測過程中考慮多機場終端區交通態勢對航班延誤的影響,建立終端區交通態勢指標集,將計算得到的終端區交通態勢數據與航班和天氣等數據結合,輸入模型中進行訓練與測試,實例證明,考慮終端區交通態勢后,航班延誤預測準確率有所提高。
(2)基于粒子群算法優化BP神經網絡建立了多機場航班延誤預測模型,采用MAE、R2和準確率P對模型的性能和預測精度進行評價。通過實例分析和與其他模型的對比,證明考慮終端區交通態勢的必要性和該預測模型的優越性。
(3)只考慮多機場終端區交通態勢對航班延誤的影響,未來可考慮整個多機場系統的交通態勢,進一步豐富交通態勢指標,使實驗數據集更加豐富全面,以獲得更高的預測準確率。