999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于SMOTE算法的航班正常率預測

2025-07-17 00:00:00張嘉懿胡明華黃梵根
華東交通大學學報 2025年3期
關鍵詞:模型

中圖分類號:[U8];U111 文獻標志碼:A本文引用格式:.基于SMOTE算法的航班正常率預測[J].華東交通大學學報,2025,42(3):57-66.

Flight Punctuality Rate Prediction Based on SMOTE Algorithm

Zhang Jiayil2,Hu Minghua’,Huang Fangen2

(1.CollegeofCivilAviation,Nanjing UniversityofAeronauticsandAstronautics,Nanjing 2106,China; 2.Air TrafficManagementBureau ofCAAC,Beijing10o022,China)

Abstract: To achieve accurate prediction of the flight punctualityrate,a flight regularity prediction index system was constructed based on data statistics of flight delay reasons,includeing departure airport,destination airport, flow control information,and route characteristics.It proposes a SMOTE algorithm-based XGBoost classification predictionmodel (SM-XGBoost model) and a SMOTE algorithm-based LightGBMclassification prediction model(SM-LightGBMmodel).Basedon the actual data of major airports inEast China,the validityand progressiveness of the proposed model are verified.The results showed that the SM-XGBoost model and SM-LightGBM model were significantly better than the decision tree and random forest models in terms of prediction accuracy and error.In terms of stabilityof training set and test set, SM-LightGBM model is superior to the SM-XGBoost model, with a maximum prediction accuracy of 88.2% for test set. This method provides a new analytical approach for predicting events in similar complex systems.

Keywords:SMOTE algorithm;flight punctuality rate;XGBoost model

Citation format: ZHANG JY,HU MH,HUANG F G.Flight punctuality rate prediction based on SMOTE algorithm[J]. Journal of East China Jiaotong University,2025,42(3): 57-66.

隨著民航運輸業的快速發展,航班延誤、正常率較低等相關問題也備受矚目,對正常率問題的研究既是滿足航空運輸業快速發展、緩解空域擁擠、提高運行效率的突破口,也是提升國家空域系統資源使用效率和空中交通管制服務品質的必然選擇。同時,提高航班正常率的預測準確度,能夠增強旅客的出行體驗,減少因航班延誤所帶來的焦慮與不便,從而提升公眾對于航空運輸服務的整體滿意度。

國內外對正常率預測研究各有側重。Kim等[建立了一個具有魯棒性的長短期記憶和遞歸神經網絡聯合機場延誤預測模型,該模型可預測單個航班最準確的延誤狀態。Rodriguez等分別從預測階段和可靠性階段揭示了影響機場性能因素之間的相互作用關系,提出用貝葉斯網絡模型實現機場到達系統的運行狀態的預測。Guleria等提出了一種基于多智能體的航班延誤預測方法,延遲分類的閾值設定為 15min ,預測準確率達到了 80% 。Bas-turk等融合飛行、航線軌跡、天氣信息,采用隨機森林和深度神經網絡模型實現對航班到達時間預測,并開發了一個應用程序,進一步提出動態預測模型。Zhang等[5利用PageRank算法獲取空中交通延誤動態空間依賴性,然后輸入到長短期記憶網絡和序列模型,聯合挖掘時空依賴關系并實現機場延誤的多步預測。Wang等采用了Beta分布、Erlang分布及正態分布來模擬飛行延誤的情況,并運用LightGBM、多層感知機、隨機森林模型對戰略層面的飛行延誤分布進行預測分析。羅杰等提出了一種基于XGBoost模型與Logistic模型集成的離港航班延誤預測方法,可以顯著提高單獨預測模型在稀疏數據集上的預測效果。徐子玥等采用基于集合預報的集合軌跡預測方法獲得預測軌跡的集合,建立航班過點時間極差的回歸預測方程,計算結果驗證了預測方法的有效性。鄭玉帆等提出了一種基于SMOTE(synthetic minority oversampling tech-nique)算法的深度神經網絡航班延誤預測模型(SMOTE-DNN),該模型的預測精度可以達到88.79% ,且對航班延誤各等級均有著較好的預測效果。曹衛東等[提出了一種融合多機場時空相關性的ST-LightGBM模型預測機場離港航班延誤。

為做好航班正常率預測,應選取能充分反映航班各方面情況的指標[,綜合評估建立航班正常性預測指標體系。本文使用SMOTE算法對傳統的決策樹、隨機森林模型等預測模型進行優化,提出了基于SMOTE算法的XGBoost分類預測模型(SM-XGBoost模型)和LightGBM分類預測模型(SM-LightGBM模型),并應用于航班正常率預測方面。構建了包含起飛機場、目的地機場、流控信息、航路航線性質方面的航班正常性預測指標體系,提升訓練速度的同時,降低了內存消耗,并提高了預測準確率。

1航班正常性預測框架

1.1航班正常性預測流程圖

航班正常性預測流程如圖1所示,具體步驟如下。

1)確定預測對象并收集數據。選定具有代表性的航空網絡區域,采集航空網絡中天氣預報數據、航路點數據、航班計劃數據和流量控制數據。對采集數據集進行數據融合、數據清洗、剔除異常值,從而形成航班正常性預測的原始數據集。

2)根據航班運行特點和航空網絡結構,綜合考慮航空公司、機場、空管部門的影響,提出航班正常性預測指標,并將這些指標進行區別歸類,分別屬于起飛機場、目的地機場、常態化流量控制信息、航路航線性質4大類。形成航班正常性預測最終數據集。

3)根據航班正常性預測最終數據集的構建情況,聯合數據平衡算法、參數優化算法和預測模型,提出航班正常性預測模型。首先,使用SMOTE算法對航班正常性預測問題存在的類別不平衡情況進行處理,從而達到平衡數據集的目的;然后,將平衡化的預測數據集輸入到XGBoost模型和LightG-BM模型中;最后,使用網格搜索算法對預測模型進行超參數調優,選擇預測效果最優的參數組合。

4)根據預測模型評價指標對比,輸出預測效果最優的航班正常性預測結果。根據航班正常性預測結果計算航班正常率,并對選定航空網范圍內的航班正常率的時空分布結構進行分析。

圖1航班正常性預測流程圖Fig.1Flightpunctualityprediction flowchart

5)分別輸出XGBoost模型和LightGBM模型中預測特征重要度排名,并進行對比,定量分析影響航班正常性的因素,挖掘航班正常性的關鍵影響因素。

1.2 航班正常性預測指標體系

本文從航空網絡中的要素入手,結合數據獲取情況,分別從起飛機場、目的地機場、常態化流量控制、航路航線性質4個角度出發提出航班正常性預測指標體系。

2 航班正常性預測指標體系

2.1基于機場運行的航班正常性預測指標體系構建

2.1.1 機場預計流量與容量

機場流量反映了機場的運行情況和繁忙程度,當機場流量超過機場本身的保障容量時,機場可能會出現航班排隊等待、停機位不足、旅客登機延誤等問題,導致航班無法按時起飛,影響航班的正常性。機場流量越大,航班出現不正常運行的概率越大。因此,機場流量是確保航班正常性和機場運行效率的關鍵因素,本文提出起飛機場預計流量和目的地機場預計流量作為航班正常性預測的指標,指標的相關定義如下。

1)起飛機場預計流量: 時段內起飛機場預計起飛的架次。 t 為預測對象計劃到港時刻, w 為時間窗口,本文 w 為 30min 。

2)目的地機場預計流量: 時段內目的地機場預計到達的架次。

此外,機場容量作為機場流量的對比性指標,同樣也是影響航班正常性的關鍵指標。由于本文對起飛機場群所屬的航空網絡范圍進行了界定,起飛機場的容量參考意義不大,故僅將目的地機場到港小時容量作為航班正常性預測指標,該容量由各機場的申報容量進行確定。

2.1.2 天氣狀況

不同的天氣類型會對航班運行產生不同的影響。惡劣的天氣條件,如雷雨、降雪、大霧等,可能導致能見度降低、跑道積水、冰雪覆蓋等情況,這些情況會對航班飛行安全產生影響。當惡劣天氣發生時,機場有關部門會采取相應的措施,如限制起降數量、調整航班計劃或者暫停運營,以確保航班的安全。其次,風向風速也是影響航班正常率的重要因素之一。當陣風超過飛機的安全限制范圍時,飛機的起降操作可能會受到限制。當風速過大時,飛機可能無法安全地起飛或降落,需要延遲或取消航班。當風向變化較大時,航班起降跑道發生變化,也會進一步影響航班的正常性。此外,溫度對航班正常率也有一定影響。在極端高溫條件下,機場的空氣密度會降低,飛機性能受到影響,導致起飛距離延長、爬升速度減慢等。相反,在極端低溫條件下,機場跑道和設備可能會受到冰凍或結冰的影響,需要進行除冰和防冰處理,這可能會導致航班無法正常起飛。

綜上所述,機場天氣類型、風向風速和溫度是保障航班安全運行的重要天氣指標。本文根據天氣預報信息,分別統計起飛機場和目的地機場的天氣類型、風向風速、溫度作為航班正常性預測的指標。

2.1.3 時段

在高峰或繁忙的時間段,機場通常會有更多的航班起飛和到達,機場的跑道、停機位和登機口資源可能出現緊缺的現象。當機場管理部門無法有效地處理這些航班時,會增加航班延誤或取消的概率。此外,目的地機場預計到達時段還與后續航班連接有關。如果航班延誤導致旅客無法及時到達下一班次的航班,這會對航班的正常性產生連鎖反應,影響整個航班網絡的運行。因此,起飛機場的預計起飛時段和目的地機場的預計到達時段對航班正常性有著重要的影響。

2.2基于常態化流量控制挖掘的航班正常性預測指標體系構建

2.2.1 常態化受控內容

為確保航班正常運行,空管的流量管理部門預判可能會發生的延誤影響,對進人特定空域的航班要求在特定時間段進行起降。同時,航空公司可能需要調整航班的起飛時間、中轉時間等,以適應流量控制措施的要求,從而導致航班的正常性受到影響。航空網絡具有復雜性和多變性,天氣情況、空中交通擁堵、機場設備故障等因素都可能導致流控信息的調整或更新,流量控制信息處于不斷變化中。因此,為有效捕捉流量控制信息對航班正常性的影響,本文梳理歷史流量控制的發生模式和趨勢,挖掘一些常態化的流量控制信息(半年中頻次出現超過100次的流控措施),將其作為航班正常性預測的類別指標。將不受常態化流量控制措施限制的航班歸為一類,否則按常態化流量控制措施的內容歸類,并結合該措施出現的頻次,進行賦值處理。

2.2.2 預計通過的常態化受控航路點

通常情況下,空管的流量管理部門發布的流量控制措施都是針對容流不平衡節點(機場或航路點),將這些受到管控的點稱之為受控航路點。這些受控航路點是造成空中交通管理延誤的重要組成部分,進而影響航班正常運行。若航班預計通過的受控航路點越多,該航班出現不正常運行的概率越大。出現受控航路點的原因是多樣的,受控航路點具有不確定性。為捕捉受控航路點對航班正常性的影響,本文梳理歷史受控航路點出現規律,確定一些常態化的受控航路點(半年中頻次出現超過100次的受控航路點),將其作為航班正常性預測的類別指標。將不通過常態化受控航路點的航班歸為一類,否則按常態化受控航路點類別歸類,并結合受控航路點出現的頻次,進行賦值處理。

2.2.3 空中交通流量控制

為應對機場或航路點出現容需不平衡現象,避免飛機在空中擁堵和碰撞,空中流量管理部門實施流量控制措施,用以維持空中交通系統的運行效率。空管流量管理部門為每個可能經過擁堵節點(機場或航路點)的航班分配一個計算起飛時間(calculatedtakeofftime,CTOT)。當航班的CTOT晚于航空公司計劃的目標起飛時間(targettakeofftime,TTOT),該航班出現空中交通管理/流量延誤,航班正常率受到影響。因此,本文將航班是否受到空中流量管控作為航班正常性預測的指標,該指標的相關定義如下:依據航班是否分配CTOT判斷航班是否受到流量控制,1表示航班受到流量控制,0表示航班不受到流量控制。

2.3基于航路航線性質的航班正常性預測指標體 系構建

2.3.1 航路點流量

當航路點流量過大時,航路點容易發生擁堵,航空器可能需要采取繞過航路點的飛行路徑或在地面進行排隊等待起飛,進而延長航班到達時間,影響航班正常性。根據航班計劃通過的航路和預計通過航路點的時間,計算航路點預計通過流量,并將其作為航班正常性預測的指標。當航班預計通過的航路點流量越大,航班發生繞行、延誤等不正常的可能性越大。

2.3.2 飛行計劃時長

飛行計劃時長為計劃擋輪檔時刻(scheduled in-blocktime,SIBT)與計劃撤輪檔時刻(scheduled off-blocktime,SOBT)的差值。

長時間的飛行計劃通常面臨更多的不確定性,如天氣變化、航路擁堵、機場超容等。此外,較長時間的飛行通常需要攜帶更多的燃油以滿足飛行需求,在某些情況下,飛機需要在途中進行加油,導致額外的停留時間和延誤的可能性。因此,飛行計劃時長是航班正常性的一個重要影響因素。

2.3.3 緩沖時長

緩沖時長為飛行計劃時長與歷史實際飛行時長之差,根據一個航班的歷史實際飛行時長的平均值得到該航班的歷史實際飛行時長。若航班的緩沖時長為正數,則當航班突發延誤時,航班有多余的緩沖時長完成航班計劃,緩沖時長可以在一定程度上緩解延誤對航班正常運行的影響。航班的緩沖時長越長,航班受到延誤影響越小,航班正常性越高。

2.3.4 城市對

航線資源通常集中分布在經濟發達、運輸需求旺盛的地區。此外,如果某些城市之間存在密切的商業聯系、旅游需求等,航空公司會將時刻資源傾斜于這些熱門城市對之間的航線,從而導致這些熱門航線的航班計劃密集。當這些城市對航線發生航班延誤時,延誤波及范圍廣,航班系統運行受到影響。因此,城市對是影響航班正常性的影響因素。

綜上,如表1所示,構建航班正常性預測影響因素體系,并根據影響因素的起源進行歸類,分為起飛機場、目的地機場、流控信息、航路航線性質4大類。

3航班正常性預測模型

根據航班正常性預測指標體系的構建,形成航班正常性預測數據集。航班正常性預測數據中,正常航班和不正常航班的數據量相差較大,為了有效解決不平衡樣本導致分類模型預測準確度低的問題,引入SMOTE算法對航班正常性預測數據集進行預處理。本文分別提出基于SMOTE算法的XGBoost分類預測模型(SM-XGBoost模型)和基于SMOTE算法的LightGBM分類預測模型(SM-LightGBM模型),并使用網格搜索算法尋找預測模型中最佳的參數組合,提高模型的性能和泛化能力,實現對特定航空網絡中的航班正常性進行預測。

表1航班正常性預測影響因素Tab.1 Influencing factors of flight punctuality prediction

3.1 SMOTE算法

2002年,Chawla等首次提出了SMOTE算法,旨在應對類別不平衡難題。作為一種廣受認可的數據增強策略,SMOTE專注于緩解機器學習及數據挖掘領域中顯著的樣本類別不均衡現象,即部分類別樣本數量遠遜于其他類別的挑戰。該算法核心機制圍繞著增加少數類樣本量展開,具體通過選取少數類樣本的鄰近樣本,利用線性插值技術在其間虛構新的樣本點,以此促進各類樣本數量的均衡,其算法原理圖見圖2所示。

以下是SMOTE算法的關鍵實施步驟概述:

1)針對少數類群體中的每一份樣本,執行歐式距離度量,以識別并獲取該樣本的K個最近鄰居;

2)考慮數據集中存在的不平衡比率,設定抽樣放大系數 N. ,并基于此為每份少數類樣本獨立抽取

圖2SMOTE算法原理圖Fig.2SMOTEalgorithmschematicdiagram

N 個最近鄰樣本;

3)對于每一名選定的鄰近樣本 x ,首先計算它與源樣本 xi 之間的差異向量,隨后運用隨機線性插值策略在這兩個點之間生成一個新的合成樣本,具體的插值計算公式為

xnew=xi+rand(0,1)×(x-xi

式中: xnew 為新的合成樣本;rand (0,1) 為區間 (0,1) 內的隨機數。

重復步驟1)\~步驟3),直到生成足夠數量的合成樣本。將生成的新樣本與原樣本合并在一起,形成平衡后的航班正常性預測數據集。

通過上述操作流程,SMOTE算法能夠有效應對數據中的類別不平衡問題,促使機器學習模型對各類別樣本實現更均衡的處理,在解決航班正常性預測等涉及類別分布不均的場景中具有顯著作用。

3.2 航班正常性分類預測模型

XGBoost和LightGBM都是基于梯度提升樹算法的改進版本,能夠有效處理類似航班正常性預測這樣的二分類問題。這些模型通過并行化處理、特征選擇以及優化算法等技術手段,克服了傳統GBDT模型的局限性,并展現出更好的性能和效果。因此,本文選用XGBoost和LightGBM分類模型并與隨機森林和決策樹經典算法進行對比研究。

3.2.1 XGBoost模型

為解決傳統樹模型計算效率低、難以處理大規模高維數據的問題,在傳統的GBDT模型的代價函數中加入正則項,提出一種極限梯度提升模型XG-Boost27(extreme gradient boosting)。XGBoost模型的代價函數如式(2)所示,正則項如式(3)所示

式中: φ 為模型參數; Ω(fi) 為正則項,用于度量模型的復雜度; γ 和 λ 為正則化參數; T 為樹的葉子節點數; a 為葉子節點的權重。

3.2.2 LightGBM模型

微軟在GBDT模型的基礎上改進了損失函數計算殘差方式,推出了一種迭代提升樹系統稱為LightGBM,它專注于解決大規模數據集上的訓練效率問題。LightGBM模型的目標函數與XGBoost模型形式相同,都由損失函數和正則項組成,但二者在實現形式上有所區別。LightGBM模型在解決大規模數據集上的訓練效率問題時有兩個關鍵點。

1)離散化特征值:LightGBM利用了離散化處理技術,將連續特征值轉換成離散的桶或分箱數據。這種做法不僅顯著減少了內存占用,還提高了訓練速度。通過這種方式,算法能夠更高效地處理大規模數據的特征,同時也降低了計算成本。

2)基于直方圖的決策樹算法:LightGBM使用了基于直方圖的算法進行決策樹生長,這與傳統的基于樹節點的決策樹相比具有明顯優勢。該方法通過構建直方圖來近似尋找最佳分裂點,減少了遍歷所有數據的復雜度,加速了訓練過程,特別適用于處理大規模數據。這使得LightGBM能夠更有效地處理大規模數據,從而提高了訓練效率。

XGBoost和LightGBM在原理上都是對傳統的梯度提升決策樹(gradientboostingdecisiontree,GB-DT)進行改進和優化。它們通過并行化處理、特征選擇和優化算法等技術手段,有效地解決了傳統GBDT模型存在的一些問題,展現了更好的性能和效果。

3.3航班正常性分類預測模型關鍵參數

不同的參數設置將直接影響模型的預測性能,通過多輪實驗,本文篩選出針對航班正常性預測問題中XGBoost模型和LightGBM模型的重要參數,并進行解釋說明。n_estimators、max_depth、learn-ing_rate對XGBoost和LightGBM模型的預測性能影響都較大,這3個參數在不同程度上影響著模型的復雜度和擬合能力。模型的復雜度和擬合能力隨nestimators的數量增加而增加,計算成本和過擬合的風險也隨之升高;max_depth數值越大,模型學習復雜特征和關系的能力越強,過擬合風險越大;較大的learning_rate會使每個基學習器的貢獻較大,模型訓練過程更加激進,可能導致過擬合。

此外,subsample、colsample_bytree 參數對XG-Boost模型的預測性能影響也較大。subsample參數控制了每個基礎學習器使用的訓練樣本比例,較小的subsample值意味著用于訓練每棵樹的樣本較少,從而增加模型的多樣性,但容易存在欠擬合的問題。colsamplebytree指定了每棵樹在訓練時使用的特征比例,較大的colsample_bytree值意味著每棵樹使用的特征數量較多,模型過擬合的風險增加。feature_fraction和num_leaves對LightGBM模型的預測性能影響也較大。feature_fraction為LightGBM模型中每棵樹在訓練時使用的特征的比例,與XGBoost模型colsample_bytree參數含義相似;num_leaves為每棵樹的葉子節點數量,numleaves數值越大,模型每棵樹的結構越復雜,模型過擬合風險增加。

3.4模型性能評價指標

本文選用 R2 、平均絕對誤差MAE(meanabso-lute error)、均方根誤差RMSE(root mean square er-ror)、準確度Accuracy指標對航班正常性預測模型進行模型評估。 R2 表示模型解釋數據方差的比例,越接近1,表示模型對目標變量的解釋能力越強;Accuracy表示模型預測正確的樣本數占總樣本數的比例,Accuracy越高,模型的分類能力越強。MAE、RMSE的計算公式為

式中: yi 為真實值; 為預測值; n 為樣本數量。

綜上,構建航班正常性預測模型,具體流程如圖3所示。

圖3基于SMOTE算法的航班正常性預測模型Fig.3FlightpunctualitypredictionmodelbasedonSMOTEalgorithm

4 實例驗證

根據學者對空中交通網絡擁擠判別與預測的研究,篩選出中國空域擁擠等級較高的華東地區作為實例驗證對象。選擇華東地區4個具有代表性的機場作為起飛機場構建航班正常性預測網絡,用ICAO代碼進行表示,ZSSS(上海虹橋機場)、ZSPD(上海浦東機場)、ZSHC(杭州機場)、ZS-NJ(南京機場)。

2023年5月1日到5月31日,收集從華東地區4個機場起飛的航班正常性預測數據,共51373條。由于數據采集和不正常航班比例問題,本文僅選擇國內航班進行實驗,剔除國際航班和異常數據后,獲得航班正常性預測有效數據共44261條。其中,正常航班數據為36612條,不正常航班數據7649條。將5月1日—5月22日的航班正常性預測數據作為訓練集,5月23日—5月31日的航班正常性預測數據作為測試集,從流量管理的戰術層面,對華東四場離港的航班正常性進行短時預測。

4.1 預測模型性能對比

本研究運用SMOTE算法與網格搜索算法,分別結合XGBoost模型和LightGBM模型,對航班正常性預測數據的測試集開展實驗。通過對比參數調優操作與數據平衡處理對原始模型預測性能的影響,得出模型評估結果,具體如表2所示。使用網格搜索算法進行調參的操作,應用SMOTE算法平衡預測數據集的操作處理后模型預測擬合度和準確度均有提升。經過數據平衡操作處理后的模型在預測準確度方面的優化幅度高于調參操作處理后的模型。對比原始模型,SM-XGBoost模型和SM-LightGBM模型的預測準確度分別提升了17個百分點和18.5個百分點。對SM-XGBoost模型和SM-LightGBM模型進行調參處理后,模型預測擬

表2調參和數據平衡操作對模型預測性能影響的評估結果

合度均達到0.82以上,預測準確度分別提升了2.8個百分點和3.4個百分點。經過多輪實驗,確定SM-XGBoost和SM-LightGBM模型關鍵參數最佳組合如表3所示。

表3SM-XGBoost模型與SM-LightGBM模型關鍵參數最佳組合

為準確評估兩個模型的預測性能,引入傳統機器學習算法決策樹(decisiontree,DT)和隨機森林(randomforest,RF)進行對比實驗。首先,利用SMOTE算法對航班正常性預測數據進行平衡處理,再分別輸入到DT、RF模型中進行訓練。本文將基于SMOTE算法的DT、RF預測模型分別記作SMOTE-DT、SMOTE-RF模型。4個模型在 R2 MAE、RMSE、Accuracy指標的對比結果如表4所示。SMOTE-DT模型中訓練集和測試集預測準確度存在較大差異,訓練集預測準確度高達 97.2% ,測試集預測準確度僅為 79.8% ,且訓練集 R2 為0.96,可能存在過度擬合的問題。SM-XGBoost模型和SM-LightGBM模型在預測準確度和誤差上明顯優于SMOTE-DT模型和SMOTE-RF模型。在訓練集和測試集穩定性上,SM-LightGBM模型優于SM-XG-Boost模型,且SM-LightGBM模型對測試集的預測準確度最高為 88.2% 。

為進一步對比不同類別預測性能,分別輸出SMXGBoost、SM-LightGBM模型的混淆矩陣。SM-XG-Boost、SM-LightGBM模型對正常航班的預測精準度均高于不正常航班的預測,預測精準度分別為 86.1% 、88.2% 。SM-XGBoost模型對不正常航班 R2 僅為0.82 。相比之下,SM-LightGBM模型對兩種類別的預測精準度穩定性更高,對不正常航班 R2 達到0.85。

綜上,SM-XGBoost模型和SM-LightGBM模型預測性能均優于傳統機器學習模型。在對不同數據集和不同類別預測效果上,SM-LightGBM模型的預測穩定性高于SM-XGBoost模型。

4.2特征重要性分析

根據SM-XGBoost、SM-LightGBM模型得出特征重要度排名,探究從華東四場離港的航班正常性指標對預測結果的重要性。基于SM-XGBoost模型和SM-LightGBM模型的航班正常性特征重要度排名如圖4所示。在SM-XGBoost模型中,特征重要度排在前3的指標分別為是否受到空中交通流量控制、緩沖時間、起飛機場預測起飛時段。其中,是否受到空中交通流量控制是最關鍵的特征,重要度超過0.2。在SM-LightGBM模型中,特征重要度排在前3的指標分別為緩沖時間、是否受到空中交通流量控制、常態化受控內容。其中,緩沖時間是最關鍵的特征,重要度為0.16。此外,起飛機場天氣類型也是兩個模型值得重點關注的特征,特征重要度排名均排第4。從特征所屬類別來看,流控信息在航班正常性的預測中發揮重要作用。

4.3航班正常性預測結果分析

如圖5所示,分別輸出SM-XGBoost、SM-Light-

表4航班正常性預測模型評估結果對比Tab.4 Comparisonof flight punctualitypredictionmodel evaluationresults
圖4航班正常性特征重要度排名Fig.4Rankingofflightpunctuality feature importance

GBM模型對華東4個機場的航班正常率預測結果,根據航班正常率的計算公式進行計算得到各機場的航班正常率預測結果。從預測值和真實值曲線對比結果來看,預測的航班正常率較真實航班正常率偏低。不同機場的航班正常率預測結果穩定性有所區別。其中,南京機場航班正常率預測結果較真實值波動最大,其次是虹橋機場。浦東機場和杭州機場的航班正常率預測穩定性最好,杭州機場的航班正常率預測趨勢與真實航班正常率趨勢較為一致。從航班正常率來看,南京機場航班正常率最低,航班不正常運行數量最多,存在的不確定因素較多,可能導致航班正常率預測準確度降低。其余3個機場的航班正常率較穩定。從模型的預測結果對比來看,SM-LightGBM模型對華東四場航班正常率的預測準確度和穩定性高于SM-XGBoost模型。

5 結論

1)通過構建一個多維度的航班正常性預測指標體系,為航班正常率預測提供了更為全面和細致的視角。

2)不僅繼承了SMOTE算法在處理數據集不平衡問題上的優勢,更在此基礎上創新性地構建了兩種新的預測模型,無論是結構上,還是預測準確度和誤差控制方面均優于傳統的決策樹和隨機森林模型,為航班正常性預測領域的研究和實踐提供了新思路。

3)在訓練集和測試集穩定性上,SM-LightGBM模型優于SM-XGBoost模型,對測試集的預測準確度最高為 88.2% □

參考文獻:

[1]KIM Y J,CHOI S,BRICENO S,et al.A deep learning approach to flight delay prediction[C]//Sacramento:2016 IEEE/AIAA 35th Digital Avionics Systems Conference (DASC),2016.

[2]RODRIGUEZ-SANZ A,COMENDADORFG,VALDES RA,et al.Assessment of airport arrival congestion and delayprediction and reliability[J].Transportation Research PartC:Emerging Technologies,2019,98:255-283.

[3]GULERIAY, CAI Q, ALAM S, et al. A multi-agent approach for reactionarydelay prediction offlights[J].IEEE Access,2019,7:181565-181579.

[4]BASTURKO,CETEKC.Prediction of aircraft estimated timeof arrival using machine learning methods[J].The Aeronautical Journal,2021,125(1289):1245-1259.

[5]ZHANGH, SONG CY,ZHANGJ, et al. A multi-step airport delay prediction model based on spatial-temporal correlation and auxiliary features[J].IET Intelligent Transport Systems,2021,15(7):916-928.

[6] WANG Z M,LIAO C H, HANG X, et al. Distribution prediction of strategic flight delays via machine learning methods[J].Sustainability,2022,14(22):15180.

[7] 羅杰,侯霞,楊鴻波,等.基于集成學習的離港航班延誤預 測方法[J].計算機工程與設計,2022,43(4):1145-1151. LUO J, HOU X, YANG H B,et al.Prediction of departure flight delay based on ensemble learning[J].Computer Engineering and Design,2022,43(4):1145-1151.

[8] 徐子玥,胡明華,張穎,等.基于風集合預報的扇區概率 擁堵預測[J].華東交通大學學報,2022,39(4):48-57. XUZY,HUMH,ZHANGY, et al.Probabilistic sector congestion prediction based on ensemble wind forecasts[J]. Journal of East China Jiaotong University,2022,39(4): 48-57.

[9]鄭玉帆,徐海文.基于SMOTE算法的深度神經網絡航 班延誤預測模型[J].價值工程,2023,42(4):118-120. ZHENGYF,XUHW.Flightdelaypredictionmodel of deepneural network based on SMOTE algorithm[J].ValueEngineering,2023,42(4):118-120.

[10]曹衛東,張金迪,劉晨宇.基于ST-LightGBM的機場離 港航班延誤預測[J].陜西科技大學學報,2023,41(4): 166-172. CAO W D, ZHANG JD,LIU C Y.Airport departure flightdelay prediction based on ST-LightGBM[J].Journalof ShaanxiUniversity of Scienceamp; Technology,2023, 41(4): 166-172.

[11] 晉百川,楊鴻波,侯霞,等.面向集成學習的航班離港延 誤狀態預測[J].傳感器與微系統,2023,42(9):141-144. JIN B C,YANG HB,HOU X, et al.Prediction of flight departure delay state based on ensemble learning[J]. Transducer and Microsystem Technologies,2023,42(9): 141-144.

[12] CHAWLA N V,BOWYER K W,HALL L O,et al. SMOTE:synthetic minority over-sampling technique[J]. Journal of Artificial Intelligence Research,2002,16(1): 321-357.

通信作者:張嘉懿(1988—),女,工程師,碩士,研究方向為交通運輸規劃與管理。E-mail:fuji415@sina.com。

(責任編輯:吳海燕)

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 青青草国产一区二区三区| 一级在线毛片| 中文天堂在线视频| 亚洲天堂视频在线观看| 成年午夜精品久久精品| 日韩精品无码一级毛片免费| h视频在线观看网站| 国产主播在线观看| 国产免费人成视频网| 麻豆精品国产自产在线| 亚洲精品动漫| 免费人成网站在线观看欧美| A级毛片无码久久精品免费| 久久精品丝袜| 毛片一级在线| 日韩国产一区二区三区无码| 成人日韩视频| 六月婷婷精品视频在线观看| 国产麻豆另类AV| 中文国产成人精品久久一| 亚洲精品高清视频| 日韩欧美中文亚洲高清在线| av一区二区三区高清久久| 亚洲色欲色欲www网| 国产精品蜜臀| 久久精品66| 久久香蕉欧美精品| 高清欧美性猛交XXXX黑人猛交 | 99久久国产精品无码| 麻豆精品在线播放| 亚洲综合在线最大成人| 亚洲伦理一区二区| 亚洲国产一区在线观看| 国产精品无码AⅤ在线观看播放| A级毛片无码久久精品免费| 丁香六月激情综合| 国产本道久久一区二区三区| 天天躁狠狠躁| 国产chinese男男gay视频网| 久久免费精品琪琪| 国产福利大秀91| 日韩国产综合精选| 九九热精品在线视频| 亚洲高清在线天堂精品| 国产麻豆精品久久一二三| 国产精品无码久久久久久| 国产国拍精品视频免费看| 中文字幕资源站| 久久影院一区二区h| 欧美成人手机在线观看网址| 精品成人一区二区三区电影| 日本在线欧美在线| 欧美国产三级| 一级一级一片免费| 波多野一区| 黄色网页在线观看| 青青草综合网| 欧美成人免费| 91精品国产91久无码网站| 992tv国产人成在线观看| 亚洲91在线精品| 亚洲av无码专区久久蜜芽| 久久精品嫩草研究院| 国产av一码二码三码无码 | 国产精品综合久久久| 亚州AV秘 一区二区三区| 91原创视频在线| 国产精品美女网站| 国产乱子精品一区二区在线观看| 最新国产网站| 天天婬欲婬香婬色婬视频播放| 福利国产微拍广场一区视频在线| 沈阳少妇高潮在线| 日本91在线| 久久99热66这里只有精品一| 亚洲国产高清精品线久久| 99热线精品大全在线观看| 97视频在线观看免费视频| 国产精品亚欧美一区二区三区| 国产成人高清精品免费5388| 亚洲国产黄色| 国产污视频在线观看|