999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于貝葉斯網絡的航班離港延誤預警分析

2008-12-31 00:00:00曹衛東丁建立劉玉潔
計算機應用研究 2008年11期

(1.天津大學 系統工程研究所, 天津 300072;2.中國民航大學 計算機學院, 天津 300300)

摘要:貝葉斯網絡是一種有效的概率預測方法,嘗試將其應用于航班數據分析預警,應用Netica 軟件工具構建實際航班及其關聯的貝葉斯網絡,特別是針對航班延誤的最主要環節——離港延誤,分時間段對國內某航空公司在某機場的離港數據進行了延誤原因分析和延誤預警分析。

關鍵詞:貝葉斯網絡;航班離港延誤;延誤原因;延誤預警

中圖分類號:TP274; TP391文獻標志碼:A

文章編號:1001-3695(2008)11-3388-03

Analysis of flight departure delay and warning based on Bayesian networks

CAO Wei-dong1,2,DING Jian-li2,LIU Yu-jie2

(1.Institute of Systems Engineering, Tianjin University, Tianjin 300072, China;2. College of Computer Science, Civil Aviation University of China, Tianjin 300300,China)

Abstract:Bayesian networks is a valid probability forecast method, it is tried to use in flight data analysis and warning. Netica software packages were used in constructing Bayesian networks of actual flight data and their relationships. Especially aimed at flight departure delay. It analyzed delay reasons and delay warning by using partition time data of an airline company departure from an airfield in China. 

Key words:Bayesian networks; flight departure delay; delay reasons; delay warning

中國民用航空系統是一個龐大的隨機系統,包括錯綜復雜的互相關聯成分:行政管理部門、控制中心、機場、航空公司、飛行器、乘客等。這種復雜性必然導致了管理和控制上的大量困難。其中最難處理的問題之一就是飛機延誤,它給航空公司造成了巨大損失。隨著中國民航事業的不斷發展,系統需求與日俱增,航班延誤問題愈顯突出。導致延誤的影響因素較多,雖然有研究致力于分析引起航班延誤的原因,但重點多在于定性分析,對造成航班延誤的因素只當做一個既定的概念來用,并沒有對這些因素進行界定,因而使航班延誤的結果存在一個模糊的范圍。同時,缺乏一個統一的指標體系來表示航班延誤整體的狀態[1],所以很難進行延誤預警。貝葉斯方法是概率統計學中的一種重要方法,用來研究復雜隨機系統中多因素間的相互依賴關系。貝葉斯網絡具有在推論和可視化兩方面獨一無二的強壯性,它根據各個變量之間概率關系用圖論方法建立模型, 可以解決專家系統中的不確定知識。 一方面,將人類所擁有的因果知識直接用有向圖自然直觀地表示出來;另一方面,將統計數據以條件概率的形式融入模型。這樣,貝葉斯網絡將人類的先驗知識和后驗數據進行了有機的結合。

民航系統正是一個復雜的隨機控制系統,必須用概率函數來描述,應用統計分析的方法。本文將概率統計的貝葉斯規則用于分析民航航班數據,應用Netica 軟件包建模實際航班數據的貝葉斯網絡。考慮對離港延誤和到達延誤這兩個主要延誤問題來說,由于到達延誤很大程度上也是由起飛機場的離港延誤而產生。本文重點研究離港延誤問題, 針對給定時間段內國內某航空公司在某機場的離港數據及延誤原因進行分析,其目的在于對未來的延誤進行預測。在此基礎上嘗試探討離港延誤預警。

1貝葉斯網絡

11基本概念

貝葉斯網絡亦稱信念網絡(belief network),是一種模擬人類推過程中因果關系的不確定性處理模型,網絡拓撲結構是一個有向無環圖(DAG)[2]。它的節點用隨機變量或命題來標志,認為有直接關系的命題或變量則用弧來連接。假設節點E直接影響到節點H,則建立節點E到節點H的有向弧(E,H),權值(即連接強度)用條件概率p(H/E)來表示,即Ep(H/E)H。圖1為5個節點的貝葉斯網絡。 

條件概率表示為p(xi/pai),其中pai是隨機變量xi的父節點。一旦命題之間的相關性由有向弧表示,條件概率由弧的權值來表示,則命題之間靜態結構關系的有關知識就表示出來了。貝葉斯網絡推理需要給出許多先驗概率,它們是根節點的概率值和所有子節點在其父節點給定下的條件概率值。這些先驗概率可以由大量歷史的樣本數據統計分析得到,也可由領域專家長期的知識或經驗總結主觀給出,或者根據具體情況事先假設給定。

12貝葉斯網絡的特點

貝葉斯網絡可以處理不完整的和帶有噪聲的數據集,它用概率測度的權重來描述數據間的相關性。用圖形的方法描述數據間的相互關系,語義清晰,可理解性強,有助于利用數據間的因果關系進行預測分析。獨特的不確定性知識表達形式、豐富的概率表達能力、綜合先驗知識的增量學習特性使貝葉斯方法成為當前數據挖掘中最為引人注目的焦點之一。

根據其基本原理,貝葉斯網絡具有如下特點:

a)貝葉斯網絡具有了堅實的概率理論基礎,同時具有直觀的知識表示形式。

b)貝葉斯網絡與一般知識表示方法不同的是:它是對于問題域的建模。因此當條件或行為等發生變化時,不用對模型進行修正。

c)貝葉斯網絡能夠處理不完備數據集。貝葉斯網絡反映的是整個數據域中數據間的概率關系, 即使缺少某一數據變量仍然可以建立精確的模型。

d)貝葉斯網絡是根據因果關系進行學習的。 在數據分析處理中獲得變量域的理解,便于處理各種不確定性信息。

e)貝葉斯網絡與貝葉斯統計相結合能夠充分利用領域知識和樣本數據的信息。

綜上所述,應用貝葉斯網絡建模進行數據分析,能夠很好地解決民航數據普遍存在的信息量大、有缺失、直觀因果關系不明確、知識隱藏等問題。

2模型的構建

21數據定義

研究所用歷史數據來源于國內某大型航空公司的實際航班數據,分析重點在于此航空公司航班離港某大型樞紐機場的情況。

為了有針對性地進行問題分析,首先在SQL Server 2000環境中對數據庫的數據進行了必要的預處理。提取源數據庫中出發機場為已知機場的數據;增加離港延誤時間屬性,即

出發機場= 已知機場

離港延誤時間=實際起飛時間-計劃起飛時間

另外,在數據庫中存儲用來表示航班延誤原因的延誤代碼,其具體含義如表1所示。

表1航班延誤原因與延誤代碼對照表

延誤原因代碼延誤原因代碼延誤原因代碼

天氣原因TQ流量控制 LL 工程機務JW

運輸服務YS機場設計 JC 空勤人員KQ

公司計劃JH場區秩序 CQ 食品供應SP

安檢AJ聯檢 LJ 旅客LK

禁飛JF需說明的原因SM

22航班數據的貝葉斯網絡建模

本文中貝葉斯網絡用Netica軟件包[3]建立。模型創建步驟如下:

a)建立航班離港信息視圖。

b)根據離港信息視圖建立模型相關的變量。

c)建立一個離港數據的有向無環圖(DAG),即在Netica軟件包中初建立貝葉斯網絡.neta,它的節點xi用與離港數據相關的隨機變量來標志,有直接關系的變量則用弧來連接。

d)通過初始數據,指派局部概率分布p(xi/pai)。其中pai是隨機變量xi的父節點。

e)根據視圖數據生成Netica的.cas文件,并進行必要的數據處理,缺失數據以*表示。

f)進一步向.neta加入.cas文件,并進行編譯。

圖2是用Netica生成的離港延誤的貝葉斯網絡模型,其中用到的是3月27日~4月7日的航班數據。圖中節點cur_date、time、delay、code分別表示當前日期、一天中的時間段、離港延誤時間、延誤代碼。其中時間分為一天中的多個時間段,分別為早8:00以前(less8),8:00~10:00(t8 to 10)……依此類推,最后時間段為20:00以后(more20)。延誤時間分為:小于20 min(less20)的延誤——按照目前中國民航大型樞紐機場執行的標準,延誤時間在20 min之內為正常航班,不作延誤處理[4]; 20~40 min的延誤(d20 to 40),1~2 h延誤(d1 to 2)……直到超過4 h的延誤(more4)。延誤代碼對應的延誤原因見表1。

3數據分析

通過構造貝葉斯網絡,一方面反映航空公司的航班關于機場已知時間段的離港延誤情況,通過對已發生的航班數據的反復學習,可以產生典型時間段離港延誤相對穩定的概率分布;另一方面可以預測相應環境參數下的航班延誤情況。由于數據的局限性,本文重點對前者進行分析,并嘗試進行延誤預警。

圖2中每個節點變量與一系列局部概率分布(參數在條件概率表(CPT)中)相關。貝葉斯網中的概率信息是通過這些局部概率分布確定的[5]。在模型中根節點cur_date代表日期變量和與之相關的概率分布,在一般情況下,由于該航空公司每日進出機場的航班數近似,日期變量概率分布均勻;一個非根節點有一個相關的隨機變量和一個由父節點隨機變量決定的條件分布值。以圖2離港延誤模型中的delay為例,其條件概率表(CPT)的部分內容如表2所示。

31離港延誤分析

圖2顯示離港延誤在已知時間段內的整體狀況,描述了貝葉斯網絡模型中的4個節點隨機變量cur_date、time、code、delay。其中有直接關系的變量用有向弧來連接。例如,時間對于延誤有直接影響,則建立節點time到節點delay的有向弧time→delay,其他類推。

圖中顯示的是對模型學習實際航班離港數據而產生的貝葉斯后驗概率,從中可以清楚地看到,航空公司從機場出發的航班中,有相當一部分存在20~40 min的延誤,后驗概率437%,40~60 min延誤的后驗概率為23.4%,同時以小概率存在有1~2 h延誤,2~4 h延誤以及超過4 h的延誤。其產生延誤的原因主要是LL——流量控制因素,貝葉斯后驗概率363%,明顯高于其他原因;同時看到,以小概率存在由于其他原因產生的離港延誤,如以12.3%的概率存在場區秩序(CQ)原因產生延誤,8.05%在于禁飛原因(JF),還有10.7%的計劃原因(JH)。另外值得提到的是以11.5%概率的天氣原因(TQ)導致延誤,說明這段時間有異常天氣狀況出現。

貝葉斯方法給出了一種根據新的數據不斷更新后驗分布的貫序方法,每當新的數據加入,上次結果的后驗概率變為先驗概率,進一步產生新的后驗分布,大量數據加入后,數據趨于穩定的概率分布。圖2中的當前時間變量給出示意,表明隨環境參數相似的航班數據不斷加入,離港延誤隨一天中時間的變化而變化的情況,當概率分布趨于穩定時,去除日期變量。圖3給出在8:00~10:00時間段內航班離開機場時的延誤情況。依概率分布可以看到,相當一部分航班發生20~40 min的延誤,另外也存在40~60 min時間段的航班延誤,導致延誤發生的主要原因依次是流量控制(LL)、機場設計(JC)和場區秩序(CQ)。進一步分析上午8:00~10:00時間段,產生的20~40 min的航班延誤(圖4)。其中反映的整體延誤原因結論與圖3一致,主要延誤原因是LL、JC和CQ,細節上有所不同。圖4表明20~40 min延誤以51.7%的概率由流量控制產生的。

32異常情況分析

從圖2的貝葉斯網絡模型分析可以得到,這段時間該航空公司從該機場離港,產生延誤的主要原因在于流量控制,同時模型反映出禁飛(JF)和天氣(TQ)也是兩個值得關注的因素。通過貝葉斯模型跟蹤本時間段單獨日歷天的航班數據(圖5)發現,4月5日影響航班離港延誤的主要原因是空中禁飛,其后驗概率33.2%。圖6表明4月6日產生的1~2 h的離港延誤主要是由異常天氣導致的,code中TQ延誤代碼的后驗概率高達41.7%,而實際情況是該機場地區在此期間出現空氣浮塵,造成大氣透明度不好。貝葉斯網絡模型數據分析的結果與實際情況吻合。

33離港延誤預警

通過貝葉斯網絡建模很好地表示了航班離港延誤的主要變量之間的因果關系,利用給定樣本數據去學習,清晰地反映出無論是單獨日歷天還是分時間段的航班延誤的概率分布情況。反映歷史情況不是本文研究的意圖所在,數據分析的根本目的在于預測、預警進而輔助決策。基于貝葉斯的離港延誤模型可以根據相對早的歷史數據作為先驗概率,不斷更新后驗概率,使模型更加準確地刻畫相應時間的離港延誤情況。這樣在相似情況發生之前,準確預測未來離港延誤情況,根據模型反映的情況,當存在延誤的后驗概率達到一定程度時,可以根據民航行業相關規定進行延誤預警。所以,基于模型的數據分析的更進一步工作是延誤預警,給出機場延誤預警等級,提示航空公司和乘機旅客提前做好相應準備。

參照民航上海虹橋機場關于大面積不正常航班應急處置預案,設預警等級從高到低依次分為紅色(red)、橙色(orange)、黃色(yellow)、藍色(blue)。借助機場離港延誤貝葉斯網絡模型的分析結果,規定延誤與預警等級之間的關系:當delay節點中超過2 h的航班延誤概率分布大于50%時進行紅色預警。1~2 h航班延誤概率分布大于50%時進行橙色預警; 40 min到1 h航班延誤概率分布大于50%時進行黃色預警;20~40 min的航班延誤概率分布大于50%時進行藍色預警。在VC++中借助Netica提供的API獲取貝葉斯模型的后驗概率分布,可以很方便地設計程序,給出預警等級。例如,當圖7的情況發生時,由VC++程序給出藍色預警。 

4結束語

研究表明,基于貝葉斯概率統計的基本理論,借助Netica軟件工具構建的航班離港數據的貝葉斯網絡模型,能夠清晰地反映航空公司航班在起飛機場的整體延誤情況,直觀顯示發生離港延誤的時間段,延誤原因以及延誤時間之間的概率分布情況;為預測未來相應的航班離港延誤提供強有力的依據;模型數據分析的結論,結合民航行業要求,能夠方便地給出航班延誤預警。

參考文獻:

[1]

石麗娜,朱金福.航空公司航班延誤預警管理理論應用分析[J].集團經濟研究,2006(26):138-139.

[2]史忠植.知識發現[M].北京:清華大學出版社,2002:169-174.

[3]XU Ning,DONOHUE G,LASKEY K B.Estimation of delay propagation in the national aviation system using Bayesian networks[C]//Proc of the 6th USA/Europe Air Traffic Management Research and Development Seminar.2005.

[4]中國民用航空總局民航空發(2003)96號,民航航班正常統計辦法[S].2003.

[5]XU Ning,LASKEY K B,CHEN Chun-hung,et al.Bayesian network analysis of flight delays[EB/OL].(2007).http://catsr.ite.gmu.edu.pubs/XuTRB2007.pdf.

主站蜘蛛池模板: 精品国产自在现线看久久| 中文字幕66页| 一本大道无码高清| 国产成年女人特黄特色大片免费| 亚洲经典在线中文字幕| 一级福利视频| 精品久久久久成人码免费动漫 | 亚洲国产中文在线二区三区免| 红杏AV在线无码| 人妖无码第一页| 免费日韩在线视频| 97青青青国产在线播放| 亚洲国产天堂久久综合| 2020最新国产精品视频| 久久人妻xunleige无码| 国产中文一区二区苍井空| 91网红精品在线观看| 日韩AV无码一区| 免费女人18毛片a级毛片视频| 久久综合色天堂av| av天堂最新版在线| 无码精油按摩潮喷在线播放| 国产91透明丝袜美腿在线| 欧美成人综合在线| 国产永久在线观看| 97视频免费在线观看| 在线观看视频一区二区| 亚洲精品爱草草视频在线| 亚洲午夜福利精品无码不卡| 久久精品午夜视频| 九九九久久国产精品| 黄色网页在线观看| 91小视频在线播放| 国产网友愉拍精品| 亚洲综合色吧| 久久视精品| 国产成人综合网| 成人在线不卡| 久久国产高潮流白浆免费观看| 国产精彩视频在线观看| 欧美一区二区精品久久久| 国产亚洲日韩av在线| 国产一区二区精品福利| 伊人久久久久久久久久| 中文无码精品A∨在线观看不卡| 日韩一区二区三免费高清 | 国产精品无码影视久久久久久久| 国内精品自在自线视频香蕉| 欧美激情福利| 国产精品自拍露脸视频| 91美女在线| 国产精品第三页在线看| 在线视频亚洲欧美| 国产综合无码一区二区色蜜蜜| 国产男女免费视频| 国产精品人人做人人爽人人添| 免费xxxxx在线观看网站| 中文无码精品a∨在线观看| 无码中文字幕乱码免费2| 久久香蕉国产线| 欧美性色综合网| 欧美日韩国产一级| 亚洲欧美成人在线视频| 国产精品无码作爱| 一本一道波多野结衣一区二区| 久久精品一卡日本电影| 欧美精品啪啪一区二区三区| 97se亚洲综合在线| v天堂中文在线| 国产在线一区二区视频| 国产成人亚洲综合A∨在线播放| 久久香蕉国产线看精品| 亚洲成人在线免费观看| 国产嫖妓91东北老熟女久久一| 成人在线欧美| 呦系列视频一区二区三区| 欧美成人免费午夜全| 黄色网址手机国内免费在线观看| 九九视频免费看| 成人午夜免费视频| www.av男人.com| 欧美福利在线观看|