999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于ID3算法的飛行時間分析

2021-06-30 01:57:02余士龍吳晨陽許向運
氣象水文海洋儀器 2021年2期

張 祥,陳 軍,余士龍,吳晨陽,許向運

(1.94995部隊,如皋 226500;2.95631部隊,瀘州 646000)

0 引言

隨著計算機技術的高速發展,信息數據量呈現出幾何倍數增長。如何從海量數據中有效地提取有用信息,一直是數據挖掘技術的目的所在[1]。20世紀80年代末發展起來的數據挖掘技術,就是從大量不完全的、有噪聲的實際數據中,提取潛在有用的信息和知識的一種技術手段。在飛行氣象保障領域,為了能夠更好地滿足飛行任務的需求,需要綜合衡量各類快速變化的氣象要素的影響。由于飛行員在飛行水平、飛機性能等各個方面存在著一定的差異,因此,不同氣象要素對飛行時間的長短有著明顯影響。文章將決策樹算法引入氣象要素分析過程中,決策樹算法主要用來對研究數據進行預測與分類,是目前應用最為廣泛的一種數據挖掘算法[2,3]。通過ID3決策樹算法對氣象信息進行充分挖掘,找到對飛行時間長短影響較大的分類規則,用于分析飛行的進展情況,從而提出針對性建議,使飛行保障質量得到提高。

1 ID3算法的構造

ID3決策樹是一種經常使用的分類方法,其利用一種類似流程圖的樹結構進行預測分類建模,將核心問題的搜索空間分為若干個不同的子類[4]。樹的節點是樣本的屬性,屬性的取值為樹的分支。決策樹的產生是對大量樣本的屬性進行分析歸納的結果[5]。應用此種方法自頂向下地建造一棵樹對分類過程進行建模,便可以將數據進行有效地集中并得到分類結果。ID3決策樹算法首先計算訓練樣本集合中所有屬性的信息增益,將信息增益最大的屬性作為測試屬性。創建與判斷屬性值一一對應的各個子葉節點,代表訓練樣本子集;以此類推,調用遞歸繼續劃分各樣本子集,直到無法進一步劃分,算法結束。正是因為ID3算法在每個非葉節點選擇信息增益最大的屬性作為測試屬性,從而保證了當前情況下的最有利拆分,使得樹的平均深度較小,有效地提高了分類效率。

假設訓練集S中包含了s個數據樣本,類別屬性中有m個不同的值Ci(i=1,2,…,m),第Ci類的樣本數記為si,則需要分析樣本的總信息熵為:

(1)

式中,Pi是任意樣本屬于Ci的概率,通常通過si/s得到。

設測試屬性A可以取k個不同的值{a1,a2,…,ak},按照屬性A可以將訓練集S劃分成k個子集{S1,S2,…,Sk},則第j(j=1,2,…,k)個子集Sj包含了訓練集S中屬性A取aj值的樣本,將它們作為從集合S的節點生長出來的新的葉節點。將子集Sj中類別為Cj的樣本數記為sij,得到按照測試屬性A進行樣本劃分的信息熵值為:

(2)

由公式(1)和(2)得到用測試屬性A劃分訓練集S后的信息增益(Gain)為:

Gain(A)=I(s1,s2,…,sm)-E(A)

(3)

E(A)值越小,則Gain(A)值越大,表示選擇測試屬性A進行分類能夠更好地提供信息,應當優先選擇該屬性進行分類,以減小分類的不確定程度。遞歸調用上述過程對訓練集S的k個分支進行劃分,通過信息增益進行選擇,便能夠將其他屬性作為節點的子節點和分支生成決策樹。

2 仿真實驗

2.1 飛行時間影響要素分析

為保證飛行質量,了解各個氣象要素對飛行時間的影響程度至關重要。根據預報員與飛行人員的研究,可以將能見度、云量和風速3個屬性作為基本屬性,構建模型分析晴天條件下能見度、云量和風速對飛行時間長短的影響。模型中的能見度、云量和風速的相互關系產生了多目標協同問題。對于能見度屬性,結合人工觀測與能見度儀數據,將大于等于飛機起飛標準的能見度值定為高能見度屬性值,小于起飛標準為低能見度屬性值;對于云量屬性,將大于等于6成定為多云,小于6成為少云;對于風速屬性,將大于等于13 m/s定為大風,小于13 m/s定為小風。飛行時間為數值型,需要對屬性進行離散化,將其劃分為“長”和“短”兩類。取其平均值作為分界點,大于平均值的屬于“長”類別,小于平均值的則屬于“短”類別。

經過離散化處理,得到50組數據集合如表1所示。

表1 氣象要素與飛行時間數據

2.2 信息增益計算與決策樹生成

根據公式(1),計算總信息熵,總記錄數為50,飛行時間“長”的數據有27,“短”的有23。

根據公式(1)和(2),計算每個測試屬性的信息熵。風速屬性值有“大”和“小”兩種。其中“大風”條件下,飛行時間為“長”的記錄為12,飛行時間為“短”的記錄為17,可表示為(12,17);“小風”條件下,飛行時間為“長”的記錄為15,飛行時間為“短”的記錄為6,可表示為(15,6)。則風速屬性的信息熵計算過程為:

云量屬性值有“多”和“少”兩種:其中“多云”條件下,飛行時間為“長”的記錄為3,飛行時間為“短”的記錄為12,可表示為(3,12);“少云”條件下,飛行時間為“長”的記錄為24,飛行時間為“短”的記錄為11,可表示為(24,11)。則云量屬性的信息熵計算過程為:

能見度屬性值有“高”和“低”兩種:其中“高能見度”條件下,飛行時間為“長”的記錄為19,飛行時間為“短”的記錄為5,可表示為(19,5);“低能見度”條件下,飛行時間為“長”的記錄為8,飛行時間為“短”的記錄為18,可表示為(8,18)。則能見度屬性的信息熵計算過程為:

根據公式(3),計算3個氣象要素屬性的信息增益分別為:

Gain(風速)=I(27,23)-E(風速)=0.0654

Gain(云量)=I(27,23)-E(云量)=0.1502

Gain(能見度)=I(27,23)-E(能見度)=0.1780

由此可見,能見度屬性的信息增益值最大,應選取它的兩個屬性值“高”和“低”作為根節點的兩個分支。

按照上述步驟對兩個分支進行劃分,計算信息增益值,循環進行直到沒有新的節點分支,則計算結束。得到的決策樹模型如圖1所示。

圖1 飛行時間決策樹模型

由決策樹模型能夠得到各類不同的決策規則。

3 結束語

ID3算法是決策樹算法中最典型的算法,文章通過編寫MATLAB程序,仿真實現了對現有數據的挖掘,分析了氣象要素對飛行時間的影響,有助于實現飛行保障的針對化管理。由于ID3算法偏向于選取高度分支屬性,而該選法并不一定全是最優屬性,因此仍有改進提升的空間。

主站蜘蛛池模板: 国产欧美专区在线观看| 久久影院一区二区h| 免费观看亚洲人成网站| 女同久久精品国产99国| 亚洲成a人在线播放www| 99国产精品国产高清一区二区| 国产精品福利一区二区久久| 国产成人欧美| 亚洲国产中文精品va在线播放| 免费高清a毛片| 色哟哟国产精品| 午夜视频免费一区二区在线看| 在线免费亚洲无码视频| 国产呦视频免费视频在线观看| 亚洲无线视频| 青青草国产精品久久久久| 免费播放毛片| 亚洲高清日韩heyzo| 色屁屁一区二区三区视频国产| 欧美影院久久| 精品第一国产综合精品Aⅴ| 国产福利大秀91| 国产亚洲视频在线观看| 婷婷综合缴情亚洲五月伊| 91精品人妻一区二区| 亚洲区视频在线观看| 欧美中文字幕一区| 精品久久久久无码| 亚洲国产中文在线二区三区免| 一级看片免费视频| 久久久久亚洲AV成人网站软件| 国产在线精品美女观看| 国内精品久久久久久久久久影视 | 久久婷婷五月综合色一区二区| 亚洲精品少妇熟女| 伊人91在线| 六月婷婷激情综合| 97久久精品人人做人人爽| 制服丝袜国产精品| 一级毛片在线播放| 在线免费a视频| 亚洲h视频在线| 成年A级毛片| 国产打屁股免费区网站| 亚洲三级a| 欧美成人h精品网站| a级毛片免费在线观看| 国产成人av一区二区三区| 18禁不卡免费网站| 欧美亚洲综合免费精品高清在线观看 | 日本成人一区| 国产精品美女免费视频大全| 伊人成人在线| 亚洲国产欧洲精品路线久久| 伊人久久大香线蕉成人综合网| 日韩欧美中文字幕在线韩免费| 亚洲无限乱码一二三四区| 国产va视频| 国产香蕉在线视频| 一本大道视频精品人妻| 国产永久免费视频m3u8| 亚洲自偷自拍另类小说| 野花国产精品入口| 亚洲伊人天堂| a在线观看免费| 重口调教一区二区视频| 国产福利影院在线观看| 网友自拍视频精品区| 国产欧美在线| 久久国产精品嫖妓| 欧美第九页| 伊人久久青草青青综合| yjizz视频最新网站在线| 欧美精品啪啪| 国产黑丝视频在线观看| 亚洲一级毛片在线观播放| 亚洲乱码精品久久久久..| 欧美精品三级在线| 精品亚洲欧美中文字幕在线看| 色偷偷av男人的天堂不卡| a天堂视频| 久久综合九九亚洲一区|