999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

列車仿真技術中基于屬性矩陣圖的故障分析決策樹算法

2018-01-02 01:56:29
城市軌道交通研究 2017年12期
關鍵詞:數據挖掘故障

王 超

(中國鐵道科學研究院通信信號研究所,100081,北京//助理研究員)

列車仿真技術中基于屬性矩陣圖的故障分析決策樹算法

王 超

(中國鐵道科學研究院通信信號研究所,100081,北京//助理研究員)

根據數據挖掘技術分析列車運行大數據的特點,提出了基于屬性矩陣圖的決策樹算法。結合某列車仿真數據,詳細闡述了計算屬性度量、構建屬性矩陣圖模型及構造決策樹的具體過程。由該決策樹算法的故障分析結果可見,基于屬性矩陣圖決策樹算法能準確地對故障問題進行分類歸納,為故障預測提供可靠依據。

屬性矩陣圖;決策樹算法;列車仿真;故障分析

列車運行時,其車載設備每時每刻都要產生大量的數據。傳統數據處理方法是先由車載設備存儲日記,再由人工對文本格式的日志進行下載,這即便耗費了大量的時間和精力,也只是分析了部分數據。因此有必要引入數據挖掘技術,通過決策樹模型在線分析處理列車運行數據,發現其中的關聯規則。這不僅能盡早發現列車存在的故障隱患,提高列車的運行效率,也能節省人工核對數據的成本,具有非常高的現實意義。為此,提出了基于列車仿真技術的數據挖掘系統方案。

1 數據挖掘系統

列車仿真系統的工作原理如圖1所示。

圖1 列車仿真系統原理圖

由圖1可見,數據挖掘系統是列車仿真系統的核心部分之一,主要負責處理來自于其他子系統的數據信息。通過反饋調整信息,并傳輸給各個子系統模塊,可有效地減少故障發生的概率,提高列車運行的效率。數據挖掘系統解決了傳統應用中對列車日志分析存在的重復耗時低效的問題,是一種自適應的智能學習系統。數據挖掘系統采用的決策樹算法決定了其處理能力的強弱。

2 決策樹算法

2.1 ID3算法

ID3算法是經典的決策樹算法,其核心是采用信息熵和信息增益的方法來劃分最佳決策樹分裂點。該算法也存在著問題:首先,ID3算法需要通過重復遍歷數據集來計算每個屬性的信息增益,故當數據集很大時,計算耗時會呈幾何級數量增長;其次,ID3算法不能對決策樹進行動態更新,處理實時數據時易造成預測信息增益的偏差;最后,ID3算法只能用來處理屬性元素為離散變量的問題。

2.2 基于屬性矩陣圖的決策樹算法

本文提出一種基于屬性矩陣圖決策樹算法,改進了ID3算法存在的問題。利用屬性矩陣圖決策樹算法能找出故障模式的規律,可發現列車運行過程中存在的隱患,能有效提高列車運行的安全性;通過動態構造決策樹算法,可實時處理列車運行的數據,能對可能遇到的故障模式進行預判。

2.2.1 構建屬性矩陣圖

對屬性節點的劃分決定了數據集的分裂方式。故基于屬性矩陣圖的決策樹算法只有實現對屬性節點合理劃分,才能對數據規則進行挖掘和預測。

劃分屬性節點時,以屬性度量來表示給予每個屬性的評價,只有獲得最好屬性度量的屬性才可作為分裂屬性。根據信息論,期望信息越小,信息增益就越大,相應的分裂屬性對確定整個系統劃分的作用就越大,所以采用熵值和信息增益來進行屬性度量。此處的熵值為整個數據集中屬性的不確定性。令x表示對數據集劃分的屬性不確定性集合,則x的熵值定義為

對于第i類屬性xi有:

式中:

E(x|x)i——屬性對整個系統的條件熵值;

f(x)——數據集中的平均信息量;

則屬性xi對整個數據集的信息增益為:

g(xi)=E(x)-E(x|xi),i∈(1,2,…,m)

現截取部分列車仿真平臺處理的車載數據,如表1所示。決策樹算法的核心問題就是分析故障數據,發現其中的規律,并對故障進行分析和預測。

由表1,經計算可得E(x)=0.880。表1中列車保護速度及列車實際速度為連續型數據,其他均為離散型數據。

由表 1,列車 ID(標識)屬性 Xi按 0x01、0x02、0x03 分別取 x1、x2、x3,則相應的條件熵值為:E(x1)=0.845,E(x2)=0.811,E(x3)=0.971;故有 E(x1|x2)=0.860。列車ID屬性對數據集的信息增益 g(列車ID)=E(x)-E(x|xi)=0.020。

同理,可分別算出其他離散型數據屬性(控制、駕駛、信標ID、SRP及BTM)的信息增益分別為:g(控制)=0.000 5;g(駕駛)=0.030 0;g(信標 ID)=0.019 5;g(SRP)=0.016 0;g(BTM)=0.001 8。

列車運行速度為連續型數據。本文采用一種基于速度窗口的方法來計算連續型數據屬性的信息增益。根據相關行業規范,根據不同的列車運行等級和運行模式,可將列車的運行速度劃分成不同等級。列車在不同運行速度等級下發生的故障往往具有類型一致性。根據這種特性,把列車的保護速度值和實際速度值分為3個速度窗口(速度單位為km/h)。在相應的速度窗口內,速度具有相同的屬性類別。由此計算可得 g(保護速度)=0.016 5 km/h,g(實際速度)=0.040 0 km/h。

表1 部分列車車載設備仿真數據

根據上述計算結果可見,列車實際速度的信息增益最大,因此,選取實際速度作為數據集的分裂點。為便于計算屬性的信息增益,需建立屬性矩陣圖模型以快速確定屬性類別的狀態和數量。根據表1數據,以列車實際速度作為數據集分裂點,構建屬性矩陣圖模型如圖2所示。

根據屬性矩陣的對應關系,可繼續計算下層節點分裂屬性的信息增益?,F以列車實際速度在[0,25]區間的數據集為例進行計算。根據動態信息圖,可以快速計算得出列車實際速度∈[0,25]數據集的熵值 E(實際速度[0,25])=0.720。

通過快速定位屬性矩陣圖中元素的統計值,可計算出在[0,25]內各屬性的條件熵值為E(0x1a)=0.65,E(0x1b)=0.91,E(信標 ID)=0.663,信標 ID 的信息增益 g(信標 ID)=E(實際速度∈[0,25])-E(信標 ID)=0.057;

以此類推,其余屬性的信息增益分別為:g(駕駛等級)=0.020,g(信標 ID)=0.057,g(列車 ID)=0.071,g(控制等級)=0;所以列車實際速度[0,25]的分裂屬性為列車ID。

圖2 根據案例數據建立的屬性矩陣圖

2.2.2 構造決策樹,進行故障分析

根據此方法依次計算信息增益判斷新的分裂點,構造決策樹如圖3所示。

圖3 根據仿真數據構建的決策樹

根據數據集構造的決策樹,可以得到4類故障分析結果:

(1)列車實際速度在[0,25]的范圍內,駕駛等級為PM模式,SRP未激活。

(2)列車實際速度在[0,25]的范圍內,駕駛等級為AM模式。

(3)列車實際速度在(25,60]的范圍內,列車保護速度為25。

(4)列車實際速度在(60,80]的范圍內,信標ID為0x1c。

可見,基于屬性矩陣圖決策樹算法能準確地對故障問題進行分類歸納,為故障預測提供可靠依據。

3 結語

數據挖掘技術現已廣泛應用在多個領域。城市軌道交通行業也在探索數據挖掘技術的應用方向。本文首次以數據挖掘技術為基礎,針對城市軌道交通列車運行中的大數據問題,提出了屬性矩陣圖決策樹算法,能準確地對故障問題進行分類歸納,為故障預測提供可靠依據。

[1] 王威.基于決策樹的數據挖掘算法優化研究[J].現代計算機,2012,(19):11.

[2] 王大玲,于戈,王國仁.基于概念層次樹的數據挖掘算法的研究與實現[J].計算機科學,2001,28(6):88.

[3] 胡笑蕾,胡華平,宋世杰.數據挖掘算法在入侵檢測系統中的應用[J].計算機應用研究,2004,21(7):88.

[4] 李良俊,張斌,楊明.一種基于模糊神經網絡的數據挖掘算法[J].計算機工程,2007,33(12):63.

[5] 孫亞,錢洪波,葉亮.數據挖掘算法在交通狀態量化及識別的應用[J].計算機應用,2008,28(3):738.

Application of Decision Tree Optimization Algorithm in Train Simulation Technology

WANG Chao

The data mining technology is used to analyze the large data generated during train operation,the decision tree algorithm isproposed based on attribute matrix graph.Combined with the simulation date of a train,the computing attribute matrix and the structure design of the decision tree optimization algorithm are elaborated.According to fault analysis result of the decision tree algorithm,this algorithm could classify the faults accurately and provide reliable basis for the prediction of metro faults.

attribute matrix graph;decision tree algorithm;train simulation;fault analysis

Author′saddress Signal& Communication Research Institute, ChinaAcademy ofRailway Sciences,100081,Beijing,China

N945.25;U391.99∶U27

10.16037/j.1007-869x.2017.12.025

2016-05-25)

猜你喜歡
數據挖掘故障
探討人工智能與數據挖掘發展趨勢
故障一點通
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
奔馳R320車ABS、ESP故障燈異常點亮
一種基于Hadoop的大數據挖掘云服務及應用
故障一點通
故障一點通
故障一點通
江淮車故障3例
主站蜘蛛池模板: 1024你懂的国产精品| 三级视频中文字幕| 国产最爽的乱婬视频国语对白| 精品国产中文一级毛片在线看| 亚洲成年人网| 亚洲高清免费在线观看| 欧美成一级| 六月婷婷综合| 国产福利拍拍拍| 久久久波多野结衣av一区二区| 亚州AV秘 一区二区三区| 久久77777| 亚洲第一成年免费网站| 一级一毛片a级毛片| 日本影院一区| 亚洲视频色图| 国产成年女人特黄特色毛片免| 欧美一级在线看| 亚洲午夜福利在线| 沈阳少妇高潮在线| 成人精品视频一区二区在线| 日韩国产欧美精品在线| 国产91导航| 亚洲人成影视在线观看| 国产av剧情无码精品色午夜| 成人精品亚洲| 久久久久亚洲精品无码网站| 精品综合久久久久久97| 在线观看视频99| 国产自在线拍| 日韩av高清无码一区二区三区| 5555国产在线观看| 91毛片网| 国产欧美精品一区aⅴ影院| 亚洲福利视频一区二区| 日韩黄色大片免费看| 精品午夜国产福利观看| 中文无码精品A∨在线观看不卡| 国产日韩欧美一区二区三区在线| 色国产视频| a毛片免费在线观看| 欧美有码在线| 亚洲天堂久久| 日韩中文无码av超清| 欧美黄色网站在线看| 久久91精品牛牛| 在线永久免费观看的毛片| 一本大道香蕉久中文在线播放| 看国产毛片| 免费99精品国产自在现线| 97超爽成人免费视频在线播放| 精品久久香蕉国产线看观看gif| 成人久久精品一区二区三区| 小13箩利洗澡无码视频免费网站| 91无码网站| 人妻夜夜爽天天爽| 国产在线精品网址你懂的| 中文字幕伦视频| 精品伊人久久久久7777人| 免费国产黄线在线观看| 97精品久久久大香线焦| 婷婷综合色| 日韩免费成人| 国产女人喷水视频| 自偷自拍三级全三级视频| 免费一级无码在线网站| 亚洲欧美在线看片AI| 国产丝袜啪啪| 欧洲日本亚洲中文字幕| 色欲色欲久久综合网| 亚洲一区黄色| 又污又黄又无遮挡网站| 男女精品视频| 成人一区专区在线观看| 综1合AV在线播放| 免费在线a视频| 人妻丰满熟妇av五码区| 欧美一级专区免费大片| 免费毛片在线| 老司国产精品视频| 青青操国产| 免费毛片在线|