999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于決策樹的企業信息系統故障自動診斷分析方法

2017-04-13 06:42:42
電信科學 2017年3期
關鍵詞:數據庫故障信息

(國家電網公司信息通信分公司,北京 100761)

基于決策樹的企業信息系統故障自動診斷分析方法

金鑫,閆龍川,劉軍,張書林

(國家電網公司信息通信分公司,北京 100761)

目前,大型企業信息系統規模和復雜度快速增長,但對故障的診斷分析仍主要依賴傳統的人工經驗,這不僅耗時、耗力,還影響對故障的及時處理。針對這一問題,創新性地提出了基于決策樹的企業信息系統故障自動診斷分析方法,根據信息系統運行監控指標告警信息,實現對信息系統故障的自動診斷。利用某大型國有企業的實際生產運行數據,提取典型告警數據特征對該方法進行了驗證,并在R語言環境下對決策樹模型及其訓練方法進行了仿真和對比分析。實驗結果證明,該方法可以較為準確地實現故障自動快速診斷,有助于提高信息系統故障診斷分析效率。

自動診斷分析;信息系統故障;決策樹;R語言

1 引言

隨著企業信息系統規模的日益龐大、集成程度的不斷提高、技術架構的日益復雜、與企業經營管理和安全生產的緊密結合、應用頻度的大幅增加,故障影響的范圍廣、涉及的用戶多、帶來的損失大,且信息系統各組件存在耦合關系,使故障具有傳導特性,當一個組件或某項指標出現故障時,通常會引起其他組件或指標聯動異常,導致信息系統故障點難于定位排查。在企業信息系統故障處置過程中,如何在復雜的各類監控告警和異常現象中,快速準確定位出故障點,實現信息系統故障快速處置和業務及時恢復,是所有大型企業需要迫切解決的問題。傳統的信息系統故障分析處置主要依靠人工完成,處理時效和準確率受限于工程師的個人能力、經驗、水平,差異較大、分布不均、效率低下,難以適應大部分復雜企業信息系統的實際情況。

決策樹算法是一種通過對數據進行處理、利用歸納算法生成可讀的規則和決策樹,然后使用決策樹對新數據進行分析的典型分類方法,因其具有分類精度高、生成模式簡單、抗噪聲數據等優點,在數據挖掘中受到廣泛關注,在網絡設備、電網、光纖通信網等故障診斷中具有廣泛的研究與應用。參考文獻[1]設計了基于決策樹的網絡故障專家系統模型,參考文獻[2]提出了基于決策樹的變電站故障診斷知識的獲取與表示,參考文獻[3]設計了一種基于優化的決策樹數據挖掘算法的光纖網絡通信故障檢測系統,參考文獻[4]提出了采用故障診斷樹設計ASON故障診斷系統推理機的方案。

本文將決策樹算法理論與企業信息系統故障數據相結合,提出基于決策樹的企業信息系統故障的自動診斷分析方法,以期發掘出信息系統指標間的關聯規則,實現根據信息系統告警綜合信息快速定位故障點,提高信息系統故障的處置效率。利用某大型國有企業實際生產運行中產生的信息系統故障及告警數據,提取典型告警特征和故障分類特征,采用決策樹生成算法,在R語言環境下搭建仿真實驗平臺,驗證該方法的實現效果和應用價值。

2 運行指標選擇及故障類型

實際生產中,企業級大型信息系統需應對高并發訪問、海量數據處理、高可靠性運行等一系列問題,還需實現高性能、高可用性、易伸縮、可擴展、安全等各種技術架構目標[5]。信息系統一般包括應用服務器、數據庫服務器、緩存服務器、負載均衡、集群、存儲服務器、文件系統服務器、搜索引擎服務器等部分,典型信息系統架構如圖1所示。

為便于對信息系統運行指標的研究、選取和對信息系統架構的分析,大型信息系統切分通常有兩種方式:分層和分割。分層方式是將信息系統在橫向維度切分,通過上層對下層的依賴和調用組成完整的系統,有利于信息系統分開層次界面、清晰邏輯結構;分割方式是將信息系統在縱向方面切分,將不同功能和服務分割開,包裝成高內聚、低耦合模塊,有利于不同模塊的分布式部署。本文立足于通用信息系統的故障自動診斷分析方法,盡量弱化不同信息系統間的差異,且考慮到信息系統故障時產生的逐級傳導效應,故采用分層方式對典型信息系統結構進行簡化處理。如上,可將信息系統分為業務層、應用服務層、數據層3個層次,典型信息系統分層的架構如圖2所示。

圖1 典型信息系統架構

圖2 典型信息系統分層的架構

通過對信息系統各層次進行細化,分析各層的主要構成組件和運行指標,并對生產運行中信息系統故障產生的主要告警數據以及定位到的信息系統故障點數據進行歸納,具體見表1。本文將從表1中擇優選取運行指標和故障點類型。

表1 信息系統各分層的運行指標及故障點

3 決策樹算法

機器學習中,決策樹是一個預測模型,是一種依托于分類、訓練的預測樹,并能根據已知進行預測和歸類。決策樹算法具有規則清晰、便于理解的特點。經典的決策樹算法有ID3(iterative dichotomiser 3,迭代二叉樹 3代)算法、C4.5算法和 CART(classification and regression tree,分類回歸樹)算法。

ID3算法的核心思想是自頂向下地貪婪搜索遍歷可能的決策樹空間構造決策樹,以信息增益度量屬性選擇,選擇分裂后信息增益最大的屬性進行分裂,即遞歸地選擇分類能力最強的特征對數據進行分割。

一個屬性的信息增益就是由于使用這個屬性分割樣例而導致的期望熵降低,一個屬性A相對樣例集合S的信息增益Gain(S,A)=集合S的經驗熵-屬性A給定情況下S的經驗條件熵,計算式可表示為:

其中,V(A)是屬性 A所有可能值的集合,S是樣本集合,SV是集合S中屬性A的值為V的子集,即Gain(S,A)是由于給定屬性A的值而得到的關于目標函數值的信息。

ID3算法的目的在于減少樹的深度,但是忽略了葉子數目的研究,C4.5算法是對ID3算法的改進,在預測變量的缺值處理、剪枝技術、派生規則等方面做了較大改進。C4.5算法采用增益比率(GainRatio)進行屬性選擇,增益比率度量是用增益度量 Gain(S,A)和分裂信息度量SplitInformation(S,A)來共同定義的,可表示為:

其中,分裂信息度量被定義為(分裂信息用來衡量屬性分裂數據的廣度和均勻性):

其中,S1到Sc是c個值的屬性A分割集合S形成的c個樣例子集,分裂信息實際上就是集合S關于屬性A的各值的熵。

還可以使用CART算法生成決策樹,CART算法采用一種二分遞歸分割技術,將當前的樣本集分成兩個子樣本集,使得生成的每個非葉子節點都有兩個分支,生成的決策樹是二叉樹。CART算法將每個屬性的所有劃分按照能減少的雜質量進行排序,雜質減少被定義為劃分前的雜質量減去劃分后每個節點的雜質量再乘以劃分所占樣本比率之和,使用雜質度量方法(基尼指數 Gini)選擇最優特征,一個節點B的Gini不純度定義為:

其中,k是類,c是類別集中因變量數目,pk是觀測點中屬于k類的概率。

決策樹算法構造決策樹來發現數據中隱藏的分類規則,決策樹構造的輸入是一組帶有類別標記的例子,構造的結果是一棵二叉樹或多叉樹,構造精度高、規模小的決策樹是決策樹算法的核心內容。決策樹構造可以分兩步進行:決策樹的生成和決策樹的剪枝。本文研究使用C4.5算法和CART算法。

4 實驗及應用

本文收集某大型國有企業實際生產運行中關于應用系統或數據庫方面的信息系統故障分析報告,從中采集故障告警數據及故障點,對數據進行梳理、清洗,選取典型的信息系統故障運行指標告警特征和故障點特征,分別采用C4.5算法和CART算法生成決策樹,使用R語言程序包進行仿真實驗,利用70%的故障數據完成了對決策樹的訓練,利用30%的故障數據完成了故障自動診斷的測試。

經研究,選取的故障運行指標告警共18項,包括:在線用戶數和健康運行時長指標中斷告警、頁面探測異常告警、系統無法正常使用告警、應用節點日志告警、線程超時或阻塞告警、業務量大告警、應用服務內存告警、應用服務CPU告警、應用無法連接數據庫告警、數據庫ping不通告警、數據響應慢告警、數據負載高告警、數據庫內存告警、數據庫監聽服務告警、數據庫歸檔空間告警、數據庫密碼不可用告警、數據庫SQL語句效率告警;選取的信息系統故障點數據共12項,包括:數據庫歸檔空間問題、數據庫監聽服務異常問題、數據庫密碼失效問題、數據庫響應問題、數據庫SQL語句不合理問題、數據庫服務器內存問題、中間件無法連接問題、中間件內存問題、應用服務線程問題、應用服務業務量大問題、應用服務器內存問題、應用服務器CPU問題。

采用R語言環境下的rpart分組實現,利用sample對數據源進行抽樣分割,形成訓練集數據和測試集數據,利用rpart.control設置生成樹的交叉驗證折數、生成樹的深度、最小分支節點數、復雜度等生成樹參數,利用rpart進行因變量和自變量的特征選取、算法選取以及生成樹生成,利用prune對生成樹進行剪枝修正,利用 rpart.plot描繪生成樹,利用 predict進行預測,利用 sum、table等公式計算預測正確率。利用C4.5算法和CART算法生成的決策樹分別如圖3和圖4所示。

圖3 C4.5算法生成的決策樹

圖4 CART算法生成的決策樹

由圖3可知,C4.5算法生成的決策樹規則認為,在所有輸入告警中,分類效果最好的告警依次是:數據庫SQL語句告警、數據庫響應慢告警、在線用戶數和健康運行時長指標中斷告警。在故障自動診斷過程中,當用戶將信息系統各類告警信息輸入后,決策樹將依據生成規則,給出故障點預測結果。

由圖4可知,CART算法生成的決策樹規則認為,在所有輸入告警中,分類效果最好的告警依次是:數據庫SQL語句告警、數據庫服務器內存告警情況、應用服務業務使用量情況、數據庫監聽服務運行情況。在故障自動診斷過程中,當用戶將信息系統告警輸入后,決策樹將依據生成規則,給出故障點預測結果。

對兩種算法的預測正確率進行對比,對比結果見表2。由表2可知,兩種算法的預測正確率隨復雜度cp存在相同的變化規律,即cp越低,預測正確率越高。在cp=0.001的場景下,C4.5算法的預測正確率相較CRAT算法略高,更宜于應用。

表2 不同算法的訓練數據預測正確率對比

此外,數據源質量和數量對預測正確率影響很大,準確可靠、豐富全面的數據源對于訓練出符合規則的、正確的、智慧的決策樹至關重要,正確的決策樹才能做出合理的預測,給出故障點診斷結果。

5 結束語

本文創新性地將決策樹算法引入信息系統故障自動診斷,能夠實現良好的故障自動診斷分析效果。實驗證明,基于該方法可以實現根據信息系統運行指標告警數據進行故障自動診斷分析,還可以在便攜式計算設備上實現秒級決策,有效節約人力成本,大幅縮減故障定位時間,對信息調度監控故障處置輔助診斷和決策具有廣闊的應用前景。

在后續的工作中,將繼續提升信息系統故障告警數據的數量和質量,優化告警特征選擇和決策樹算法,提高信息系統故障自動診斷的準確性。并引入故障歷史處置操作數據,研究故障處置操作自動推薦算法,實現企業信息系統故障診斷分析與處置的一體化處理,推進此方法在企業信息系統故障處置中的實用化水平和自動化程度。

[1] 曲朝陽,高宇峰,聶欣.基于決策樹的網絡故障診斷專家系統模型[J].計算機工程,2008,34(22):215-217. QU Z Y,GAO Y F,NIE X.Network fault diagnosis expert system model based on decision tree[J].Computer Engineering,2008, 34(22):215-217.

[2]白建社,樊波,黃文華,等.基于決策樹的變電站故障診斷知識表示與獲取[J].電力系統及其自動化學報,2004,16(2):5-8. BAIJS,FAN B,HUANG W H,etal.Knowledge representation and acquisition based on decision tree for substation faultdiagnosis[J]. Proceedings of the EPSA,2004,16(2):5-8.

[3] 黃勇,胡連城,劉增良.基于決策樹算法的工業光纖網絡通信故障檢測系統[J].現代電子技術,2014(20):134-136. HUANGY,HUL C,LIUZ L.Industrial fibernetwork communication fault detection system based on decision tree algorithm[J].Modern Electronics Technique,2014(20):134-136.

[4]車雅良,林初善,潘青,等.ASON網絡故障診斷系統推理機的設計與研究[J].廣東通信技術,2015,35(3):64-67. CHE Y L,LIN C S,PAN Q,et al.Design and research of ASON network fault diagnosis system inference engine[J].Guangdong Communication Technology,2015,35(3):64-67.

[5] 李智慧.大型網站技術架構:核心原理與案例分析[M].北京:電子工業出版社,2013. LI Z H.Large website technology architecture:core principles and case studies[M].Beijing:Publishing House of Electronics Industry,2013.

Enterprise information system autom atic fault diagnosis and analysis method based on decision tree

JIN Xin,YAN Longchuan,LIU Jun,ZHANG Shulin
State Grid Information&Telecommunication Branch,Beijing 100761,China

With the rapid growth of the scale and complexity of enterprise information systems,traditional fault diagnosis and analysis methods relying on human experiences and manual operations cost more and more labor and time.To solve this problem,an automatic algorithm was proposed.The algorithm exploits information from system operation monitoring indicators and alarm data,based on decision tree,to automatically diagnose and analyze faults of enterprise information systems.The algorithm was verified,and the decision tree model and training method was simulated and analyzed comparatively under R language environment,using alarm data extracted from real operation data of a typical large-scale enterprise system.The experiment results show that this algorithm is able to achieve fast automatic fault diagnosis accurately,and is much helpful on improving efficiencies of information system fault processing.

automatic diagnosis analysis,fault of information system,decision tree,R language

TP319

:A

10.11959/j.issn.1000-0801.2017058

金鑫(1985-),女,國家電網公司信息通信分公司工程師,主要從事信息運維工作。

閆龍川(1979-),男,國家電網公司信息通信分公司高級工程師,主要從事信息運維工作。

劉軍(1970-),男,國家電網公司信息通信分公司高級工程師,主要從事信息通信運維及管理工作。

張書林(1968-),男,國家電網公司信息通信分公司工程師,主要從事信息通信運維及管理工作。

2016-10-20;

2017-02-24

猜你喜歡
數據庫故障信息
故障一點通
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
數據庫
財經(2017年2期)2017-03-10 14:35:35
奔馳R320車ABS、ESP故障燈異常點亮
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
故障一點通
江淮車故障3例
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
主站蜘蛛池模板: 99精品在线看| 久久精品视频一| 无码aaa视频| 国产在线一区二区视频| 玖玖精品在线| 国产中文一区a级毛片视频| 欧美激情,国产精品| 日韩中文精品亚洲第三区| 欧美一区二区精品久久久| 中文字幕永久在线观看| 欧美另类第一页| 亚洲成AV人手机在线观看网站| 日韩在线2020专区| 久久大香伊蕉在人线观看热2| 欧美成人免费一区在线播放| 亚洲一区免费看| 日韩123欧美字幕| 青青青视频免费一区二区| 午夜影院a级片| 久久动漫精品| 国产欧美网站| 亚洲综合日韩精品| 国产91丝袜在线播放动漫 | 国产91高跟丝袜| 亚洲一区二区三区麻豆| yjizz国产在线视频网| 成人国内精品久久久久影院| 人禽伦免费交视频网页播放| 久久综合色天堂av| 国产激情第一页| 高清不卡毛片| 2048国产精品原创综合在线| 色偷偷一区二区三区| 精品国产一区91在线| 国产99在线观看| 国产网站黄| 亚洲国产成人无码AV在线影院L| 伊人成人在线视频| 日韩国产一区二区三区无码| 91青青视频| 亚洲一级毛片免费观看| 99热这里只有精品久久免费| 综合色亚洲| 亚洲一级无毛片无码在线免费视频| 国产精品 欧美激情 在线播放| 国产中文在线亚洲精品官网| 香蕉eeww99国产在线观看| 欧美日韩免费观看| 午夜久久影院| 小说区 亚洲 自拍 另类| 国产成人乱无码视频| 日本午夜网站| 爱做久久久久久| 青青草国产一区二区三区| 国产日韩欧美中文| 国产丝袜一区二区三区视频免下载| 天天视频在线91频| 91www在线观看| 国产不卡在线看| 免费99精品国产自在现线| 久久国产精品嫖妓| 中文字幕无码中文字幕有码在线| 91原创视频在线| 成人综合网址| 激情综合图区| 国产主播在线观看| 国产乱人伦精品一区二区| 久久情精品国产品免费| 久久精品国产91久久综合麻豆自制| 国产69囗曝护士吞精在线视频| 国产视频欧美| 国产欧美一区二区三区视频在线观看| 久久99国产综合精品1| 国产精品视频白浆免费视频| 亚洲人成网站18禁动漫无码| 亚洲日本韩在线观看| 日本午夜影院| 欧类av怡春院| 亚洲V日韩V无码一区二区| 日本a∨在线观看| 亚洲高清中文字幕| 亚洲av无码人妻|