999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Hadoop的Linux系統日志分析平臺的設計與實現

2018-12-28 20:41:40劉亮
科學與財富 2018年30期

摘要:本文以Hadoop大數據框架為基礎,將Hadoop框架與關聯規則分析法相結合,對Linux系統的日志文件進行挖掘與分析,對于提高Linux系統日志的存儲能力、分析效率具有重要意義。

關鍵詞:Linux系統;Hadoop平臺;日志分析平臺

一、引言

Linux系統是當前主流的操作系統之一,因其功能強大、性能穩定而成為大型服務器、數據庫服務器的主要支撐性操作系統。Linux系統具有非常強大且靈活的日志功能,無論是用戶的操作還是系統內核與程序所產生的各類信息,均能夠以日志的形式記錄下來,為用戶查詢歷史操作以及管理員全面掌控Linux系統的運行狀態提供重要依據[1]。Linux系統的日志隨著系統的長時間運行而不斷累積,其增長速度非??欤鄯e的日志文件會占用大量的系統硬盤存儲空間,而Linux系統中的syslog只負責將操作記錄與日志信息接收并存儲在日志文件中,無法對日志文件進行精細化管理與深度化應用,一方面會導致日志文件中的記錄不斷新增會導致日志文件過大,日志文件的存儲、組織與管理存在難度;另一方面日志中記錄的累加給傳統數據挖掘分析方法帶來了大數據量的挑戰,管理員或用戶在檢索、挖掘分析與應用日志文件時存在越來越大的難度[2]。Hadoop是當前應對大數據存儲、管理與應用的平臺,其HDFS為大數據存儲提供方法支撐,MapReduce為大數據分析與挖掘提供平臺支撐,將Hadoop應用到Linux系統日志文件管理與分析中,可以提高Linux系統日志的存儲能力與管理效率。

二、基于Hadoop的Linux系統日志分析平臺需求分析

Linux系統的日志文件中全面記錄了系統的運行狀態、錯誤信息等,對于挖掘與診斷Linux系統中存在的問題、解決系統存在的問題具有重要價值,為Linux系統的故障診斷與信息挖掘提供“有據可查”的綜合性線索。利用Hadoop大數據平臺存儲與管理Linux系統的日志文件,可以有效存儲Linux系統海量的日志文件,快速挖掘分析Linux系統日志文件中的潛在規律,當Linux系統遭到攻擊時,可以借助系統日志文件以及Hadoop系統快速尋找到攻擊者留下的痕跡[3]。基于Hadoop的Linux日志分析平臺需要能夠對導入到Hadoop平臺的日志數據進行清洗與過濾,對日志數據進行關聯規則分析,并對日志數據挖掘與分析結果進行數據展示。

三、基于Hadoop的Linux系統日志分析平臺設計

基于Hadoop的Linux系統日志分析平臺總體架構包括如下:

(1)基礎設施層

基礎設施層為存儲各類Linux系統日志文件數據以及Hadoop大數據平臺運行提供所依賴的基礎軟硬件環境與基礎硬件設備設施,包括存儲系統、網絡環境等。

(2)數據資源層

數據資源層為基于Hadoop的Linux系統日志分析平臺中的各類數據,包括用戶日志、程序日志、內核與系統日志等。數據資源層為基于Hadoop的Linux系統日志分析平臺提供豐富的數據支撐。

(3)服務資源層

服務資源層是基于Hadoop的Linux系統日志分析平臺的基礎服務支撐層,用于連接數據層與應用層,包括資源服務總線、各類服務接口、接口構建工具[4]。基于Hadoop的Linux系統日志分析平臺的服務資源層基于數據資源層提供的數據支撐,向應用層提供查詢檢索、統計分析等基礎服務。

四、基于Hadoop的Linux系統日志分析平臺實現

基于Hadoop的Linux系統日志分析平臺工作流程如圖1所示。

基于Hadoop的Linux系統日志分析平臺中主要的兩個核心功能包括日志數據預處理功能與關聯規則挖掘分析功能,其具體實現如下:

(1)日志數據預處理

Linux系統的Syslog協議提供了一種傳輸方式,允許一臺主機通過IP 網絡發送事件給事件的接收者(Syslog服務器)。Syslog的消息內容沒有一個統一的格式。Syslog協議是發送者與接收者之間的通信,不需要額外的協調機制。Syslog消息格式由三部分組成,如下是一個Syslog消息[5]:

<30>Oct 9 22:33:20 hlfedoraauditd[1787]: The audit daemon is exiting.

其中:

“<30>”是PRI 部分;

“Oct 9 22:33:20 hlfedora”是HEADER部分;

“auditd[1787]: The audit daemon is exiting.”是MSG部分。

由于各個日志記錄描述事件的格式不同,從日志記錄收集到的事件,經過解析后,必須要采用統一的格式,以便于進一步數據挖掘處理??梢圆捎脤θ罩痉诸惥幪柕姆椒?,對安全設備與其產生的日志統一進行標號,每一中日志的分類號為Signature ID,該安全設備的日志編號為Normalized ID。從而日志進行統一(Normalization)后的格式為:事件觸發時間(Frist time)、事件結束時間(Last time)、源地址(Source IP )、目的地址(Dest. IP)、源端口(Source Port)、目的端口(Dest. Port)、事件嚴重級別(Event Subtype)、唯一事件號(Signature ID),事件類別編號(Normalized ID)等等。使用對日志分類編號的統一化方法,可以簡化日志分析,避免針對日志內容分類的復雜性。

(2)關聯規則分析

關聯分析是在大規模數據集中尋找有趣關系的任務。這些關系可以有兩種形式:頻繁項集、關聯規則,頻繁項集(frequent item sets)是經常出現在一塊的信息日志集合,關聯規則(association rules)暗示兩種日志之間可能存在很強的關系。關聯分析的目標包括兩項:發現頻繁項集和發現關聯規則。首先需要找到頻繁項集,然后才能獲得關聯規則(正如前文所講,計算關聯規則的可信度需要用到頻繁項集的支持度)。Apriori算法是發現頻繁項集的一種方法。Apriori算法的兩個輸入參數分別是最小支持度和數據集。

五、結論

日志文件對于診斷和解決系統中的問題很有幫助,因為在Linux系統中運行的程序通常會把系統消息和錯誤消息寫入相應的日志文件,這樣系統一旦出現問題就會“有據可查”。此外,當主機遭受攻擊時,日志文件還可以幫助尋找攻擊者留下的痕跡,本文對基于Hadoop的Linux系統日志分析平臺的功能需求、總體框架設計以及主要功能的實現進行詳細闡述,為基于Hadoop的Linux系統日志分析平臺設計與實現提供參考。

參考文獻:

[1]王全民,王蕊,趙欽.Linux環境下的日志分析系統LASL[J].北京工業大學學報,2005(04):420-422.

作者簡介;;劉亮,長沙民政職業技術學院助教,研究生,碩士,研究方向:大數據技術與應用。

主站蜘蛛池模板: 色有码无码视频| 欧美中文字幕一区二区三区| 91精品国产一区| 国产人成午夜免费看| 怡春院欧美一区二区三区免费| 永久在线播放| 亚洲浓毛av| 小说区 亚洲 自拍 另类| 女人一级毛片| 国产va在线观看免费| 永久免费无码日韩视频| 国产精品尤物铁牛tv | 色国产视频| 五月婷婷伊人网| 久久久久夜色精品波多野结衣| 精品无码一区二区三区电影| 色婷婷电影网| 日韩av手机在线| 国产极品美女在线观看| 亚洲人成在线精品| 99国产精品免费观看视频| 国产欧美日韩另类| 五月天综合婷婷| 亚洲AⅤ无码日韩AV无码网站| 精品久久久久久久久久久| 国产高清国内精品福利| 91偷拍一区| 久一在线视频| 国产成人免费手机在线观看视频| 国产呦精品一区二区三区下载| 操操操综合网| 亚洲天堂网站在线| 99在线视频网站| 精品自窥自偷在线看| 一级毛片免费观看久| 日韩 欧美 小说 综合网 另类| 青青草综合网| 中文字幕不卡免费高清视频| 久久国产拍爱| 久草性视频| 亚瑟天堂久久一区二区影院| 久久久久亚洲精品成人网| 国产91在线免费视频| 亚洲欧美一级一级a| 日韩在线第三页| 国产综合欧美| 一级福利视频| 国产又爽又黄无遮挡免费观看| 国产亚洲精品97AA片在线播放| 白浆免费视频国产精品视频 | 日韩成人免费网站| 毛片卡一卡二| 亚洲IV视频免费在线光看| 国产精品无码久久久久久| 国产农村妇女精品一二区| 亚洲成人一区二区| 亚洲国产午夜精华无码福利| 91精品国产自产在线老师啪l| 999国产精品| 中国一级特黄视频| 亚洲欧美在线精品一区二区| 欧美日韩成人| 日韩欧美国产区| 亚洲AV人人澡人人双人| 激情无码视频在线看| 一区二区偷拍美女撒尿视频| 97国产在线观看| 在线人成精品免费视频| 国产男女免费完整版视频| 日本国产在线| 狠狠五月天中文字幕| 精品久久国产综合精麻豆| av免费在线观看美女叉开腿| 亚洲侵犯无码网址在线观看| 精品无码人妻一区二区| 欧美亚洲欧美| av无码一区二区三区在线| 亚洲人成影视在线观看| 国产三级国产精品国产普男人| 天堂在线亚洲| 亚洲第一区精品日韩在线播放| 国产v欧美v日韩v综合精品|