999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

海南電網海量機器數據實時流處理技術研究

2019-02-28 01:43:00馬超黃良毅張鐵剛李偉寧
中國管理信息化 2019年2期

馬超 黃良毅 張鐵剛 李偉寧

[摘 要]隨著信息時代的來臨,企業的日常運營越來越依賴于IT系統的日常運行。企業對信息系統的依賴越深,系統的復雜度越高,IT運維的難度也隨之加大,但由于受制于建設時期的技術制約,電力行業在大數據的分析處理方面已逐漸無法適應新環境、新運維模式下的管理要求。基于此,本文重點分析海南電網海量機器數據實時流處理技術。

[關鍵詞]海南電網;海量機器數據;實時流處理技術

doi:10.3969/j.issn.1673 - 0194.2019.02.033

[中圖分類號]TM76;TP311.13 [文獻標識碼]A [文章編號]1673-0194(2019)02-00-03

0 引 言

大數據是近年來受到廣泛關注的新概念,是指通過對大量來源復雜的多種數據進行高速地捕捉、發現和分析,用經濟的方法提取其價值的技術體系或技術架構。機器大數據是在大數據處理分類中,由機器直接生成的數據,也是發展最快、最為復雜,同時又極具商業價值的大數據組成形式,并且機器大數據具有數量大、增長速度快、復雜性高、多樣化等特點。除了來自服務器、存儲、網絡中的傳統IT數據以外,來自移動互聯網、物聯網中的大量非結構化數據也都屬于機器數據,能夠機器數據進行深入挖掘,充分利用數據價值,提升數據分析質量,保證IT系統穩定運行。

借助大數據流式處理技術,技術人員能夠對全網范圍內的主機、服務器、網絡設備、數據庫以及各種應用服務系統等產生的各類大數據進行規范采集,規范數據格式,統一持久化存儲,統一策略制定,并進行分析,實時和準實時的可視化呈現。

1 國內外海量數據的流處理技術

目前,國內外主流的海量機器數據流式處理技術包括數據攝取技術和序列化技術。

1.1 數據攝取技術

(1)Flume。Flume從其他應用程序收集機器數據,然后將這些數據送入Hadoop,功能比較強大,具有容錯性,還可以調優化及故障切換。

(2)Kafka。Kafka是一種高吞吐量的分布式發布訂閱消息系統,負責處理消費者規模網站中的所有動作流數據。

(3)Sqoop。企業在關系數據庫與Hadoop之間傳輸數據,Sqoop可以將數據導入Hive或HBase,并從Hadoop導出到關系數據庫管理系統(RDBMS)。

1.2 序列化技術

(1)Protocol Buffers。Protocol Buffers可以把結構化數據串行化,很適合做數據存儲或RPC數據交換格式。它可用于通訊協議、數據存儲的序列化結構數據格式。

(2)Avpro。這個Apache項目提供了數據序列化系統,擁有豐富的數據結構和緊湊格式。

1.3 ETL(萃取、轉換)技術

(1)Apache Falcon。Apache Falcon是一個面向Hadoop的數據處理和管理平臺,設計用于數據移動、數據管道協調、生命周期管理和數據發現。它使終端用戶可以快速地將數據及其相關業務上傳到Hadoop集群中。

(2)Crunsh。Crunch是一個用Go語言開發的基于Hadoop的ETL和特性的抽取工具,特點是速度快。

2 海量機器數據處理在海南電力的技術研究及運用

2.1 項目背景

海南電網海量日志平臺科技項目中的網絡環境比較復雜,在日常的運維過程中,IT管理員經常需要提取日志信息以追蹤系統故障及其他問題,但目前面臨的問題包括以下幾個方面。①海量的日志沒有進行集中管理,管理員需要登錄每一臺服務器,使用腳本命令或程序查看日志,操作煩瑣,效率低下,容易出錯。②只能做簡單搜索和統計,無法針對海量日志的多維度檢索和統計分析,不能滿足分析要求。③沒有實時監控和報警,如針對程序出錯、網絡設備故障、業務響應超時不能第一時間獲取報警信息并進行故障排查。④故障定位常常需要多個環節的日志進行關聯分析,各設備之間的日志是孤立分散的,無法關聯。⑤海量數據日志無法進行統一歸檔,不方便問題追溯。

目前,海量機器數據處理可以分為以下3個類型。①復雜的批量數據處理(Batch Data Processing),通常的時間跨度在數十分鐘到數小時之間。②基于歷史數據的交互式查詢(Interactive Query),通常的時間跨度在數十秒到數分鐘之間。③基于實時數據流的數據處理(Streaming Data Processing),通常的時間跨度在數百毫秒到數秒之間。

Spark Streaming提供了一套高效、可容錯的準實時大規模流式處理框架,將流式計算分解成一系列短小的批處理作業。整個流式計算根據業務需求可以對中間的結果進行疊加,或者存儲到外部設備,具備實時性和擴展性,而且吞吐量比Storm高出幾倍。

2.2 試驗驗證

2.2.1 模塊設計

模塊設計如圖1所示,包括數據接入、數據緩存。

2.2.2 模塊說明

日志易系統基于分布式集群設計,即使采用單機安裝,未來橫向擴展也非常容易。

①Nginx。用于日志易系統內模塊(Collector,Frontend,Yottaweb)負載均衡和容災。②Collector。處理Agent采集的數據,做轉換后存入消息隊列Kafka。③Zookeeper。用于存儲很重要的配置信息和模塊Leader選舉。④Kafka。分布式消息隊列。⑤Logriver。日志易的日志分析處理模塊。⑥Yottaweb。日志易的Web模塊。

2.2.3 測試方法

采集海南電網機器海量數據日志,數據接收端為單Collector,以5000 eps為基準值,每隔固定時間10分鐘,逐級增加2 000 eps,通過Manager界面收集測試數據,直到數據接收性能達到拐點。測試方法如表1所示。CPU總體變化趨勢如圖2所示。內存總體變化趨勢如圖3所示。I/O總體變化趨勢如圖4所示。

如圖2、圖3、圖4所示,5個凸起波紋分別為5次測試區間內的CPU/內存/磁盤IO的趨勢變化,單臺磁盤寫入峰值可達到50 000 KBps,并未達到性能拐點。

3 結 語

經過實際測試,在總量1 000萬條的海量數據,經過實時流處理,存在5類不同格式的樣本數據量環境。①系統響應時間小于3秒;②并發用戶數大于100個;③性能數據采集時間≤300秒;④資源利用率:CPU<50%、磁盤I/O<25%、網絡吞吐量<20%

主要參考文獻

[1]齊劍雄.分布式日志采集系統數據傳輸分析研究[J].軟件,2012(10).

[2]朱璐.淺談電網公司一體化、可視化、智能化的信息通信調度理論體系[J].中國新通信,2013(20).

[3]夏海元.面向Big Data的數據處理技術概述[J].數字技術與應用,2012(3).

主站蜘蛛池模板: 欧美三级视频网站| 亚洲天堂日韩在线| 亚洲第一视频网| 婷婷亚洲综合五月天在线| 亚洲系列无码专区偷窥无码| 成人免费视频一区二区三区| 亚洲成人黄色在线| 蜜臀av性久久久久蜜臀aⅴ麻豆| 免费又黄又爽又猛大片午夜| 一本色道久久88| 亚洲日本在线免费观看| 日本www色视频| 国产精品99r8在线观看| 蜜桃视频一区二区| 亚洲精品制服丝袜二区| 亚洲欧洲日韩国产综合在线二区| 波多野结衣视频一区二区| 噜噜噜久久| 99人妻碰碰碰久久久久禁片| 国产一区在线观看无码| 青青操国产视频| 97超级碰碰碰碰精品| 国模在线视频一区二区三区| 日本AⅤ精品一区二区三区日| 99在线视频免费| 国产精品.com| 中文字幕欧美日韩高清| 精品国产毛片| 午夜啪啪网| 嫩草国产在线| 欧美高清三区| 亚洲成人精品久久| 亚洲精品动漫| 精品伊人久久久大香线蕉欧美| 无码高潮喷水专区久久| 性欧美久久| 亚洲成人一区二区三区| 成人在线天堂| 亚洲日韩在线满18点击进入| 就去色综合| 亚洲AV一二三区无码AV蜜桃| 国产精品hd在线播放| 久久黄色免费电影| 亚洲成人黄色在线| 免费国产不卡午夜福在线观看| 精品乱码久久久久久久| 亚洲综合香蕉| 国产高清在线丝袜精品一区| 不卡国产视频第一页| 精品自拍视频在线观看| 曰韩人妻一区二区三区| 午夜无码一区二区三区在线app| 91口爆吞精国产对白第三集| 九九热视频在线免费观看| 五月丁香在线视频| 九九热在线视频| 欧美亚洲中文精品三区| 国产成人亚洲精品无码电影| 伊人91在线| 在线看国产精品| 97久久精品人人做人人爽| 国产一级片网址| 五月婷婷欧美| 国产成人艳妇AA视频在线| 欧洲一区二区三区无码| 福利在线一区| 中文字幕无线码一区| 久久99精品久久久久久不卡| 永久免费av网站可以直接看的| 四虎亚洲国产成人久久精品| 99在线视频精品| 亚洲欧美综合另类图片小说区| 看看一级毛片| 亚洲一区二区精品无码久久久| 国产一区二区视频在线| 成人av专区精品无码国产| 亚洲综合久久成人AV| 日本人妻一区二区三区不卡影院 | 99热6这里只有精品| 国产精品页| 日韩欧美中文| 日本91视频|