999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Hadoop的數(shù)據(jù)分析系統(tǒng)設(shè)計

2019-06-15 01:01:22贠佩晁玉蓉樊華崔超飛陳偉

贠佩 晁玉蓉 樊華 崔超飛 陳偉

摘要:Hadoop是一個分布式開源計算平臺,它以分布式文件系統(tǒng)HDFS和MapReduce為核心,為用戶提供系統(tǒng)底層細節(jié)透明的分布式基礎(chǔ)架構(gòu)。HDFS為分布式文件系統(tǒng)提供存儲環(huán)境,而MapReduce為分布式數(shù)據(jù)提供運算環(huán)境。其特點是高可靠性、高擴展性、高效性、高容錯性。

關(guān)鍵詞:Hadoop;HDFS;MapReduce

中圖分類號:TP311.13 文獻標識碼:A 文章編號:1007-9416(2019)03-0180-01

在巨量數(shù)據(jù)中,迅捷、快速地從數(shù)據(jù)中挖掘出有價值的信息并將其轉(zhuǎn)化為決策的依據(jù),將成為企業(yè)未來依據(jù)的關(guān)鍵因素。數(shù)據(jù)分析的重要性不言而喻,但隨著數(shù)據(jù)量的突飛猛進,數(shù)據(jù)處理中遇到難題也更加突出。如何從巨大的數(shù)據(jù)中提取有價值的信息,并分析深層寓意,進而實現(xiàn)可行性,已經(jīng)成為互聯(lián)網(wǎng)處理的重要問題。

1 Hadoop

Hadoop是一個可靠的分布式共享存儲系統(tǒng),HDFS用于數(shù)據(jù)的存儲,MapReduce用于數(shù)據(jù)分析和處理。HDFS運行于集群之上,以流式數(shù)據(jù)存儲超大文件;MapReduce是分布式數(shù)據(jù)處理模型和運行環(huán)境。

1.1 HDFS架構(gòu)

HDFS的框架采用主從架構(gòu),是由一個NameNode和多個DataNode組成。NameNode是中心節(jié)點,負責對客戶端文件的訪問和文件名字空間的管理。DataNode是一般節(jié)點,負責處理文件系統(tǒng)客戶端的讀寫請求和管理節(jié)點上的存儲,結(jié)構(gòu)圖如圖1所示。

1.2 MapReduce架構(gòu)

MapReduce包括一個主節(jié)點,多個子節(jié)點共同組成。客戶程序負責輸入/輸出,通過抽象的接口實現(xiàn)map和reduce,與其他參數(shù)共同構(gòu)成整體配置。應(yīng)用MapReduce的程序能夠運行在大型商用機集群,提供可靠容錯的并行處理級別的數(shù)據(jù),結(jié)構(gòu)圖如圖2所示。

2 Hadoop數(shù)據(jù)分析系統(tǒng)的設(shè)計

采用實時Scribe收集各個Datenode節(jié)點上數(shù)據(jù),數(shù)據(jù)采集完畢后,寫入到分布式HDFS,HDFS以流式數(shù)據(jù)的訪問模式存儲超大文件,MapReduce計算分析數(shù)據(jù)且HDFS以MapReduce提供底層文件系統(tǒng)的支撐。處理步驟如下:

(1)根據(jù)輸入數(shù)據(jù)的鍵值對,傳送到Mapper類的map函數(shù)。(2)map輸出鍵值對到緩沖內(nèi)存。(3)Reduce獲取Mapper記錄,產(chǎn)生另外鍵值對,輸出到HDFS中。

數(shù)據(jù)分析任務(wù)由集群來進行計算,將產(chǎn)生結(jié)果存入HBase進行可視化展示,由web服務(wù)器采用相應(yīng)的接口進行調(diào)用,采用由Thrift的接口對HBase進行訪問。

整個數(shù)據(jù)分析系統(tǒng)分別由數(shù)據(jù)收集模塊,Hadoop模塊、HBase模塊和報警模塊來構(gòu)成,具體結(jié)構(gòu)如圖3所示。

3 結(jié)語

根據(jù)海量數(shù)據(jù)處理中的問題,設(shè)計了基于Hadoop數(shù)據(jù)分析系統(tǒng)。系統(tǒng)從底層數(shù)據(jù)采集、數(shù)據(jù)存儲和計算、數(shù)據(jù)分析、系統(tǒng)監(jiān)控等方面提供對Scirbe和Hadoop集群指標(IO、Load)實時監(jiān)控的執(zhí)行,減輕了集群人員的壓力。

參考文獻

[1] Tom Wbite著.Hadoop權(quán)威指南[M].清華大學出版社,2011.

[2] 朱珠.基于Hadoop的海量數(shù)據(jù)處理模型的研究和應(yīng)用[D].北京:北京郵電大學圖書館,2007.

[3] 張華強.關(guān)系型數(shù)據(jù)庫與NoSQL數(shù)據(jù)庫[J].電腦知識與技術(shù),2011,7(20):4802-4804.

[4] 許春玲,張廣泉.分布式文件系統(tǒng)Hadoop HDFS與傳統(tǒng)文件系統(tǒng)Linux FS的比較分析[J].蘇州大學學報,2010,30(4):5-9+19.

[5] 張建勛,古志民.云計算研究進展綜述[J].計算機應(yīng)用研究,2010,27(2):429-433.

[6] 范波.基于MapReduce的結(jié)構(gòu)化查詢機制的設(shè)計與實現(xiàn)[D].成都:電子科技大學圖書館,2011.

Data Analysis System Based on Hadoop

YUN Pei,CHAO Yu-rong,F(xiàn)AN Hua,CUI Chao-fei,CHEN Wei

(Xianyang Normal University,Xianyang Shaanxi? 712000)

Abstract:Hadoop is actually a concrete implementation of a distributed file system. The core design of Hadoop's architecture is HDFS and MapReduce. HDFS provides storage for massive data, while MapReduce provides computation for massive data. HDFS features high fault tolerance, high throughput, large data sets and low hardware cost.

Key words:Hadoop; HDFS;MapReduce

主站蜘蛛池模板: 国产精品尤物在线| 亚洲精品视频免费| 欧美一道本| 少妇精品久久久一区二区三区| aⅴ免费在线观看| 国产精品免费入口视频| 国产美女在线免费观看| 亚洲美女操| 欧美一级黄色影院| 激情综合网激情综合| 日韩精品毛片| 免费va国产在线观看| 免费在线播放毛片| 狠狠色丁香婷婷综合| 精品综合久久久久久97超人该| www.亚洲国产| julia中文字幕久久亚洲| 伊在人亚洲香蕉精品播放| 91精品国产丝袜| 99色亚洲国产精品11p| 91精品国产一区自在线拍| 国产91在线|日本| 欧美日韩亚洲综合在线观看| 亚洲欧美不卡中文字幕| 人妻中文字幕无码久久一区| 97精品伊人久久大香线蕉| 免费无码AV片在线观看中文| 97成人在线视频| A级毛片高清免费视频就| 亚洲精品无码日韩国产不卡| 亚洲无线一二三四区男男| 伊人久综合| 欧美成人aⅴ| 久久婷婷色综合老司机| 国产精品亚洲va在线观看| 在线免费看黄的网站| 99久久免费精品特色大片| 一区二区无码在线视频| 国产欧美精品专区一区二区| 国产又粗又猛又爽| 精品欧美视频| 亚洲三级影院| 国产十八禁在线观看免费| 色综合天天综合| 在线观看国产黄色| 国产精品九九视频| 成人一级免费视频| 亚洲精品无码久久久久苍井空| 亚洲中文字幕在线观看| 67194亚洲无码| 婷婷五月在线| 亚洲成年人片| 欧美日韩免费| 狠狠色婷婷丁香综合久久韩国| 亚洲AV无码久久精品色欲| 波多野结衣中文字幕久久| 看你懂的巨臀中文字幕一区二区| 欧美精品在线免费| 欧美精品啪啪一区二区三区| 麻豆国产在线观看一区二区| 91免费在线看| 自拍偷拍一区| 国产成人高精品免费视频| 国产精品99久久久久久董美香| 色婷婷成人| A级毛片无码久久精品免费| 黄色网站在线观看无码| 国产精品无码AV中文| 无码精品福利一区二区三区| 人人妻人人澡人人爽欧美一区| 71pao成人国产永久免费视频| 亚洲一区二区约美女探花 | 无码免费视频| 国产成人h在线观看网站站| 国产乱人伦偷精品视频AAA| 大陆精大陆国产国语精品1024| 91精品国产自产在线老师啪l| 国产美女自慰在线观看| 亚洲二三区| 亚洲国产在一区二区三区| 亚洲美女视频一区| 欧美午夜久久|