999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數(shù)據(jù)和云計算環(huán)境下的Hadoop技術(shù)研究

2017-07-20 14:55:45張子妍
中國管理信息化 2017年13期
關(guān)鍵詞:云計算大數(shù)據(jù)

張子妍

[摘 要] 大數(shù)據(jù)與云計算技術(shù)都已經(jīng)成為信息社會最重要的技術(shù)之一, Hadoop是大數(shù)據(jù)與云計算時代背景下最熱門的技術(shù)之一, Hadoop的相關(guān)技術(shù)對學(xué)術(shù)研究有重要影響。本文主要對Hadoop技術(shù)進(jìn)行了研究,首先介紹了大數(shù)據(jù)和云計算的概念,其次介紹了Hadoop的概況以及相關(guān)技術(shù)的原理,比如核心技術(shù)HDFS和MapReduce;再次分析了目前Hadoop所面臨的安全問題,然后描述了Hadoop的發(fā)展瓶頸并提出改進(jìn)方案;最后進(jìn)行了總結(jié)并展望Hadoop、Spark和Storm三者相互結(jié)合,混合架構(gòu)將是未來發(fā)展的方向。

[關(guān)鍵詞] 大數(shù)據(jù);云計算;Hadoop

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2017. 13. 076

[中圖分類號] TP311.13;TP333 [文獻(xiàn)標(biāo)識碼] A [文章編號] 1673 - 0194(2017)13- 0177- 03

1 概 述

大數(shù)據(jù)是指通過新的信息處理技術(shù)和方式,對數(shù)據(jù)進(jìn)行收集、存儲、分析以及處理等,并且能夠利用全新的數(shù)據(jù)處理技術(shù)和方式產(chǎn)生相關(guān)聯(lián)的預(yù)測效應(yīng),協(xié)助決策,發(fā)揮海量快速增長數(shù)據(jù)的價值。

云計算是指一種特殊的計算模式,它將計算任務(wù)分布在資源池中,池中的資源包括計算服務(wù)器、存儲服務(wù)器、寬帶資源,使用戶能夠按需獲取各種服務(wù)。

大數(shù)據(jù)與云計算之間相得益彰,相輔相成,因為云計算本質(zhì)上是數(shù)據(jù)處理技術(shù),其核心是業(yè)務(wù)模型,大數(shù)據(jù)是云計算的延伸,是云計算的資產(chǎn)。

目前,海量非結(jié)構(gòu)化的數(shù)據(jù)分析處理需一種高效并行的編程模型,此時Apache項目基金會研發(fā)的Hadoop迅速崛起,Hadoop主要用來進(jìn)行大數(shù)據(jù)分析處理。Hadoop的出現(xiàn)解決了大數(shù)據(jù)并行計算、存儲、管理等關(guān)鍵問題,這樣用戶即使對分布式底層細(xì)節(jié)不了解,也可以開發(fā)分布式程序。Hadoop得到了廣泛認(rèn)可,其優(yōu)點是不容忽視的,主要有:高擴(kuò)展性、低成本、高效率、高可靠性。

2 Hadoop相關(guān)的技術(shù)

Hadoop可以部署在廉價機(jī)器上的處理海量文件存儲與并行計算的云計算開發(fā)平臺。Hadoop由HDFS、MapReduce、HBase、Hive、Zookeeper、Pig、Ambari、Sqoop等組成,其中主要部分是HDFS和MapReduce。

2.1 HDFS

HDFS是構(gòu)建在PC服務(wù)器上的高度容錯的分布式文件系統(tǒng),目的是用于海量數(shù)據(jù)的處理。HDFS的架構(gòu)形式是主從架構(gòu),HDFS的元數(shù)據(jù)服務(wù)器和數(shù)據(jù)塊服務(wù)器命名為NameNode和DataNode。

NameNode是一個中心服務(wù)器,是HDFS的核心結(jié)構(gòu),負(fù)責(zé)客戶端對文件的訪問以及管理文件系統(tǒng)的名字空間,存儲HDFS分布式文件系統(tǒng)的元數(shù)據(jù)信息, NameNode可判斷DataNode是否處在工作狀態(tài),并管理著DataNode上的分塊信息。

DataNode負(fù)責(zé)管理其所在的節(jié)點上的所有數(shù)據(jù),能夠根據(jù)用戶的請求來查詢數(shù)據(jù),周期性地與NameNode通信來告知自己保存的數(shù)據(jù)塊信息。

2.2 MapReduce

MapReduce設(shè)計之初是為了處理一些互聯(lián)網(wǎng)數(shù)據(jù),MapReduce有簡單的接口和透明的編程環(huán)境,極大地節(jié)省了開發(fā)周期。MapReduce通過處理大量數(shù)據(jù)來精簡和優(yōu)化數(shù)據(jù)集,以便將數(shù)據(jù)集載入到數(shù)據(jù)庫管理系統(tǒng)中。

MapReduce也采用了主從架構(gòu),將數(shù)據(jù)處理任務(wù)分為兩大過程,分別為:Map過程和Reduce過程。Map過程的任務(wù)主要為數(shù)據(jù)的過濾處理,Reduce過程的任務(wù)主要為數(shù)據(jù)的聚集處理。在Map過程中,第一,要將輸入的數(shù)據(jù)集分成若干數(shù)據(jù)塊,再為每一個數(shù)據(jù)塊分配一個Map小任務(wù);第二,將這些任務(wù)分配到集群中的各個節(jié)點上,此時在計算過程中會出現(xiàn)一個數(shù)據(jù)集合(中間結(jié)果);第三,將這些數(shù)據(jù)集合進(jìn)行排序再產(chǎn)生一個新的數(shù)據(jù)集合,此時新的數(shù)據(jù)集合中的數(shù)據(jù)都具有相同的鍵值;第四,進(jìn)入Reduce過程,產(chǎn)生最終結(jié)果,并輸出到HDFS中。

2.3 Hadoop中的其他技術(shù)

Hadoop生態(tài)系統(tǒng)除了有HDFS、MapReduce之外還有其他相關(guān)技術(shù):

(1)HBase

HBase是用于服務(wù)海量數(shù)據(jù)的存儲以及快速讀寫,它可以通過添加節(jié)點來進(jìn)行線性的擴(kuò)展,但是卻不支持向后擴(kuò)。

(2)Hive

Hive是構(gòu)建在Hadoop之上的數(shù)據(jù)倉庫基礎(chǔ)架構(gòu)。可實現(xiàn)數(shù)據(jù)的提取、轉(zhuǎn)化、加載等功能。

(3)Zookeeper

Zookeeper分布式協(xié)調(diào)服務(wù)是由許多服務(wù)器節(jié)點組成的,其目的是對Hadoop集群的運維進(jìn)行管理。

(4)Pig

Pig可為用戶提供多種接口,用于查詢大型半結(jié)構(gòu)化的數(shù)據(jù)集,為大型數(shù)據(jù)提供了一個高層次的抽象,是大數(shù)據(jù)分析平臺。

(5)Ambari

Ambari是一個基于Web的管理工具,可快速部署、監(jiān)控以及管理集群。

(6)Sqoop

Sqoop是在Hadoop系統(tǒng)與傳統(tǒng)的數(shù)據(jù)庫間進(jìn)行數(shù)據(jù)交換的工具,它是基于MapReduce來對數(shù)據(jù)進(jìn)行操作和處理的。

Hadoop中各個子項目在云計算大數(shù)據(jù)處理中扮演著不同的角色,以保證底層海量數(shù)據(jù)可以為頂層應(yīng)用發(fā)揮最大作用,具體架構(gòu)如下所示。

3 Hadoop的安全問題

Hadoop項目是近期較流行的云計算和大數(shù)據(jù)分析框架,其安全問題也受到越來越廣泛的重視。

3.1 缺乏安全授權(quán)機(jī)制

當(dāng)用戶掌握數(shù)據(jù)塊的Block ID后就可不通過NameNode的服務(wù)權(quán)限和身份認(rèn)證,訪問相應(yīng)的DataNode,也可以隨意啟動假的DataNode和TaskTracker,對于JobTracker,用戶可以任意修改其他作業(yè),并不受限制。

3.2 缺乏用戶以及服務(wù)器的安全認(rèn)證機(jī)制

在缺乏安全認(rèn)證的情況下,惡意用戶都可以冒充其他用戶,并非法訪問集群、修改JobTracker狀態(tài)、任意提交作業(yè),惡意用戶可以冒充合法服務(wù)器接受JobTracker和NameNode發(fā)布的任務(wù)或數(shù)據(jù)。

4 Hadoop的瓶頸與改進(jìn)

4.1 實時性處理

Hadoop采用的主要思想是“分而治之”,對大數(shù)據(jù)的計算進(jìn)行分解,接下來交由眾多的計算機(jī)節(jié)點分別完成,最后統(tǒng)一匯總計算結(jié)果。然而Hadoop結(jié)構(gòu)在處理實時性要求較高的業(yè)務(wù)時,卻產(chǎn)生了瓶頸。

Storm是由Twitter公司開發(fā)的,是一個開源分布式的,容錯的實時計算系統(tǒng),提供良好的實時性。將Storm的實時流處理和Hadoop的批處理進(jìn)行融合集成,會提高集群的處理性能、及穩(wěn)定性和擴(kuò)展性。既可以支撐增量的實時流處理,也可以實現(xiàn)批量處理的方式,通過擴(kuò)展數(shù)據(jù)存儲層以及增強(qiáng)高可用性,進(jìn)一步擴(kuò)展大數(shù)據(jù)業(yè)務(wù)場景。文獻(xiàn)[3]中提出一種基于Storm和Hadoop的新型大數(shù)據(jù)處理方案,將Storm的實時流處理與Hadoop的批處理進(jìn)行融合集成,提高集群的性能。

4.2 MapReduce算法

MapReduce的缺陷主要有三點,第一,僅支持?jǐn)?shù)據(jù)密集型運算,不支持任務(wù)密集型計算;第二,不支持顯示的迭代計算;第三,處理緊耦合數(shù)據(jù)效率低。Spark的使用可以很好地改善上述不足。

Spark是2009年美國加州大學(xué)伯克利分校研發(fā)的,立足于內(nèi)存計算,增強(qiáng)了多迭代批量處理能力,提高了大數(shù)據(jù)處理的時效性。其核心技術(shù)是彈性分布式數(shù)據(jù)集(RDD),該框架包括內(nèi)存計算、迭代計算、流式計算批處理計算,數(shù)據(jù)查詢分析計算以及圖計算,是MapReduce模型的代替模型。Spark支持單節(jié)點和多節(jié)點集群,可以在Hadoop文件系統(tǒng)中并行運行,通過Mersos第三方集群框架可以支持。

5 結(jié) 語

大數(shù)據(jù)和云計算的快速發(fā)展,作為應(yīng)用平臺的Hadoop起到了至關(guān)重要的作用,但是Hadoop的缺陷也是不容忽視的。Hadoop今后的發(fā)展方向可能著重和Spark、Storm三者完美結(jié)合,混合架構(gòu),各顯神通。由于Hadoop的兼容性很好,可以很容易地同Spark和Storm相結(jié)合,以改進(jìn)Hadoop在時效性、流處理、圖處理迭代式計算上的不足。

主要參考文獻(xiàn)

[1]胡俊,胡賢德,程家興.基于Spark的大數(shù)據(jù)混合計算模型[J].計算機(jī)系統(tǒng)應(yīng)用,2015,24(4):214-218

[2]付東華. 基于HDFS的海量分布式文件系統(tǒng)的研究與優(yōu)化[D].北京:北京郵電大學(xué),2012.

[3]繆璐瑤. Hadoop安全機(jī)制研究[D].南京:南京郵電大學(xué),2015.

猜你喜歡
云計算大數(shù)據(jù)
志愿服務(wù)與“互聯(lián)網(wǎng)+”結(jié)合模式探究
云計算與虛擬化
基于云計算的移動學(xué)習(xí)平臺的設(shè)計
大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
新聞世界(2016年10期)2016-10-11 20:13:53
實驗云:理論教學(xué)與實驗教學(xué)深度融合的助推器
云計算中的存儲虛擬化技術(shù)應(yīng)用
科技視界(2016年20期)2016-09-29 13:34:06
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
科技視界(2016年20期)2016-09-29 10:53:22
數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 日本黄色a视频| 国产成人久久综合777777麻豆| 色综合天天视频在线观看| 中文字幕免费播放| 99久久亚洲精品影院| 日韩在线成年视频人网站观看| 国产美女叼嘿视频免费看| 国产区成人精品视频| 国产成人高清精品免费| 人妻夜夜爽天天爽| 青青青国产精品国产精品美女| 欧美在线视频不卡| 国产真实乱了在线播放| 国产自在线拍| 欧美日韩免费在线视频| 国产在线八区| 国产爽妇精品| 91国语视频| 黄色网在线| 天堂亚洲网| 日韩欧美中文字幕在线韩免费| 精久久久久无码区中文字幕| 欧美日本在线播放| 精品无码国产自产野外拍在线| 国产精品爽爽va在线无码观看| 国产精品亚洲欧美日韩久久| 女人18一级毛片免费观看| 国产91特黄特色A级毛片| 久久99国产视频| 国产精品吹潮在线观看中文| 国产网站免费观看| 日韩a在线观看免费观看| 日本黄色a视频| 中文无码精品A∨在线观看不卡 | 91小视频在线| 亚洲精品视频在线观看视频| 一级爆乳无码av| 国产精品永久免费嫩草研究院| 蜜臀AVWWW国产天堂| 91在线国内在线播放老师| 国产成人AV综合久久| 五月婷婷综合在线视频| 欧美激情一区二区三区成人| 天天爽免费视频| 日本欧美视频在线观看| 久久综合色视频| www亚洲天堂| 国产啪在线| 3344在线观看无码| AV无码一区二区三区四区| 九九热精品视频在线| 亚洲成A人V欧美综合| 国产人人乐人人爱| 亚洲日韩精品无码专区| www精品久久| 92精品国产自产在线观看| 91久久青青草原精品国产| 无码精品一区二区久久久| 亚洲福利视频一区二区| 88av在线| 国产全黄a一级毛片| 久久熟女AV| 99re经典视频在线| 91色综合综合热五月激情| 日韩乱码免费一区二区三区| 婷婷六月天激情| 国产精品天干天干在线观看| 精品视频在线一区| 找国产毛片看| 伊人久久久大香线蕉综合直播| 国产鲁鲁视频在线观看| 国产女人爽到高潮的免费视频 | 精品视频在线观看你懂的一区| 亚洲无码精品在线播放| 国产探花在线视频| 天天做天天爱夜夜爽毛片毛片| 久久综合九九亚洲一区| 亚洲国产中文精品va在线播放| 色哟哟国产成人精品| 在线色综合| 国产成人午夜福利免费无码r| 国产菊爆视频在线观看|