999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

開源模式:促進大數據發展的主導力量

2016-05-14 10:34:36蒲松濤
中國計算機報 2016年41期
關鍵詞:數據處理生態發展

蒲松濤

從云計算、大數據、物聯網、人工智能等新一代信息技術創新歷程可以清晰地看出,開源模式活躍在各個領域,更為重要的是,隨著全球各大科技巨頭的競相加入,開源模式正逐漸成為推動大數據等各領域技術創新的主導力量。

開源已成為大數據技術創新的主要模式

大數據源于開源,并基于開源不斷演進發展,自身就已具備了開源基因。經過若干年的發展,開源軟件和開源工具已經覆蓋了大數據產業發展的各個環節,基于開源軟件,企業可以快速構建大數據應用平臺,提供豐富的大數據開發和應用工具。當前,從小型初創企業到行業科技巨頭,各種規模的企業都在使用開源軟件和工具做大數據處理和基于數據的預測分析。由此可見,開源不僅驅動著大數據技術的創新演進,也推動著大數據產業的不斷進步,對繁榮大數據應用生態起到了不可忽視的作用。

嚴格來說,大數據并不是一個產業或市場,而是一類問題,或者一種思維。從這些思維和問題中獲得價值,需要完整的信息基礎設施,并配套以相關的技術和工具,這些共同構成大數據應用的生態。因此,把大數據當作產業來看待,其生態體系的外延是非常廣闊的。

狹義來看,按照應用流程,大數據生態鏈包括數據采集、數據存儲、數據應用和數據可視化等環節;從廣義來看,大數據生態鏈貫穿數據的整個生命周期,包括各種基礎設施和軟件系統,從數據的產生到采集、傳輸、分享到存儲,再到分析挖掘,直至最終的呈現與應用。從技術的應用范圍和重要性可以看出,數據的存儲、數據處理、價值挖掘和數據可視化等是大數據產業環節中的重點領域。

開源技術創新引領大數據基礎平臺演進

對于云計算發展而言,開源基礎平臺如OpenStack、CloudStack的發展是推動云計算技術創新和行業應用的關鍵。與之類似,大數據的發展與開源軟件的不斷創新密切相關,在大數據處理平臺這個基礎性并處于核心地位的環節,開源技術的創新成為了引領其不斷演進的主要動力。

Hadoop是推動大數據應用的基礎平臺,是基于GFS和Mapreduce的開源實現。盡管在Hadoop之前也有一些類似的分布式存儲和計算平臺,但真正能實現工業級應用、大幅降低應用門檻、帶動各行業大規模部署的無疑當屬Hadoop。受益于MapReduce框架的易用性和容錯性,以及對先進存儲系統和計算系統的集成,Hadoop成為大數據處理平臺的主要基石。

在大數據產業發展的初期,Hadoop可滿足90%以上的離線存儲和離線計算需求,它成為各大公司早期大數據平臺的首選??梢哉f,沒有Hadoop就沒有今天的大數據產業發展。自Hadoop起,大數據平臺幾經升級及更替,發展出兩主線、多支線的演進態勢,但不管是主線亦或是支線,開源都是大數據平臺技術創新的主要模式,開源軟件始終是大數據基礎平臺的重要屬性。

主線一是Hadoop生態,主要組成包括Hadoop、Pig、HBase、ZooKeeper、Hive、Yarn和Impala,主要組件提出于2008年之前,Yarn和Impala分別提出于2011年和2012年。Pig是一種開源編程語言,可加載數據、表達轉換數據和存儲最終結果,其內置操作可處理半結構化數據;HBase是一個分布式的、面向列的開源數據庫,在Hadoop之上提供了類似于Bigtable的能力,是一個適合于非結構化數據存儲的數據庫;ZooKeeper是一個分布式的開源分布式應用程序協調服務,可提供配置維護、名字服務、分布式同步、組服務等功能;Hive是一個基于Hadoop的數據倉庫工具,可以將結構化的數據文件映射為數據庫表,并提供簡單的SQL查詢功能;Yarn是一個全新的MapReduce框架,可為從根本上解決傳統MapReduce框架的性能瓶頸,對促進Hadoop框架應用發展發揮重要作用;Impala可以直接為Hadoop數據提供快速,交互式的SQL查詢。

主線二是Spark生態,包括Spark、Shark、SparkStreaming、Bagel、GraphX、SparkSQL等,Spark提出于2009年,主要生態組成提出于2011年至2014年。

Spark是開源類Hadoop框架,可將中間輸出結果保存在內存中,因此計算速度較Hadoop有幾倍到幾十倍的提升,在成熟之后得到了迅速普及;Shark可通過Hive的HQL解析將其翻譯成Spark上的RDD操作,具有運算速度快、兼容性強等特點;Spark Streaming、Bagel、GraphX、Spark SQL等開源軟件均以Spark為基礎,從實時計算框架、圖計算模型、圖模型API、數據查詢等方面對原有平臺進行了優化或補充。

除Hadoop、Spark之外,還涌現出了一批支線平臺,絕大多數是開源的,主要代表有Hypertable、Cassandra、Dryad、S4、Kalka、Haloop和Storm。其中,Storm完全擺脫了MapReduce架構,重新設計了一個適用于流式計算的架構,以數據流為驅動觸發計算,計算時效性高,適應有向無環圖計算拓撲的設計,計算方式較為靈活,在業界得到了一定的部署應用。

科技企業是大數據開源軟件發展的主要力量

表面上看,大數據基礎平臺和主要環節的技術創新均是基于開源模式推動的,全球各界人士均有平等的參與和應用機會。但是,從技術演進的確定權和影響力來看,大數據領域的技術創新離不開全球主要科技企業的參與。

科技企業既是大數據技術創新的主要力量,同時也圍繞開源世界的游戲規則不斷擴大行業影響力,緊抓技術創新前沿,搶占大數據技術發展和標準制定的話語權,培育發展形成以企業核心競爭力為中心、以開源為主要方式的新型產業生態。

猜你喜歡
數據處理生態發展
認知診斷缺失數據處理方法的比較:零替換、多重插補與極大似然估計法*
心理學報(2022年4期)2022-04-12 07:38:02
ILWT-EEMD數據處理的ELM滾動軸承故障診斷
水泵技術(2021年3期)2021-08-14 02:09:20
邁上十四五發展“新跑道”,打好可持續發展的“未來牌”
中國核電(2021年3期)2021-08-13 08:56:36
“生態養生”娛晚年
保健醫苑(2021年7期)2021-08-13 08:48:02
住進呆萌生態房
學生天地(2020年36期)2020-06-09 03:12:30
生態之旅
砥礪奮進 共享發展
華人時刊(2017年21期)2018-01-31 02:24:01
改性瀝青的應用與發展
北方交通(2016年12期)2017-01-15 13:52:53
基于希爾伯特- 黃變換的去噪法在外測數據處理中的應用
生態
領導文萃(2015年4期)2015-02-28 09:19:05
主站蜘蛛池模板: 色综合综合网| 欧美黄色网站在线看| 欧美亚洲国产日韩电影在线| 国产精品欧美激情| 国产97视频在线观看| 国产女人18水真多毛片18精品 | 国产日韩AV高潮在线| 欧美精品在线免费| 国产精品一区二区在线播放| 国产超碰在线观看| 日本尹人综合香蕉在线观看| 精品99在线观看| 久久毛片网| 日本人妻丰满熟妇区| 国产chinese男男gay视频网| 又爽又黄又无遮挡网站| 日韩精品专区免费无码aⅴ| 亚洲开心婷婷中文字幕| 中文字幕无码制服中字| 91精品久久久无码中文字幕vr| 99热这里只有免费国产精品 | 亚洲伊人天堂| 亚洲成人在线免费| 欧美国产在线精品17p| 欧美日本在线一区二区三区| 一级毛片高清| 中文字幕有乳无码| 亚洲无码日韩一区| 99精品国产电影| 国产免费人成视频网| lhav亚洲精品| 国产手机在线小视频免费观看| 国产精品久久自在自2021| 毛片免费在线| 国产成年无码AⅤ片在线| 婷婷六月激情综合一区| 2018日日摸夜夜添狠狠躁| 激情综合激情| 国产精品毛片一区| 久草性视频| 在线播放国产一区| 亚洲狼网站狼狼鲁亚洲下载| 在线日韩日本国产亚洲| 免费a在线观看播放| 午夜毛片福利| 自偷自拍三级全三级视频| 呦视频在线一区二区三区| 精品国产成人av免费| 91免费国产在线观看尤物| 亚洲欧美日本国产综合在线| 国产女人在线| 免费日韩在线视频| 免费不卡视频| 91娇喘视频| 久久99精品久久久久纯品| 亚洲视频无码| 狠狠v日韩v欧美v| 91原创视频在线| 久久精品亚洲中文字幕乱码| 999国产精品| 亚洲va在线观看| 制服无码网站| 成人福利在线免费观看| 国产a网站| 经典三级久久| 午夜高清国产拍精品| 国产精品粉嫩| 夜色爽爽影院18禁妓女影院| www.亚洲国产| 激情無極限的亚洲一区免费 | 久久久久亚洲av成人网人人软件 | 97在线碰| 久久这里只精品国产99热8| 国产成年女人特黄特色大片免费| 99热这里只有精品免费国产| 青青热久麻豆精品视频在线观看| 最新亚洲av女人的天堂| 亚洲国产精品成人久久综合影院 | 亚欧成人无码AV在线播放| 91蝌蚪视频在线观看| 久久香蕉国产线看观| 亚洲综合中文字幕国产精品欧美|