999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

簡要分析大數(shù)據(jù)的發(fā)展現(xiàn)狀與挑戰(zhàn)

2016-06-11 06:26:30馬彬彬
科技資訊 2016年10期
關(guān)鍵詞:大數(shù)據(jù)

馬彬彬

摘要:近年來,隨著科學(xué)技術(shù)的迅猛發(fā)展,國家政府(航空航天,國防)、學(xué)術(shù)界(生物醫(yī)療工程,天文學(xué),高能物理和光學(xué)研究)、產(chǎn)業(yè)界(互聯(lián)網(wǎng),金融,供應(yīng)系統(tǒng))不斷產(chǎn)生海量數(shù)據(jù),人們早已進(jìn)入網(wǎng)絡(luò)化的大數(shù)據(jù)(Big Data)時代。該文簡要概述了大數(shù)據(jù)發(fā)展的重要意義及國內(nèi)外現(xiàn)狀,并對大數(shù)據(jù)系統(tǒng)和其挑戰(zhàn)做了簡略分析。

關(guān)鍵詞:大數(shù)據(jù) 并行系統(tǒng) MapReduce 大數(shù)據(jù)系統(tǒng)

中圖分類號:TN919 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-3791(2016)04(a)-0142-02

1.大數(shù)據(jù)的重要意義

被稱為信息時代新“石油”的大數(shù)據(jù)隱含著巨大的社會、經(jīng)濟和科研價值,引起了政府部門、科研界及產(chǎn)業(yè)界的高度關(guān)注。

據(jù)國際數(shù)據(jù)公司IDC報道,2011年產(chǎn)生和復(fù)制的數(shù)據(jù)超過1.8ZB,是過去5年數(shù)據(jù)增長的9倍,并將以每兩年翻倍的速度增長,而這些數(shù)據(jù)約75%來自干與互聯(lián)網(wǎng),物聯(lián)網(wǎng)相關(guān)的人類社會,因而,對大數(shù)據(jù)的處理和解析將直接或間接地關(guān)系到國家的信息空間安全和社會穩(wěn)定甚至一個國家數(shù)據(jù)主權(quán)的競爭力。其次,大數(shù)據(jù)對各類產(chǎn)業(yè)結(jié)構(gòu)升級及新戰(zhàn)略的制定都有著不可忽視的影響,進(jìn)入大數(shù)據(jù)時代以來,各類企業(yè)決策的制定和優(yōu)化越來越依賴大數(shù)據(jù)的處理和解析;計算機行業(yè)將自身的關(guān)注點由追求計算速度轉(zhuǎn)移到對大數(shù)據(jù)的處理機制,云計算也轉(zhuǎn)為分析即服務(wù)(Aaas)的Cloud 2.0時代;同時大數(shù)據(jù)的處理對生物、醫(yī)療、能源、金融和教育的發(fā)展應(yīng)用有著重大意義如百度每天要處理大約幾十PB數(shù)據(jù),F(xiàn)acebook注冊用戶超過10億,每月上傳照片超過10億張,每天生成300TB以上的日志數(shù)據(jù)。因此,從海量數(shù)據(jù)中挖掘并提取出有價值的信息和知識顯得尤為重要。

2.大數(shù)據(jù)國內(nèi)外現(xiàn)狀

2009年至今,美國數(shù)據(jù)庫全面開放了40萬政府原始數(shù)據(jù)集,2012~3月,美國發(fā)布了“大數(shù)據(jù)研發(fā)計劃”涉及美國國家科學(xué)基金會(NSF)、國防部(DOD)、能源部(DOE)等6個聯(lián)邦部門和機構(gòu),共同提高處理分析共享海量數(shù)據(jù)所需的核心技術(shù),并加大數(shù)據(jù)應(yīng)用技術(shù)人才的培養(yǎng)和供給。過去幾年歐盟投資1億多歐元將數(shù)據(jù)信息化基礎(chǔ)設(shè)施作為Horizon 2020計劃的優(yōu)先領(lǐng)域之一,2014年歐盟委員會呼吁各成員國家間大數(shù)據(jù)領(lǐng)域的公私合作,依托“地平線2020”科研計劃等促進(jìn)大數(shù)據(jù)時代的發(fā)展。美國麻省理工大學(xué)計算科學(xué)與人工智能實驗室(CSAIL)建立大數(shù)據(jù)科學(xué)技術(shù)中心(ISTC)[2]致力于醫(yī)藥科學(xué)發(fā)明、行業(yè)計算的發(fā)展。

國內(nèi)各領(lǐng)域紛紛制定了大數(shù)據(jù)研究與應(yīng)用的相關(guān)計劃,2012年科技部“十二五”部署了關(guān)于物聯(lián)網(wǎng)和云計算的相關(guān)專項,同年3月,國家“973計劃~863計劃”和國家自然科學(xué)基金等也分別制定了關(guān)于大數(shù)據(jù)的研究計劃和專項。與此同時,中國計算機學(xué)會和中國通信學(xué)會成立了大數(shù)據(jù)專家委員會,開展CCF大數(shù)據(jù)學(xué)術(shù)會議、大數(shù)據(jù)分析與管理國際研討會和大數(shù)據(jù)科學(xué)與工程國際學(xué)術(shù)研等學(xué)術(shù)活動促進(jìn)大數(shù)據(jù)的應(yīng)用研究,為其發(fā)展提供政策、資源和人才培養(yǎng)等方面強有力的支持。

3.大數(shù)據(jù)簡介

不同領(lǐng)域?qū)Υ髷?shù)據(jù)的定義和解讀至今未達(dá)成統(tǒng)一的認(rèn)知,國際數(shù)據(jù)中心IDC,在2011年的報告中將大數(shù)據(jù)定義為“大數(shù)據(jù)技術(shù)描述了一個技術(shù)和體系的新時代,被設(shè)計于從大規(guī)模多樣性的數(shù)據(jù)中通過高速捕獲、發(fā)現(xiàn)和分析技術(shù)提取數(shù)據(jù)的價值”。大數(shù)據(jù)的四大顯著特征4V:容量(VOlume)、多樣性(variety)、速度(velocity)和價值(value)集中體現(xiàn)大數(shù)據(jù)體量浩大,模態(tài)繁多,數(shù)據(jù)生成更新快速,價值大而密度低的性質(zhì)。大數(shù)據(jù)系統(tǒng)主要分成數(shù)據(jù)生成、數(shù)據(jù)獲取、數(shù)據(jù)存儲和數(shù)據(jù)分析四個階段。

大數(shù)據(jù)最早出現(xiàn)在20世紀(jì)70年代到80年代,商業(yè)數(shù)據(jù)從MB上升至GB的數(shù)量級,為滿足數(shù)據(jù)存儲和數(shù)據(jù)查詢以完成商業(yè)數(shù)據(jù)分析和報告的需求,傳統(tǒng)的關(guān)系數(shù)據(jù)庫管理系統(tǒng)(RDBMs)應(yīng)運而生。

20世紀(jì)80年代末,數(shù)字技術(shù)的盛行將數(shù)量級提升至TB,遠(yuǎn)遠(yuǎn)超過了單個計算機系統(tǒng)的存儲和處理能力,無共享并行數(shù)據(jù)庫利用節(jié)點劃分極大地優(yōu)化了數(shù)據(jù)處理性能,但其在擴展性、容錯性和對異構(gòu)環(huán)境的支持等方面仍存在欠缺。

20世紀(jì)90年代末進(jìn)APB數(shù)量級的互聯(lián)網(wǎng)時代,web1.0的迅猛發(fā)展帶來了海量半結(jié)構(gòu)化和無結(jié)構(gòu)化的網(wǎng)頁數(shù)據(jù),而并行數(shù)據(jù)庫系統(tǒng)幾乎無法勝任對非結(jié)構(gòu)化和TB數(shù)量級的數(shù)據(jù)處理,為了應(yīng)對web數(shù)據(jù)的挑戰(zhàn),Google提出MapReduce編程模型,實現(xiàn)了系統(tǒng)向上和向外擴展及海量數(shù)據(jù)的處理,而MapReduce較低的連接性能無法高效處理用戶創(chuàng)造內(nèi)容(UGC)和各類傳感器產(chǎn)生的大量混合數(shù)據(jù)結(jié)構(gòu),這要求在計算架構(gòu)和大規(guī)模數(shù)據(jù)處理機制上實現(xiàn)范式轉(zhuǎn)變,如NoSQL。

根據(jù)現(xiàn)有的發(fā)展趨勢,各業(yè)界存儲和分析數(shù)據(jù)將會達(dá)到EP的數(shù)量級,而且前還沒有與該數(shù)量級別相適應(yīng)的數(shù)據(jù)技術(shù),簡單復(fù)用或集合各個數(shù)據(jù)庫系統(tǒng)的優(yōu)良性能,未能從本質(zhì)解決大數(shù)據(jù)的處理分析問題,可以考慮從數(shù)據(jù)產(chǎn)生的內(nèi)在機制、大數(shù)據(jù)間的關(guān)聯(lián)性以及數(shù)據(jù)背后的社會經(jīng)濟學(xué)機理等方面的進(jìn)行研究。

4.大數(shù)據(jù)的挑戰(zhàn)

現(xiàn)有的數(shù)據(jù)處理和分析技術(shù)無法滿足大數(shù)據(jù)的需求,存儲能力的增長趕不上數(shù)據(jù)的爆炸式增長等都是大數(shù)據(jù)所面臨的技術(shù)挑戰(zhàn),該文作者認(rèn)為以下幾個問題值得引起高度重視。

4.1大數(shù)據(jù)的去冗降噪技術(shù)

大數(shù)據(jù)一般是來自不同數(shù)據(jù)源的動態(tài)數(shù)據(jù)流,加上數(shù)據(jù)預(yù)處理階段的處理缺陷很容易產(chǎn)生多種形態(tài)的噪聲數(shù)據(jù)和數(shù)據(jù)冗余,從而導(dǎo)致傳輸開銷加大,存儲空間浪費以及數(shù)據(jù)分析負(fù)荷的加重。此外,過于嚴(yán)格的數(shù)據(jù)清洗可能會刪掉有價值的數(shù)據(jù),降低數(shù)據(jù)分析的準(zhǔn)確性,科學(xué)合理的冗余檢測技術(shù)和數(shù)據(jù)壓縮技術(shù)值得進(jìn)一步研究。

4.2數(shù)據(jù)共享與隱私保護間的矛盾

大數(shù)據(jù)是跨領(lǐng)域跨專業(yè)的交叉信息學(xué)科,只有建立良性的大數(shù)據(jù)生態(tài)環(huán)境消除各領(lǐng)域數(shù)據(jù)壁壘實現(xiàn)數(shù)據(jù)大共享才更可能形成真正的知識和智能,呈現(xiàn)利益價值最大化,而在一定程度上又暴露了用戶的隱私信息,由此引發(fā)的侵權(quán)和犯罪行為不容忽視。2006年Dwork提出了新的差分隱私方法,但這項技術(shù)離實際應(yīng)用還很遠(yuǎn)。

4.3數(shù)據(jù)處理系統(tǒng)

根據(jù)CAP理論,并行數(shù)據(jù)庫必然不能獲得較強的擴展性和系統(tǒng)可用性,而MapReduce和Hadoop在應(yīng)用性能方面有待提高,還需要研發(fā)出能高效處理非數(shù)據(jù)結(jié)構(gòu)和半數(shù)據(jù)結(jié)構(gòu)的實用數(shù)據(jù)處理與分析系統(tǒng)。此外,以快速、高時效為特征的流處理和優(yōu)于處理復(fù)雜的數(shù)據(jù)存儲和管理的批處理以及二者的結(jié)合仍未真正實現(xiàn)大數(shù)據(jù)的實時處理,因此,目前還需要一個能夠滿足實際應(yīng)用中不同業(yè)務(wù)需求和應(yīng)用場景通用的大數(shù)據(jù)實時處理框架。

5.結(jié)語

該文介紹了大數(shù)據(jù)的基本概念和特征以及大數(shù)據(jù)在人類社會和科研等各個領(lǐng)域的重要意義,并簡要介紹了國內(nèi)外各界對大數(shù)據(jù)的高度重視和支持,最后就目前大數(shù)據(jù)處理和分析技術(shù)的現(xiàn)狀提出幾點值得引起重視的研究方向。機遇與挑戰(zhàn)并存,大數(shù)據(jù)研發(fā)工作任重道遠(yuǎn)!

猜你喜歡
大數(shù)據(jù)
基于在線教育的大數(shù)據(jù)研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯(lián)網(wǎng)+”農(nóng)產(chǎn)品物流業(yè)的大數(shù)據(jù)策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數(shù)據(jù)的小微電商授信評估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數(shù)據(jù)時代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數(shù)據(jù)在出版業(yè)的應(yīng)用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯(lián)網(wǎng)+”對傳統(tǒng)圖書出版的影響和推動作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
科技視界(2016年20期)2016-09-29 10:53:22
數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 黄色网页在线播放| 制服丝袜 91视频| 中日韩一区二区三区中文免费视频| 亚洲男人天堂网址| 极品私人尤物在线精品首页| 青青草原国产av福利网站| 亚洲中文字幕精品| 97超爽成人免费视频在线播放| 色网在线视频| 国产浮力第一页永久地址| 91午夜福利在线观看| 精品久久香蕉国产线看观看gif| 无码日韩视频| 亚洲日韩精品无码专区97| 亚洲精品久综合蜜| 久久综合AV免费观看| 一本大道东京热无码av| 怡春院欧美一区二区三区免费| 四虎国产在线观看| 免费A∨中文乱码专区| 成年人福利视频| 国产视频久久久久| 一级看片免费视频| 中文字幕自拍偷拍| 国产91蝌蚪窝| 久夜色精品国产噜噜| 91亚洲精品国产自在现线| 亚洲第一中文字幕| 亚洲综合中文字幕国产精品欧美 | 免费毛片视频| 四虎永久在线精品国产免费| 国产欧美日韩另类| 在线99视频| 99热最新网址| 久久香蕉国产线| 日本国产精品一区久久久| 亚洲人成人无码www| 亚洲免费三区| 国产丰满大乳无码免费播放 | 亚欧乱色视频网站大全| 久久精品这里只有精99品| 免费在线一区| 在线不卡免费视频| 97成人在线视频| 国产女同自拍视频| 狠狠色成人综合首页| 超清无码一区二区三区| 91精品国产福利| 九九热精品免费视频| 国产一区在线视频观看| 四虎免费视频网站| 456亚洲人成高清在线| 毛片基地视频| 成人小视频在线观看免费| 亚州AV秘 一区二区三区| 国产福利免费在线观看| 自慰高潮喷白浆在线观看| 久久夜色撩人精品国产| 欧美日韩在线国产| 国产91久久久久久| 污网站在线观看视频| 手机永久AV在线播放| 欧美中文字幕在线视频| 国产在线视频导航| 国产手机在线观看| 午夜欧美在线| 婷婷五月在线视频| 欧美亚洲激情| 国产v欧美v日韩v综合精品| 欧美视频免费一区二区三区| 99视频只有精品| 麻豆精品视频在线原创| 美女被躁出白浆视频播放| 欧美97欧美综合色伦图| 好紧太爽了视频免费无码| 五月激情婷婷综合| 台湾AV国片精品女同性| 乱人伦视频中文字幕在线| 无码AV日韩一二三区| 99视频国产精品| 伊人AV天堂| 国产成本人片免费a∨短片|