鐘棟棟
(西華大學,四川 成都 610000)
?
大數據時代
鐘棟棟
(西華大學,四川 成都 610000)
隨著網絡信息化時代的日益普遍,移動互聯、社交網絡、電子商務大大拓展了互聯網的疆界和應用領域,我們正處在一個數據爆炸性增長的“大數據”時代,大數據在社會經濟、政治、文化,人們生活等方面產生深遠的影響,大數據時代對人類的數據駕馭能力提出了新的挑戰與機遇。
大數據;云計算;海量;發展;影響
進入2012年以來,大數據(Big Data)一詞越來越多地被提及與使用,人們用它來描述和定義信息爆炸時代產生的海量數,它已經出現過在《紐約時報》、《華爾街時報》的專欄封面,進入美國白宮網的新聞,現身在國內一些互聯網主題的講座沙龍中,甚至被嗅覺靈敏的國君證劵、國泰君安、銀河證劵等寫進了投資推薦報告,大數據時代來臨據。
對于“大數據”(Big data)研究機構Gartner給出了這樣的定義。“大數據”是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力來適應海量、高增長率和多樣化的信息資產。
麥肯錫全球研究所給出的定義是:一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類型和價值密度低四大特征。
大數據技術的戰略意義不在于掌握龐大的數據信息,而在于對這些含有意義的數據進行專業化處理。換而言之,如果把大數據比作一種產業,那么這種產業實現盈利的關鍵,在于提高對數據的“加工能力”,通過“加工”實現數據的“增值”。
從技術上看,大數據與云計算的關系就像一枚硬幣的正反面一樣密不可分。大數據必然無法用單臺的計算機進行處理,必須采用分布式架構。它的特色在于對海量數據進行分布式數據挖掘。但它必須依托云計算的分布式處理、分布式數據庫和云存儲、虛擬化技術。[2]
隨著云時代的來臨,大數據(Big data)也吸引了越來越多的關注。分析師團隊認為,大數據(Big data)通常用來形容一個公司創造的大量非結構化數據和半結構化數據,這些數據在下載到關系型數據庫用于分析時會花費過多時間和金錢。大數據分析常和云計算聯系到一起,因為實時的大型數據集分析需要像MapReduce一樣的框架來向數十、數百或甚至數千的電腦分配工作。
要理解大數據這一概念,首先要從“大”入手,“大”是指數據規模,大數據一般指在10TB(1TB=1024GB)規模以上的數據量。大數據同過去的海量數據有所區別,其基本特征可以用4個V來總結(Vol-ume、Variety、Value和Veloc-ity),即體量大、多樣性、價值密度低、速度快。
第一,數據體量巨大。從TB級別,躍升到PB級別。第二,數據類型繁多,如前文提到的網絡日志、視頻、圖片、地理位置信息,等等。第三,價值密度低。以視頻為例,連續不間斷監控過程中,可能有用的數據僅僅有一兩秒。第四,處理速度快。1秒定律。最后這一點也是和傳統的數據挖掘技術有著本質的不同。物聯網、云計算、移動互聯網、車聯網、手機、平板電腦、PC以及遍布地球各個角落的各種各樣的傳感器,無一不是數據來源或者承載的方式。
大數據技術是指從各種各樣類型的巨量數據中,快速獲得有價值信息的技術。解決大數據問題的核心是大數據技術。目前所說的“大數據”不僅指數據本身的規模,也包括采集數據的工具、平臺和數據分析系統。大數據研發目的是發展大數據技術并將其應用到相關領域,通過解決巨量數據處理問題促進其突破性發展。
大數據,其影響除了經濟方面的,它同時也能在政治、文化等方面產生深遠的影響,大數據可以幫助人們開啟循“數”管理的模式,也是我們當下“大社會”的集中體現,三分技術,七分數據,得數據者得天下。
“大數據”的影響,增加了對信息管理專家的需求。事實上,大數據的影響并不僅僅限于信息通信產業,而是正在“吞噬”和重構很多傳統行業,廣泛運用數據分析手段管理和優化運營的公司其實質都是一個數據公司。麥當勞、肯德基以及蘋果公司等旗艦專賣店的位置都是建立在數據分析基礎之上的精準選址。而在零售業中,數據分析的技術與手段更是得到廣泛的應用,傳統企業如沃爾瑪通過數據挖掘重塑并優化供應鏈,新崛起的電商如卓越亞馬遜、淘寶等則通過對海量數據的掌握和分析,為用戶提供更加專業化和個性化的服務。
大數據在個人隱私的方面,大量數據經常含有一些詳細的潛在的能夠展示有關我們的信息,逐漸引起了我們對個人隱私的擔憂。一些處理大數據公司需要認真的對待這個問題。例如美國天睿資訊給人留下比較深刻印象的是他的一個科學家提出,我們不應該簡單地服從法律方面的隱私保護問題,這些遠遠不夠的,公司都應該遵從谷歌不作惡的原則,甚至更應該做出更積極的努力。
當下我國大數據研發建設應在以下四個方面著力。第一,建立一套運行機制。大數據建設是一項有序的、動態的、可持續發展的系統工程,必須建立良好的運行機制,以促進建設過程中各個環節的正規有序,實現統合,搞好頂層設計。第二,規范一套建設標準。沒有標準就沒有系統。應建立面向不同主題、覆蓋各個領域、不斷動態更新的大數據建設標準,為實現各級各類信息系統的網絡互連、信息互通、資源共享奠定基礎。第三,搭建一個共享平臺。數據只有不斷流動和充分共享,才有生命力。第四,培養一支專業隊伍。大數據建設的每個環節都需要依靠專業人員完成,因此,必須培養和造就一支懂指揮、懂技術、懂管理的大數據建設專業隊伍。
做到上面的幾點,當大數據時代來臨的時候,面臨大量數據將不是束手無策,而是成竹在胸,而從數據中得到的好處也將促進國家快速發展。
[1]李建義.數據庫原理及開發.北京:中國水利水電出版社,2005.
[2]維克托·邁爾·舍恩伯格.大數據時代.浙江:浙江人民出版社,2012.
[3]大數據時代降臨 .半月談網,2012-09-22.
鐘棟棟(1995.12-),男,漢族,浙江人,西華大學。
TP391
A
1671-1602(2016)18-0113-01