摘 要:文章介紹大數據的含義和特性,分析其影響及應用,探討大數據所存在的問題和發展前景。網絡信息時代,微薄簡潔的數據分析及存儲已經難以滿足人們各方面的需要。大數據的海量存儲及影響,契合了整個社會的發展趨勢,同時對人類的數據駕馭能力提出了新的挑戰。
關鍵詞:大數據;海量;影響;發展
中圖分類號:TP311.13 文獻標識碼:A 文章編號:1674-7712 (2014) 06-0000-01
一、什么是大數據
大數據(Big data),又稱巨量資料,指的是無法通過目前的主流軟件工具,在合理的時間內完成截取、管理、處理并整理成為幫助企業經營決策更積極目的的規模巨大的資料量。
大數據最初被用來描述為更新網絡搜索索引需要同時進行批量處理或者分析的大量數據集,而隨著Google Map Reduce和Google File System的發布,大數據不僅僅被用來描述大量的數據,而且還被視為是對數據處理的能力與速度的體現。
海量的數據蘊含著無窮的價值與潛力。商家與企業從最初的花費巨資挖掘信息到如今輕而易舉地實現資源利用與共享,不得不說是大數據推進了整個數字時代架構的發展。如硬件、云平臺等資源與相應技術的迅猛發展,使得大數據的實現變得更加的方便與廉價。例如中國最大電商淘寶推出的無抵押貸款的條件,便是申請者需擁有良好的信用記錄,而代表著良好信用的指標,便是根據申請者所有消費記錄及個人信息的獲取與分析自動生成的一個判定,商家與企業可以根據這些數據的分析從而判斷申請者是否符合無抵押貸款的標準。許許多多類似的大數據使用模式,讓企業開啟了更加快捷并且人性化的服務時代,在提高自身服務的同時,利潤升高,也節省了以往花巨資搜集相關信息的成本,這在若干年前是完全不敢想象的。
二、大數據的特性
大數據的四個特性:Volume(海量)、Velocity(高速)、Variety(多樣)、Value(價值),這便是著名的4V特點。
海量性:這是一個數據成指數般增長的時代。IDC最近的報告預測稱,2020年,全球數據量將擴大50倍。目前來看,數據體量從TB級別躍升到了PB級別,而存儲1PB數據即需要兩萬臺配備50GB硬盤的個人電腦,所謂的海量特性,我們可想而知。
多樣性:多樣性指的是數據類型的繁多。比如我們常用的百度、Google等搜索引擎,便是大數據的具體體現,人們可以通過文字、視頻、圖片等多種形式來獲取相關信息。
價值性:價值密度低,大數據的價值體現在流動性,商業價值高。企業在需求有利信息的同時更需要良好的商業回報,大數據技術的出現幫助企業實現了這一點。但由于資源種類過多且繁雜,目前來說如何快速提取有利信息完成價值的“提純”,是亟待解決的問題。
高速性:顧名思義,速度極快。大數據處理數據的方式與以往傳統的數據挖掘大不相同,它利用云平臺良好的保持性能與容量的可擴展性和高速性。
三、大數據的影響及應用
在企業與商家利用大數據為人類創造更好服務條件以及謀取利潤的同時,大數據對政治、經濟、文化等各個方面都產生了深遠的影響。在2012年,奧巴馬政府已經發布“大數據研發倡議”,該倡議涉及聯邦政府的六個部門,他們均承諾將投資總共超過兩億美元來大力推動和改善與大數據相關的收集、組織和分析工具及技術。他們將利用大數據提高收集、存儲、管理分析和分享大數據最先進的核心技術水平,并且利用這次額技術加速在科學和工程中的創新速度,增加國家安全力量甚至改變在教育領域的授課和學習模式。而在2013年,百度舉辦的“百度無限”搜索大賽被列入了聯合國教科文組織的“全民信息計劃”(IFAP),而這項計劃則是教科文組織借此與各國政府密切合作,以建立全民信息社會為目標,以保證所有人能夠獲得信息來改善他們的生活的國際性活動。
而像Google、IBM、Microsoft等巨頭公司早已開始覬覦大數據這塊充滿希望與潛力的發展之地。IBM近日便宣布,根據市場調研機構Wikibon最新研究報告《大數據供應商收益與市場預測》,IBM連續兩年實現大數據市場占有率第一,領跑報告中70多家大數據供應商,同時,2013年IBM大數據分析領域營收高達160億美金。在大數據與分析領域,IBM不斷開拓新的市場,參與幫助能源、醫療、金融服務等不同領域的企業實現轉型。許多企業高管都使用IBM大數據分析工具從而更高效地洞察客戶需求,及時修改企業策劃,利用可靠的數據提高營收。
四、大數據所存在問題
容量問題:上文提到,大數據的容量已經可以擴充至PB級別,因此,海量數據存儲系統也一定要有相應等級的擴展能力,同時要做到存儲系統的簡便。目前LSI公司的Nytro智能化閃存解決方案可將數據庫事務處理性能提高30倍,并且超過每秒4.0GB的持續吞吐能力,十分適合大數據分析。
安全問題:如果說大數據是高速行駛的汽車,那么云計算便是承載汽車的高速公路。什么是云計算?云計算是一種按使用量計費的提供可用、便捷、按需的網絡訪問。這種網絡訪問進入可配置的計算資源共享池(包括網絡,服務器,存儲,應用軟件,服務等)去快速獲取所需資源。然而,云計算一直以來存在著很多爭議,其中最顯著的便是安全性能得不到保障。某些特殊行業比如金融、銀行、政府等敏感資料匯集的機構,有待加強此類安全問題。2011年,索尼的PlayStation網絡和Qriocity音樂服務網站遭到黑客攻擊。服務中斷超過一周,PlayStation網絡7700萬個注冊賬戶持有人的個人信息失竊。
除去上述典型的問題之外,大數據在這迅猛發展的幾年里仍舊存在些許問題亟待解決,假以時日,相信大數據會正真帶領人類進入數據高速運轉的世界中。
參考文獻:
[1]國雙《2013中國互聯網發展報告》技術驅動數據分析[R].北京:國雙科技成立數據中心,2014.
[2]奧巴馬政府發布第二輪大數據研究項目[R].北京:搜狐網,2013.
[3]維克托維克托·邁爾·舍恩伯格.大數據時代{M}.杭州:浙江人民出版社,2012.
[4]IBM連續兩年大數據市場占有率全球第一[J].睿商在線,2014.
[作者簡介]羅詩慧(1992-),女,海南人,西南交通大學,學士學位,研究方向:通信;