問:編輯同志,您好。繼“物聯網”、“云計算”之后,“大數據”一詞被越來越多地提及。大家都在談論“大數據”,誰都想用好“大數據”,儼然進入了“大數據時代”。請問如何理解“大數據時代”?
北京讀者:唐洪濤
唐洪濤同志:
您好!“大數據”只是一種提法,其形態本身是數據云。人們用它來描述、定義信息爆炸時代產生的海量數據,并命名與之相關的技術發展與創新。讓我們看網上的一組數據,就能夠對“大數據”有一個生動的認識:平均每1秒鐘,會有60張照片上傳到網絡;每1分鐘,會有60小時視頻上傳到視頻網站youtube;每1天里,在臉譜(facebook)有40億的信息擴散;每個智能手機用戶平均會安裝65個應用;每一天里,互聯網產生的全部內容可以刻滿1.68億張DVD;每一天發出的郵件有2940億封之多(相當于美國兩年的紙質信件數量),發出的社區帖子達200萬個(相當于《時代》雜志770年的文字量)。在“大數據”中,存儲在數據庫中的結構化數據僅占10%,郵件、視頻、微博、帖子、頁面點擊等大量非結構化數據占據了另外90%。
“大數據”有幾個明顯特征。一是數據量大。“大數據”的起始計量單位至少是P(1000個T)、E(100萬個T)或Z(10億個T)。二是數據類型繁多。包括網絡日志、音頻、視頻、圖片、地理位置信息等等,多類型的數據對數據的處理能力提出了更高的要求。三是數據價值密度相對較低。如隨著物聯網的廣泛應用,信息感知無處不在,信息海量,但價值密度較低,如何通過強大的機器算法更迅速地完成數據的價值“提純”,是“大數據時代”亟待解決的難題。……