

坦白地講,我并不喜歡“大數據(Big Data)”這個詞,聽起來太過技術化,又有些空洞,但大數據的威力卻是我們無論如何都無法忽視的,并將深刻地影響我們每個人的生活。
我們所做的任何一件事都會(將會)留下一條可追蹤的數字軌跡(或稱數據),而這條軌跡能夠被我們或他人利用和分析,這便是大數據存在的前提。通過捕獲和分析大數據,我們能夠在短短幾分鐘內解密人類的DNA,找到治愈癌癥的良藥,精確預測人類行為,于無聲中挫敗恐怖襲擊,進行精準營銷,預防流行性疾病的發生等。當然,正如多數新生事物一樣,大數據也具有兩面性,既能造福于全人類,也能帶來災難性的后果。
大數據的應用與我們抓取分析當下產生的數據的能力息息相關。若能全面利用這些龐雜的數據,我們便可以理解周圍的世界,以及存在于其中的萬事萬物。你可能質疑:這些內容有什么新鮮的嗎?一些公司和機構不是一直在抓取和分析數據嗎?的確如此,但有兩個因素正發生著質的變化,這也是“大數據”之所以成為大數據的根本原因:
我們生成的新數據的體量變得空前龐大——我將其稱之為世界的“數據化”。
我們分析大量數據,處理多種復雜數據的能力在近年來獲得了突飛猛進的發展。
世界的全面數據化
所有活動和行為(人類行為或其他行為)都將會留下可追蹤的數字軌跡(這一想法讓人瞬間感到后背發涼,有種深深的不安):
人與人之間的信息交流越來越多地留下數字記錄:我們的郵件存儲在公司的系統中,我們在社交媒體的狀態更新被備份存檔,我們的通話被轉換成數據信息保存起來。……