大數據(Big data)正構成我們明天的新大陸。
從2012年開始,我們將從大陸時代,移民進入大數據時代。
麥肯錫公司提出的大數據時代到來的觀點,引起了全球廣泛的反響。多家機構認為,“大數據”將會成為貫穿2012年的一條全新投資主線。
作為特指的大數據,按EMC的界定,其中的“大”是指大型數據集,一般在10TB規模左右;多用戶把多個數據集放在一起,形成PB級的數據量;同時這些數據來自多種數據源,以實時、迭代的方式來實現。IBM把大數據概括成了三個V,即大量化(Volume)、多樣化(Variety)和快速化(Velocity)。大數據通常與Hadoop、NoSQL、數據分析與挖掘、數據倉庫、商業智能以及開源云計算架構等諸多熱點話題聯系在一起。
作為泛指的大數據,則指向了定制化、差異化、個性化方向的競爭力。例如美國奧巴馬總統委員會的科技顧問Stephen Brobst所說:“過去3年里產生的數據量比以往4萬年的數據量還要多,大數據時代的來臨已經毋庸置疑。我們即將面臨一場變革,新興大數據將成為企業發展的當務之急,而常規技術已經難以應對Pb級的大規模數據量。這一變化所帶來的挑戰,是成功的企業在未來發展過程中必須要面對的。只有那些能夠運用這些新數據型態的企業,方能打造可持續的重要競爭優勢。”
我們原以為已經進入數據時代,其實真正的數據時代從2012年剛剛開始。標志性的區別就在于,以往的數據只是結構化的數據,是非個性化的數據;而進入2012年,非結構化數據占有比例將達到互聯網整個數據量的75%以上,這意味著個性化數據時代的到來。……