隨著云計算、互聯網和存儲能力的發展,互聯網進入了大數據時代。在移動互聯網時代,大數據的挑戰包括了數據搜集、云計算、數據挖掘和智能應用,每個階段還有相當多的決策。
近兩年,大數據這個詞已經耳熟能詳,異常火熱。大數據其實就是所謂的信息海洋。移動互聯網每天產生大數據,譬如中國聯通每天會在移動互聯網上產生600億條的商業記錄。數據速度、總量和種類都很有突破性。
移動互聯網大數據的價值
如今都在談大數據,那么相對而言小數據是什么呢?“人類的發展史其實就是小數據的挖掘史。比如牛頓的三大定律,其實就是從對小數據的分析得到的。名醫華佗做的也是小數據挖掘,通過診斷一些病人,得到經驗并總結規律。因此,人類的發展至今都在不斷分析小樣本數據,從中抽取一般性規律和一些大概率事件”,陳一昕解釋說。
隨著云計算、互聯網和存儲能力的發展,互聯網進入了大數據時代。大數據必然對人類發展帶來新的變革,為此陳一昕分析了大數據的三個創新點:
首先,當數據量非常大的時候人們對于數據的質量要求比較低,而數據非常多的時候則可以容忍數據中的“噪音”。第二,數據量越來越多的時候會出現更令人感興趣的內容。也許可以通過一個大數據模型更好地發現更有價值的東西。所以小數據當中可以發現大概率事件,大數據可以發現小概率事件和突發性事件。突發性事件往往更有價值。比如金融危機、海嘯、地震和金融欺詐等都是突發性事件。另一點很重要,在大數據時代人們更加關注數據間的關聯性而不是因果性。”
移動互聯網時代大數據的挑戰
移動互聯網運營商擁有大量數據,也有無限的應用,如何體現這些價值?
“作為運營商,我們主要的戰略就在于把握大數據的倉庫,因為我們掌握了一個金礦。作為電信企業,沒有必要和其他的企業比拼如何打造金戒指,誰打造得更漂亮。我們要做的是把金礦管理好,把金條做好”,陳一昕打比方說道。中國聯通目前開發的沃云就是大數據的支撐平臺,同時也開發了移動上網的大數據平臺,每天上網的數據會傳輸到大數據平臺,并且對外開放數據挖掘的能力。
在移動互聯網時代,大數據的挑戰包括了數據搜集、云計算、數據挖掘和智能應用,每個階段還有相當多的決策。比如,結構化和非結構化的數據如何整合,如何支持數據速度,處理能力能否滿足數據速度,以及數據安全隱私問題等。
陳一昕強調大數據時代最大的挑戰可能是人才?!懊绹溈襄a全球研究院報告指出到2018年,具有深度大數據分析的人才缺口可能達到60%以上。大數據人才不光需要有理工科的知識和數學建模的知識,也需要了解企業和商業的痛點在哪里,并據此提出正確的模型。所以包括聯通在內,現在都要打造這樣一支團隊。”