陳紀英
如果把大數據比做新大陸,第一個發現者是美國人。大約一年前,2012年3月,奧巴馬當局發布了《大數據研究和發展計劃》,對大數據戰略的重視堪比當年克林頓政府提出的信息高速公路戰略。而眼下,在中國大數據最積極的參與者,仍然還是阿里巴巴、騰訊這些互聯網企業。
大數據究竟是一座金礦還是水坑?中美兩國在大數據上的差距究竟多大?阿里巴巴、騰訊、百度,在大數據時代,能否超越谷歌?帶著這些疑問,《中國新聞周刊》專訪了中國社會科學院信息化研究中心秘書長姜奇平。姜是最早把“大數據”概念引入中國的專家之一,也是推動大數據進入國家戰略的積極呼吁者,在過去十年,他一直致力于互聯網經濟學理論前沿研究。
中國新聞周刊:大數據的概念怎么界定?
姜奇平:大數據其實是托夫勒在1980年《第三次浪潮》中早就預言的,“如果說IBM的主機拉開了信息化革命的大幕,那么大數據則是第三次浪潮的華彩樂章”。從信息高速公路到大數據,都是以“第三次浪潮”為標志的第二次現代化。
大數據時代是第三次浪潮信息革命的高級階段。主要有幾大特點,從規模上來說是海量數據;從數據形態上來說既包括了結構化數據,也包括非結構化數據,具體形態有文字、數字、圖片、音頻、視頻等。再進一步引申,大數據的處理工具是開源軟件,這些軟件主要用于分布式計算,與之相反的是集中計算模式。
中國新聞周刊:具體而言,大數據時代經濟領域將會面臨哪些變革?
姜奇平:大數據有光明的商業前景。現在大的互聯網公司都有大數據戰略。2013年將是大數據產業元年,保守估計,將來大數據市場規模至少將會有上萬億元。具體而言,大數據這個產業鏈包括數據存儲,數據挖掘、數據開發應用等環節。
首先,大數據產業本身會有大發展。從信息產業來講,未來大數據會和云計算、物聯網結合起來,并出現很多數據中心,推動技術創新,推動技術服務產業的興起。
大數據行業的發展,連帶的也會引起其他產業的分化變革。比如傳統的統計、分析軟件行業,以前賣的是產品,未來可以賣數據分析服務,這些領域都會展開,并在未來會形成數據產業鏈。這些都是我們能預見到的場景。
大數據還會成為很多行業的主營業務之一。比如銀行和電子商業行業,以前數據部門是輔助部門,現在數據業務逐漸成為金融行業的主營業務。還有電子商務行業,以前以交易為主,但是現在數據已經成了阿里巴巴的三大主營業務之一。
在電子商務領域,大數據將會帶來產銷逆轉,從B2C、C2C升級為C2B,過去廠家從自己的判斷出發,生產出來商品向消費者推銷。未來則是先去分析用戶的需求,根據用戶的需求向用戶提供定制化的服務。
現在美國出現了情境定價,比如一件衣服就生產一件,這樣的話商品附加值很高,利潤率很高。
另外一方面,可能本來成本很高的產品,也會降低下來。比如3D打印,以前制造一個模具很貴,所以只能給所有人提供標準化的產品,因為只有規模效應才能降低成本。
中國新聞周刊:2012年3月29日,奧巴馬政府發布了《大數據研究和發展計劃》,對大數據的重視堪比之前的信息高速公路。中國應該出臺這樣的戰略么?
姜奇平:中國應該盡快出臺國家層面的大數據戰略。目前在大數據的國家戰略層面,中國與美國還有不小的鴻溝。中國在涉及先進生產力、科技創新的重大潮流方面,很多時候都是被動地跟在美國后面。中國時下的觀念水平還停留在第一次現代化上,只對第二次浪潮的東西(如包括高鐵在內的“鐵公基”之類)產生靈光。這是我們步步趕不上趟的深層原因之一。這個問題不是在科技創新層面能解決的。變被動為主動的關鍵,是跳出就事論事的追趕,形成以信息生產力為基礎發展新文明的觀念。
而美國政府高度重視大數據,奧巴馬政府2012年3月29日發布了《大數據研究和發展計劃》,提出要收集龐大而復雜的數字資料,并從中獲得知識和洞見,以提升能力。但中國在大數據上還沒有形成自己的頂層戰略。
大數據的關鍵并不在數據原料的多少,而在于數據加工能力,這才是大數據真正的價值。海量的大數據堆積起來,如果不能加以利用,也是沒有價值的。在即將到來的大數據時代,最有價值的不是數據采礦業,而是數據加工處理能力。
如果中國陷入群龍無首、無頭蒼蠅式的大數據狂潮,大干快上大數據中心大樓、大產業園,這樣很有可能只是肥了投機房地產或鉆稅收優惠空子的人,仍然避免不了落人數據鴻溝。要解決這個問題,就要把產業文章做在數據加工增值上,不光要“收集龐大而復雜的數字資料”,更要著力“從中獲得知識和洞見以提升能力”。
除了國家的頂層設計,大數據行業也要盡快建立大數據的技術標準。中國是全球最大的大數據市場之一,所以在大數據的技術標準方面應該掌握話語權,我們提倡的是以市場為導向的技術標準。能制定標準,相當于制定游戲規則,才能在以后的發展中掌握主動權。
中國新聞周刊:從技術上層面來說,中國公司和美國公司的差距大嗎?
姜奇平:存在技術差距。在數據存儲方面,美國比較先進的有EMC公司。而IBM則是通過整合大數據的信息和應用,給企業提供“硬件+軟件+數據”的整體解決方案的,技術實力很強大。還有像亞馬遜擁有大量的用戶信息和交易數據,對用戶信息的大數據分析,解決自己公司的精準營銷和個性化廣告推介等問題。而臉書則擁有大量的用戶信息以及用戶之間的網絡狀關系信息。比如臉書把大量的用戶和氣好友按照各個緯度進行細分,然后進行精準化的營銷,前景遠大。
中國新聞周刊:5年后,全世界最有名的大數據公司里,會不會有來自中國的公司呢?
姜奇平:我想,這些技術鴻溝并非沒有趕超的可能性,中國公司在某些方面也有自己的優勢。比如阿里巴巴,現在掌握了大量交易信息,交易信息比搜索信息復雜同時含金量也更高,整體上的數據量可能比谷歌更豐富。阿里巴巴大數據戰略方向清晰但是現在阿里巴巴要提高加工能力,比如如何用數據戰略真正落實小而美戰略,小前端、大平臺、富生態如何實現。數據是很有價值的富礦,但是如果放在那里沒有充分開采,就很浪費。
百度跟谷歌相比,是負擔小,未來大數據的重要方向是移動互聯網。現在谷歌有安卓系統,但是這塊未來可能是個雞肋,因為這塊未來和大數據的分布式計算要求難兼容。百度沒這個包袱,而且百度現在也在和移動開發者合作。
騰訊呢,現在有殺手級產品微信、QQ,在移動互聯網時代,通過這些產品能完整掌握互聯網用戶的生活軌跡。不用愁騰訊怎么賺錢。
為什么說騰訊百度等可能超越谷歌?谷歌等互聯網的模式是水庫模式,等到了建立在分布式計算基礎上的智能網絡時代,水庫塌陷了,是一個個水坑了。而騰訊的微信,底層架構技術很好,能夠適應大數據時代的分布式計算的要求。
中國新聞周刊:在大數據領域,未來是大公司有機會還是小公司有機會?
姜奇平:大公司小公司都有機會。很多創業公司也有機會,大數據行業應該有這樣的傳奇,一個年輕人現在進入行業,未來成為首富,這并非不可能。為什么呢?因為大數據是基于開源軟件的,代碼是公開的,你可以去看,而且數據的獲取沒有很高的門檻。年輕人缺的是資金,但是現在數據就在那里,就相當于工廠給你建好了,就看你能不能生產出好的有創意的有價值的數據產品了。