譚保羅
這個時代,人人都在說大數據,似乎不說這樣的流行詞匯,就會顯得你已經將自己與時代進步隔絕。
在企業家看來,大數據將引發新一輪技術革新和商業模式變革,一切的商業競爭都將圍繞大數據展開。
個人消費者則認為,大數據會帶來更便捷的生活、更物美價廉的商品,但個人隱私危機卻可能是這一潮流的副產品。
在政府部門看來,信息的爆炸和城市的膨脹,將增大城市管理的復雜性,但換個角度看,基于大數據的智慧城市構建,卻可以為城市管理的效率化提供了一條新路。
對中國不同的群體而言,大數據到底意味著什么?大數據浪潮引發的商業模式、公共服務變革將是什么樣的?為此,本刊記者采訪了著名信息管理專家涂子沛。
涂子沛,畢業于華中科技大學和卡內基梅隆大學,曾服務于中國武警部隊和公共部門,后旅美留學、工作多年,擔任中國旅美科技協會副主席,著有《大數據》和《數據之巔》等書。
2012年,中共中央政治局委員、時任廣東省委書記汪洋曾給省財政廳的全體干部推薦過《大數據》一書。2014年,涂子沛從硅谷回國,任阿里巴巴集團副總裁。
《南風窗》:大數據很重要,但對一般人而言,未必懂得什么是大數據。作為權威專家,能否用“白話文”說清楚大數據到底是什么?
涂子沛:從定義上講,大數據(Big Data)指的是一般的軟件工具難以捕捉、管理和分析的大容量數據。但這個“大”的主要價值,并不僅僅在于“容量大”。而在于通過對這些海量數據的交換、整合和分析,從而可以發現新的知識、創造新的價值。
大數據的魅力在于,信息固然是碎片化的,但當它們的量足夠大,那么通過有效整合,就會實現 1+1>2。現在中國都在講創新,萬新之源是數據。數據很寶貴,猶如黃金,但它不是黃金,而是創新的土壤。
《南風窗》:可否舉個具體的例子,談談以大數據為土壤的創新是什么樣的?比如某個具體化的商業場景,這樣更便于理解。
涂子沛:可以拿互聯網來說。最早的互聯網,是把機器和人連接起來,但今天的互聯網,某種程度上來看,已成為了沉淀數據的“基礎設施”。它的要義不僅在互聯,更在于數據。互聯網沉淀的數據,目前已成為人類前所未有的創新資源。
以阿里巴巴為例,我們是一家電商公司,通過“雙十一”大網購,我們其實創造了全世界的“數據之巔”。全世界沒有任何一個地方,可以在1天之內累計這么多的真實交易數據。
你每買一件商品,店家每賣一件商品,就是數據在平臺上的不斷累積。通過對這些交易數據的分析,平臺就可以判斷消費者的消費習慣以及商家的資質和業績。

11月3日,阿里巴巴集團副總裁涂子沛應邀在研討班上作《大數據與城市管理》的主旨演講。
對消費者而言,平臺通過這些數據可以實現更好的精準營銷。對商家而言,這是平臺了解他們最權威、最全面的資信數據。一家金融機構,可以通過對這些數據的分析,甚至“一秒鐘”就發放貸款,這種“審查”比傳統金融機構人工貸前調查更準確。阿里的螞蟻金服就是這個邏輯。
還可以舉個美國的例子。Kabbage是美國的一家互聯網金融公司,和阿里巴巴有著類似邏輯。它不光要求企業提供在電子交易平臺上的交易數據,還要求企業提供在Facebook或推特上和客戶互動的數據、快遞公司的物流數據。金融機構通過這些數據就可以很容易判斷,你的業務活不活躍,你的客戶忠不忠誠,你是不是皮包公司。
今天,互聯網金融所有的創新都和數據有關,數據正在變成信用,信用也正在變成數據。所以,阿里巴巴正在把中小企業的這套技術推向個人,這就是芝麻信用。你打開支付寶,就可以看到芝麻信用評分,對不對?
《南風窗》:這是互聯網金融基于大數據在信用領域的應用,那么在傳統企業的營銷上,大數據帶來的創新是什么?
涂子沛:今天,所有有客戶的公司都必須做好一個事情,就是要提供個性化的服務。從營銷的角度看,這是精準營銷。怎么達到呢?
比如,你在社交工具上說,我要結婚了?那么,這就代表你可能要購房、裝修,還要舉辦婚禮,以及購置孩子尿布等。這就是很好的營銷機會,企業就能向你實現精準的推送。等你的子女長大,新的需求又產生,那么數據后臺又可以向你進行新的商品營銷,這種跟蹤可能是長期的,甚至一輩子。
在保險行業,以前保險公司提供的產品都是A計劃、B計劃、C計劃等等,只有幾個類別,無法區分每一個人。但是,互聯網保險怎么賣?保險公司會搜集客戶更全面的數據,你的工作性質、作息習慣、駕駛習慣、飲食習慣、責任心等等,這些新的數據加上傳統數據,理論上講,就可以給每一個人都提供一個不同的個性化的保險定價。
《南風窗》:當前,中國的互聯網行業出現了所謂巨頭“割據”局面,而未來的競爭將是數據競爭,怎么看待巨頭之間這場競爭的前景?
涂子沛:巨頭們的數據有3種,一是電商巨頭的交易數據,二是社交公司的社交數據,三是搜索引擎的搜索數據。很顯然,第一種數據最有價值。
首先,交易數據是最真實、最可靠的數據。舉個例子,你在網購平臺只會有一個網購賬號和第三方支付的賬號,而且是實名的,但你卻會有很多社交工具賬號,而搜索數據則更模糊和非結構化。因此,這些數據的真實性有差異。
未來,互聯網發展的一個大勢是,網絡和現實正在越來越重合。拿Facebook來說,用戶的真實性正在不斷提高,它幾乎就是以個人真實信息為基礎的,家庭成員和朋友都在上面,都是現實中的社會關系。因為,只有真實的信息才會降低交易的成本,而這正是社交工具的發展方向。
對不同的數據類型而言,更重要的差別是數據的核心程度。企業核心數據之一是交易數據,電商平臺自然搶占先機。社交巨頭的用戶并非企業,而個人用戶提供的也不是交易數據。再看搜索引擎,盡管它為企業做推廣,但企業做推廣時,提供的數據并非核心的、全面的數據,因此它們的數據質量是不同的。
對個人數據而言,情況也差不多,電商平臺擁有用戶的最重要的數據—個人信用,但個人的社交數據和搜索數據則并不那么核心,這些都會決定未來的競爭格局。

研討班上,將大數據運用于城市治理,也是專家們感興趣的話題。
《南風窗》:這個時代已由信息化社會進入數據化社會,大數據將會越來越多地被用于城市治理,也為城市治理提供了很多機遇,這些機遇主要表現在哪些方面?
涂子沛:的確,大數據的不斷運用正在為城市治理提供很多價值,甚至比商業領域還要多。例如政府的稅務局,很多地方的稅務局有幾萬平米的空間保存稅務資料,全國的稅務局都差不多,另外,也可以想象,我們的企業其實也在用相應的空間保持自己的稅務資料。
每個親眼看到巨大的空間保存著的海量資料,都會震驚,這是空間的巨大浪費,我想的第一個問題是,一方面,紙質的資料很難保存。另外,紙質的資料也很難做到有效整合,查找的效率會很低。為什么不全部實現電子化?
稅務加上大數據,其實想象空間很大。我們一直講要建設“服務型政府”,而對大數據的運用則是提高政府服務質量和效率的重要途徑。企業的稅務資料來說,它和金融機構通過企業的交易數據判斷企業資信一樣,通過這些數據,地方政府可以更好地分析當地的產業現狀,制定產業政策,以及提供企業亟須的公共服務。
再比如我們戶籍制度,以前,關于個人戶籍的數據就只有一條,它不是大數據,而是“死的”數據。可以期待,未來市民更多的信息將被公共管理部門納入戶籍數據之下,這些數據因為足夠充沛,就是“活的”數據,管理部門可以對城市居民進行更全方位的了解和分析,提升城市管理的效率和政府提供公共服務的水平。
《南風窗》:你一直強調政府部門的數據要開放、共享,要建立標準,從而打破現在的“孤島化”局面,如何解決這個問題?
涂子沛:我剛才提到了稅務局,其實在很多城市,哪個局的情況都差不多。目前,政府部門的數據孤島化很厲害,信息無法共享。舉個例子,現在的“黃金周”,各大城市都堵車嚴重,這背后的技術性原因之一就是,旅游部門和交通部門的信息無法共享。交通部門看不到旅游部門的數據,它就無法準確、有效地的規劃交通。
如何解決孤島化的問題?從技術上講,一個方式是將數據放在同一朵云上集中儲存,還應制定統一的數據標準。
當然,解決這個問題更涉及到政府組織結構、職能架構等方面的重新整合問題。比如,在市民服務中心,很多部門的服務區都是分開的,其背后就是因為各部門并沒有實現信息共享。當信息實現了充分的共享,一個部門就行了,這是一個流程的重新再造和政府職能的重新劃分問題。
《南風窗》:在大數據時代,個人信息的被“整合”,會不會導致個人隱私的危機?
涂子沛:個人信息數據的開放,并不是把原始數據毫無保留地進行開放,而是要經過處理,而這種處理的成本并不低。必須用足夠的人力和技術對這些數據進行“清洗”,涉及國家安全、市民隱私的信息不能開放。大數據,并不是所有數據都是和開放,不能一刀切。
歷史上,美國聯邦政府曾希望建立全國統一的身份證。現在,美國人日常生活中主要有駕駛證、護照和社會安全號這3證。由于涉及公民個人隱私的問題,統一身份證一直沒有實現,這背后是多方的博弈。
《南風窗》:廣州一直在打造智慧城市,從政府提供公共服務的角度來看,你認為一座智慧城市應該是什么樣的?你有什么建議?
涂子沛:在未來的智慧城市里,憑借著大數據的運用,對每一部車、所有城市的活動、人的活動等數據進行有效的整合,這樣就可以為社會提供更好的服務和管理。
在加拿大的蒙特利爾,這座城市有120萬人,但對這些居民,交通系統可以做到都提供有個性化的出行方案和票價。為什么?因為搜集了大量的數據,根據這些數據可以做判斷,為每一個人提供一個出行方案和票價。
這樣,不但方便了市民,對于公共服務的提供者而言,也提高了用戶的黏性。同時,還利用不同票價,可以平衡不同線路的流量,從而實現公交系統的效率最大化。
我在《數據之巔》中提出,要建設“數據之巔”,應該有3個維度,其中第一個就是政策維度。建設智慧城市,不僅僅是技術創新,更是社會治理模式的創新,這就要求政府要進行一個頂層設計。你必須要制定一個標準,讓各個部門、各個行業都能夠統一起來,這是建設的基礎。必須要自上而下,而不是自下而上。
從技術為度來看,在建設智慧城市的過程中,物聯網、云計算、大數據共同構成了智慧城市的3大核心技術。其中,物聯網是城市的觸角,云計算是軀干,大數據是智慧城市的大腦。
第三個是文化維度,我們中國人一直缺乏數據文化,為什么胡適批評“差不多先生”,歷史學家黃仁宇探尋“數目字管理”,這就是文化的問題,這個必須要慢慢改變。