文|青鋒
小荷已露尖尖角
——悄然來臨的大數據時代
文|青鋒
“我們每個月向經銷商推薦大約150個目標客戶,因為他們想邀請潛在客戶來訪問他們的經銷點,但同時他們又不愿將營銷資金浪費在根本沒有購買意圖的用戶身上。通過基于像年齡、性別、地理位置、財務信息、售后體驗及購買歷史記錄等10~15個變量來定義預測模型,我們可以告訴經銷商:這100個人是在這個地區極有可能購買新車的客戶,而那100個人的購買可能性較低。”
這是菲亞特汽車公司客戶智能及宣傳經理Giovanni Lux的一段話,他所談到的數據信息來自于菲亞特的客戶關系及體驗分析數據庫,它包含了超過6400萬個客戶及6400萬輛汽車的歷史信息。
菲亞特在這里所用到的數據庫便是當前日益引人關注的大數據,所謂大數據,指的是超過傳統數據庫系統處理能力的數據,它具有四個顯著的特點:第一,數據體量巨大,從傳統的TB級別躍升到PB級別;第二,數據類型繁多,數據信息涵蓋網絡日志、視頻、圖片、地理位置信息等;第三,價值密度低,以視頻為例,在連續不間斷的龐大數據中,可能有用的數據僅僅有一兩秒;第四,對數據的處理要求高,即1秒定律。

圖1 大數據時代悄然來臨
隨著人類信息化步伐的加快,特別是云計算的大范圍運用,大數據正在成為一大熱門話題,正如VMware公司全球高級副總裁范承工所說:“你發的一個微博、上傳的一段視頻,都是大數據。”大數據之所以被人們所重視,是因為相對于傳統意義上的數據,大數據承載的內容更豐富、更細致,幾乎無所不含。但與之相對應的是,對大數據中有用數據的整理也更為困難,而一旦能夠對大數據進行有效的整理,其價值又遠遠大于傳統數據。
其實無論我們的主觀意識如何,在人類進入信息化時代后,大數據便已在客觀上悄然產生,在不經意間逐漸累積,只是在過去很長一段時間里,我們尚沒有能力掌控大數據,在技術層面無法對大數據進行甄選,從中挖掘出可供我們使用的有效內容。今天,隨著IT設備的長足發展,隨著網絡條件的成熟,隨著云計算從實驗室走向市場,我們終于具備了在浩瀚的大數據中“掘金”的條件,開始向著這片蘊藏著豐厚寶藏的海洋進軍。
云計算的應用使數據庫提升到了一個新的層級,更大的存儲空間、更迅速的響應時間、更豐富的信息來源,云數據庫引發了新一輪的信息數據“大爆炸”。云計算使我們對信息的收集前所未有的豐富和快捷,為大數據的分析奠定了堅實的基礎。面對數據庫中琳瑯滿目的各式各樣的數據,不對其進行分析,不從這些堆積如山的資源中挖掘出有價值的信息,不在這豐厚的寶藏中產生出利益,顯然不符合人類的知識需求。于是,在云計算進入市場應用后的短短時間里,大數據的開發便開始被人們所關注,并正在付諸各類實驗性的應用。
“雖然大數據本身是以數據形式存在,但大數據時代真正的到來離不開云計算的促進作用。以前我們都談虛擬化、云計算,當虛擬化進入到各種各樣的商務應用的時候,對虛擬化或者對云計算的框架最核心的沖擊便是對大數據應用的需求,所以如何在虛擬架構上優化大數據應用是很自然的一步。”VMware公司全球副總裁、中國研發中心總經理李嚴冰精準地描述了大數據與云計算的關系。
但一個顯而易見的問題是,對大數據的收集僅僅是“萬里長征走完了第一步”,當云計算“輕而易舉”地完成著對大數據的收集工作時,該如何對這些龐大的數據信息進行整理、分類、分析,成為擺在人們面前的一道難題。而一旦無法進行以上的工作,原始的數據便只是一堆“素材”,無法轉變為有價值的內容,當然更不能直接為我們帶來經濟回報。
前文列舉的菲亞特汽車公司的案例中,他們最后的分析結果來源于IBM提供的IBM SPSS解決方案。“IBM SPSS Statistics和IBM SPSS Modeler幫助我們在現有的和潛在的菲亞特汽車車主中識別出特定的目標,使經銷商可以用最高效的方式分配其營銷預算。第二,我們調查已購買新車或使用過菲亞特維修店的客戶。然后我們使用IBM SPSS Statistics分析這些數據以提供有價值的洞察,了解客戶對我們的經銷商及維修中心的滿意度。”菲亞特汽車公司客戶智能及宣傳經理Giovanni Lux這樣解釋這套在IBM訂制的解決方案的用途。
顯然,針對大數據進行相應的產品開發,為大數據的歸類和分析提供成套解決方案,已經成為相關企業一項新的業務發展規劃。“通常的Hadoop只針對物理機進行了優化,類似于物理機,我們把同樣的技術直接搬到虛擬機上,針對虛擬機運行環境對Hadoop開源技術專門進行一些優化,同時我們這一技術也直接貢獻給Hadoop社區。”李嚴冰描繪出一幅具體的發展藍圖,“這個項目歷經了兩年研發,現在我們覺得大數據處理的商機比較成熟了,通過幾個月的時間就把它進入了一個項目化、產品化的階段。”
當這一產業鏈逐步成型之后,越來越多的企業會感受到大數據分析所帶來的益處,也會對大數據的收集日益重視。目前通用汽車的安吉星服務每年管理的數據量已多達3PB,該服務為車主提供遠程車輛診斷服務、應對突發事件,這些數據無疑就是一筆金礦。利用這筆豐富的信息資源,通用公司正千方百計對其進行多層面的分析,轉而為客戶提供一系列有針對性的服務,使其成為一種市場競爭優勢。
中國聯通也正在通過采用基于至強平臺及英特爾發行版Hadoop的大數據解決方案來構建移動通信用戶上網記錄集中查詢與分析支撐系統。“這一系統可為我們的客戶服務人員提供客戶上網記錄的快速查詢服務,也可為客戶本人提供高效的異常大流量的上網記錄自助查詢服務,這將有助于解決流量投訴問題。”中國聯通研究院副院長黃文良表示,2012年10月將結束整個項目的建設,屆時除了為客戶服務人員提供服務外,系統還可以為中國聯通的業務部門提供分析、決策服務,未來該系統還有望幫助中國聯通更為準確地把握用戶偏好,從而讓中國聯通能更有效地制定市場策略和開發新業務。

圖2 大數據解決方案正在步入市場
雖然大數據目前在國內還處于初級階段,但是商業價值已經顯現。首先,手中握有數據的公司如同站在“金礦”上,基于數據交易即可產生很好的效益;其次,基于數據挖掘會有很多商業模式誕生,定位角度不同,或側重數據分析。比如幫企業做內部數據挖掘,或側重優化,幫企業更精準找到用戶,降低營銷成本,提高企業銷售率,增加利潤。據統計,目前大數據所形成的市場規模在51億美元左右,而到2017年,此數據預計會上漲到530億美元。
大數據是一個很好的視角和工具,從資本角度來看,什么樣的公司有價值,什么樣的公司沒有價值,從其擁有的數據規模、數據的活性和這家公司能運用、解釋數據的能力,就可以看出這家公司的核心競爭力,而這幾個能力正是資本關注的點。移動互聯網與社交網絡的興起將大數據帶入新的征程,互聯網營銷將在行為分析的基礎上向個性化時代過渡。對大數據進行整理和分析后,可以準確地告訴廣告商什么是正確的時間,誰是正確的用戶,什么是應該發表的正確內容等,這正好切中了廣告商的需求。
一場圍繞大數據的新業務正在展現出其勃勃的市場生機。