
進入2014年,大數據正從紅遍媒體的概念炒作逐漸落地為生財的產業。如雨后春筍冒出的大數據服務商,在中國市場上展開了激烈角逐。從“中國大數據服務商綜合服務水平TOP100排行榜”(以下簡稱榜單)中,已經可以隱約看出中國“大數據云圖”的雛形。
中美“大數據云圖”結構比較
相比美國同類榜單,高居首位的10Gen僅列第43,而大數據股明星Tableau僅列第45,而Marketo干脆沒上榜。這讓我們注意到榜單標的服務范圍是中國,而非美國。
我去年到美國與《大數據云圖》的作者芬雷布交流時,已經注意到,中美大數據產業布局存在巨大差異。在一年時間里,中國大數據的產業版塊正發生巨大變化;對比大數據云圖2.0版(2013版)與3.0版(2014版),美國的產業也在急劇變動。
美國大數據云圖3.0版將產業版塊重新劃分為六塊,分別為數據源、開源、跨平臺基礎設施/分析、基礎設施、分析、應用。其中“分析”領域的熱點是數據可視化、非結構化數據;“基礎設施”領域的熱點是NoSQL和NewSQL數據庫;“應用”領域的熱點是廣告優化和營銷。
比較中美“大數據云圖”,可以看出以下特點:第一,在“數據源”領域,中美各有特色,中國互聯網平臺數據源和行業數據源建設已經起步,但本地數據(語用數據、情境數據)仍有待加強。第二,“開源”、“跨平臺基礎設施/分析”和“基礎設施”三個領域,美國處于壟斷地位。榜單中位列前15的均是美國廠商,且多跨“跨平臺基礎設施/分析”和“基礎設施”兩個領域。中國一些廠商認為美國相關技術專業性太強,不利于普及,更傾向短平快技術應用。但一些企業堅持在這些重要領域耕耘,如商業智能軟件(用友軟件,久其軟件);數據中心建設與維護(天璣科技、銀信科技、榮之聯等);第三,中國廠商絕大多數集中于“應用”與“分析”領域。前者如廣告優化與營銷(阿里巴巴、騰訊等),金融、汽車、政府、健康、教育、安全等行業應用;后者如數據處理、分析環節、綜合處理(拓爾思、美亞柏科等),語音識別(科大訊飛),識頻識別(海康威視、大華股份、華平股份、中威電子、國騰電子)。在應用領域,中美熱點相似度較高,都包括廣告優化、營銷、金融、產業、政府、健康、教育、安全等。
如果以上是對榜單的結構分類分析,接下來要按價值分類進行分析。
對中國“大數據云圖”的價值分析
對大數據進行價值分類,可分為“風動”(客體價值)、“幡動”(主客體價值)、“心動”(主體價值)三類。這是六祖壇經的價值分類法。
1、風動類的大數據,是工程師眼中的大數據,看到是技術。典型代表是3V、4V說。林林總總的這方面定義,可以用一個詞概括,這就是“復雜”。大數據本質上是復雜性數據。
從這個方向觀察,中美企業差距較大。榜上前10名基本都是屬于“跨平臺基礎設施/分析”的美國廠家。其中HP今年剛被列入美國“大數據云圖”(3.0版),如今赫然列在第4。而以硬件加強大數據,7.4億投Cloudera異軍突起,HADOOP的CDH平臺占中國一半的英特爾列在第2,卻至今不在美國榜單。顯然這是美國榜單出了問題,而中國這個榜單跟進比較及時超前。
未來發展,中國企業需要回到圖靈初衷,找到復雜性數據的感覺(而不光是象谷歌那樣迷信數學算法),沿跨“科技-人文”二元的“數據科學”方向發展。華為與倫敦帝國理工學院共建數據科學創新實驗室,是積極跡象。
工程師撲向復雜性數據,就象小孩子撲向玩具一樣,只關心是與不是這種事實評價,并不關心好與壞這種價值評價。商務或政務的代理人關心的是技術應用于人之后產生的價值,因此要把客體與主體聯接起來。
2、幡動類的大數據,是業務代理人眼中的大數據,看到的是工具和能力。以美國政府的定義為代表。林林總總的這方面定義,可以用一個詞概括,這就是“洞察”。
數據越復雜,成本越高,是遲鈍(又稱工業病),為不好;數據越復雜,成本越低,叫靈活(SMART),是好。洞察,就是指“穿透信息迷霧”。這是當數據進入澤字節(ZB)時代后,避免信息垃圾填埋,反而能保持“清清楚楚明明白白真真切切”的能力。
相比基礎技術,中國企業借助市場優勢,在應用方面具有優勢。因此可以看到大批國內企業在榜。其中可分為三類,一類是ICT服務商,如華為、浪潮、用友、東軟、金蝶等;一類是國內上市公司,如拓爾思、東方國信、天璣科技等“大數據概念股”;一類是互聯網企業,如阿里巴巴、百度、騰訊等。
ICT服務商共同的特點,是從軟硬件技術服務向商業數據服務方向轉。例如,華為發布企業級大數據分析平臺FusionInsight ,幫助企業洞察新商機。 用友通過“用友NC” 正在探索基于云平臺的系列方案與應用服務,包括提供企業營銷管理、供應鏈、制造生產、項目管理等服務。
大數據概念股上市公司的共同特點,是從解決方案提供商在向行業云數據服務方向轉型。例如,東軟集團在傳統IT 服務基礎上,向車載電子和醫療服務等新興領域深化云數據服務。拓爾思開始做跨行業應用,和天行網安協作,提供基于數據分析的安全服務;天璣科技正從服務傳統IT架構,轉變為服務互聯網架構,從純粹的服務供應商,演變為產品和服務的提供商。此外,一批有數據中心業務基礎的廠家也在向大數據轉,如榮之聯、中科金財等。
互聯網企業,如百度、騰訊、阿里等擁有數據的平臺型企業,紛紛針對自身的平臺用戶提供數據分析業務,并且向金融、環保、交通、醫療等行業的數據分析應用逐漸滲透。例如阿里巴巴開始做金融行業的數據分析應用。
透過目前的榜單,我們可以看出一個目前尚不明朗的潛在趨勢。這就是亞馬遜模式的興起。亞馬遜的重要性,我認為不能僅看到它排名第7這個表象而有所忽視。事實上亞馬遜的大數據收入,是排位在前的所有廠商之和還要多許多。據Synergy報告顯示,2013年第三季度,亞馬遜獲取了美國云計算市場總收入25億中的多數份額,本身收入提升55%。Synergy估計,亞馬遜第四季度云計算收入將達7億美元,比微軟、IBM、谷歌、Salesforce.com的總和還高出15%。這不是偶然的。限于篇幅不展開談。這意味著中國企業中近亞馬遜模式的,如阿里巴巴、用友、東軟、金蝶等,還有更大潛力空間。
穿透今天這個排名來看明天,我們需要高度重視這樣一個市場信號:大數據應用的主戰場,可能并不象人們一般以為的那樣,是在信息技術服務領域,而可能轉向商務服務領域。這是ICT服務商、大數據概念股和互聯網公司未來共同的轉型升級方向。此外,大數據的絕對優等生FACEBOOK在中美大數據云圖中都不見蹤影,但類似模式卻代表前沿方向。
3、心動類的大數據,是委托人(領導者與最終消費者)眼中的大數據,看到的是目的和意義。以IBM的智慧計算為代表。林林總總的這方面定義,可以用一個詞概括,這就是“意義”。
有能力,卻不明確要解決什么問題,大數據就是屠龍之術。大數據工作的結果,如果是把符合意義的數據留下來,叫智慧;如果是把不符合意義的數據留下來,叫愚蠢。大數據的主體價值在于把人的目的和意義的保障系統加以專業化(準確說是把手段與目的校準,保障做事不忘宗旨這件事專業化)。做事情的意義,無非來自兩個方面,或者是老板指示目標;或者是目標本身,即最終消費者的滿意與不滿意。
按這個標準衡量,大數據發展到今天的水平,還很少有哪家達標。大數據要真想讓付錢的人心動,還需要把大數據發展到更高階段。好的跡象是,位列第1的IBM,至少在大數據綱領上,已明確了“智慧”這個主題詞。說明他從100家中脫穎而出,第一個想明白了,通過風動、幡動,到底要讓人心動,還是心不動。