本刊記者|張鵬
Taste Analytics汪曉宇:中小企業市場才是大數據分析的“藍海”
本刊記者|張鵬

在廣闊的中小企業市場以及眾多面向最終消費者的商業領域,大部分企業對于如何引入大數據分析依舊毫無頭緒。
將大數據視為下一個市場風口,已經成為整個IT產業的普遍認知。
在美國,谷歌通過最新的大數據應用——谷歌趨勢,幫助全美的孩子們如何不會在今年萬圣節晚上與別人“撞衫”;在中國,馬云旗下的“芝麻信用”依托阿里大數據勾畫出了“個人征信”的雛形。與此同時,那些專注于大數據硬件設備的提供商也迎來了“旺季”,據悉在2014年,我國軟件和信息技術服務業實現3.7萬億元收入,其中數據處理和存儲類業務收入同比增長了22.1%。
不過,看似前景無限的大數據市場其實也有軟肋。目前,業界率先試水“大數據”的企業基本分為兩類:一是互聯網企業(部分IT企業),具備完善IT基礎設施和充足的IT人才資源,采用自建方式,最終形成可盈利的商業模式或是實現完整商業閉環的戰略布局;二是政府或大型企業,他們手握海量數據且資金雄厚,通過第三方公司提供的完整解決方案,實現對自有數據的挖掘和分析。
然而在更為廣闊的中小企業市場以及眾多面向最終消費者的商業領域里,大部分企業對于如何引入大數據分析依舊毫無頭緒。盡管這些企業對于從消費者數據中找尋商機充滿了興趣,但礙于企業IT程度有限、大數據人才缺失以及對前期大手筆投資硬件的顧慮,企業的管理者和CIO們依然沒能將“大數據分析”提上日程。
“目前市場中很多大數據項目都是外包給第三方公司,從項目接手到最終完成往往需要幾個月的時間,雖然能夠將數據轉化為有價值的信息,但卻錯過了寶貴的市場窗口,甚至在項目結束時市場風向已經發生了轉變。”美國數據分析科學家、Taste Analytics創始人及全美“前五”可視化研究中心的Derek Wang(汪曉宇)博士告訴《通信世界》記者。
如何打破大數據在中小企業市場遭遇的僵局?汪曉宇有自己的想法。在他看來,強化大數據分析平臺的“普適性”是切入中小企業市場的關鍵所在,大數據分析需要從初期的“手工定制”快速轉換為規模化的“工業時代”,當然,這需要全新的數據分析理念與實踐,以及“實時分析”、“數據驅動”和“人機互動”等一系列創新技術作為支撐。汪曉宇博士任職的北卡羅來納大學(UNC)夏洛特圖像可視化中心作為全美“前五大”的圖像可視化中心,正是研究這一前沿技術領域的主要陣地。
2013年,汪曉宇與其他數據科學家們攜其創新技術成果從學術界走到了工業界,創建了大數據分析服務公司Taste Analytics,并推出了實時動態、圖像可視化兼具非結構化數據分析能力的綜合智能數據分析平臺The Taste Signals Platform,為美國的大數據產業帶來了新氣象。
汪曉宇告訴記者,盡管中國市場在云計算、大數據領域的起步較晚,但通過近兩年的快速發展,中美市場對于大數據的概念認知和趨勢判斷,事實上并無差異。不同之處在于,美國大數據的技術走向更受市場需求的影響,面對著全球大數據市場普遍存在的幾大誤區,美國的大數據從業者們正在著力加以解決。

誤區一:大數據分析多依賴于現有模型和先前經驗。
目前市場中很多大數據應用都是通過套用固化模型和依據先前經驗而設定規則,這種做法并不是從數據中挖掘信息,大數據分析應該具備“深度學習”的能力,也就是計算機應該從大量數據中自己尋找“答案”,而不是僅為了驗證“過往經驗的準確度”。
誤區二:將大數據分析完全外包,浪費了企業內部人員智慧。
采用整體外包的方式雖然看起來簡單,但卻浪費了企業內部人員的價值;況且過度依賴外部的數據分析師,也不會為企業內部的數據人才培養和教育帶來任何幫助,將那些真正了解市場、懂得企業運作的管理者和分析師的時間用在數據采集和表格處理等環節,對于企業本身而言就是一種損失。如果能將內部人員的智慧和對數據的理解融入大數據分析的過程中,那么最終結果將會“更快更好”。
誤區三:大數據分析并不等于“海量數據”分析。
如何甄別有效數據是大數據分析的第一步,對于企業管理者而言,大數據分析并非意味著真的需要“大量數據”,選取真正有價值的信息源才是成功的開始。比如一家銀行開展用戶滿意度調查,其數據源并不僅限于海量用戶的重復交易比例和信息,更重要的是在只有幾百兆存儲量但卻包含成千上萬封的客戶反饋郵件里得到更深層的原因及結果。
誤區四:只抓取結構化數據,對非結構化數據“束手無策”。
非結構化數據恐怕是所有大數據分析工具的難題,但面對著網絡信息的日益復雜化,能夠反映企業運作情況和消費者意見的數據來源也越發多樣化和碎片化,諸如來自社交網站、客服中心以及線上交流軟件中的語音、圖像、視頻以及超媒體等信息,這些都應是大數據分析平臺所能涵蓋的數據源。
誤區五:保證“時效性”,才能讓大數據發揮“最大價值”。
大數據分析得到的結果經常用作輔助管理者的企業決策,或者用來指導企業下一步的市場行為,因此大數據分析需要具備時效性,甚至應該做到“動態實時”。尤其對于那些爭分奪秒的“電商”而言,同樣是消費者需求調查,花費數十個小時與僅需幾分鐘就能得到的分析結果相比,顯然后者對于企業市場行為的參考價值更大。