本刊記者 | 魯義軒
整合與分析:發揮大數據價值的兩大關鍵
本刊記者 | 魯義軒

Q&A:中興通訊有線經營部服務產品總監 湯太軍
Q 近期美國AT&T開始向需要的公司銷售客戶使用數據,被視為利用大數據資源盈利的一種嘗試。此前許多電信運營商的很多數據都是通過專有網絡引擎以及高度專業化的CRM及計費軟件收集的,但如何于挖掘這些數據的價值并為己所用,似乎沒有太強的能力。在您看來,這樣的現狀需要通過哪些方式解決?
湯太軍:運營商現在主要的問題不在于沒有數據或是數據量不足,而是在于其有效識別和組合分析數據并將其轉變成知識的能力相對較弱,AT&T對外銷售的是經過分析處理的數據資產,這需要具備大數據的分析處理能力,而不是原始數據的簡單銷售。運營商首先要能把自己業務系統中產生的各類數據整合起來,比如CRM系統、計費系統、信令系統、資源系統等,找到數據間的相關性,識別真正有用的數據,排除數據廢氣的干擾,同時還要考慮用戶隱私保護問題,經過一系列科學化處理以后的數據才能真正稱之為大數據資產。運營商目前迫切需要的正是這樣一個大數據的前期處理平臺,能整合來自不同業務運營部門分散的數據庫,統一數據存儲,完成數據清洗和轉換,轉變成可進行多維度分析的數據元組保存下來,進而不斷利用或者交易它們。所以運營商要解決大數據資源的盈利問題第一步需要建立一個適應大數據的集成平臺,第二步是基于平臺開展數據整合工作。運營商可以通過采購成熟的大數據系統和數據分析服務來快速獲得這種能力,也可以通過戰略合作的模式逐步打造培養自身的大數據資源和人才隊伍。
Q 在挖掘大數據價值并轉變為商業價值的同時,運營商該綜合哪些因素的考慮,利用哪些技術搭建起一個平臺,使其發揮數據分析的作用?
湯太軍:電信運營商的數據特征較為鮮明,一類是海量但實時性要求不高的數據,如后付費計費消息、信令消息、性能統計數據等,另一類是實時性高的流數據,如流量統計、位置信息、實時賬單等,因此在構建大數據平臺時必須兼顧這兩類數據的處理。
運營商以往的數據庫系統比較適合格式化、批處理、非實時性的數據,而在流數據和互聯網數據處理方面存在不足。構建大數據的平臺并不需要拋棄運營商已有的關系數據庫系統,相反可以繼續利用關系數據庫系統在處理結構化數據方面的效率優勢,在此基礎上疊加針對非結構化數據和流數據的系統,從而實現最低成本的大數據平臺演進。
毫無疑問,在非結構化數據批量處理方面,Hadoop已經是事實上的標準,主流的數據庫廠商也都采用了這一技術,運營商也不例外,但由于Hadoop是開源技術,同時對使用者的技術要求比較高,因此我們建議運營商選擇經過商用化處理的Hadoop內核方案,在易用性和可擴展性方面都好于純粹的開源產品。而對于流數據的處理,業界已有比較成熟的解決方案,基于復雜事務處理的流處理技術已經有較多的應用,可以選擇商用化的系統進行部署。
當然要實現數據的高效利用,還需要在數據的輸入部分和輸出部分做一些定制化的處理,使得數據輸入環節能識別和區分不同的數據處理需求,將合適的數據分發給合適的系統進行處理,而數據輸出環節則充分利用可視化技術以更加友好的方式來呈現結果。
在搭建大數據的價值轉化平臺過程中運營商應該綜合考慮技術、成本和資源的因素,還要考慮與現有數據處理系統的兼容性問題。
Q 國際上有哪些運營商已經開始利用大數據提供服務獲得先期經驗?
湯太軍:Verizon在美國推出的“Precision Market Insights”服務,已經開始向第三方售賣Verizon手上的用戶數據,對商場、體育館、廣告牌業主等出售特定場所手機用戶的活動和背景信息。
2012年西班牙電信公司成立了一個新部門——西班牙電信數字洞察(Telefonica Digital Insights),目的就是為企業及公共部門提供基于用戶匿名位置數據的“分析洞察”,其第一款產品是智能步伐(Smart Steps)已為零售商和其他機構提供手機用戶全天活動的位置“熱點地圖”(heat maps)。
德國電信和Vodafone在利用大數據為自身業務服務之余,已向商業模式跨出了一步。主要嘗試是通過開放API,向數據挖掘公司等合作方提供部分用戶匿名地理位置數據,以掌握人群出行規律,有效地與一些LBS應用服務對接。
從國外運營商的先期經驗來看,大數據服務尚處于初級摸索階段,運營商更多的是扮演大數據資產擁有者的角色,并沒用通過大數據的洞察和利用來獲得更多的價值。西班牙電信公司成立單獨的公司運作大數據應用,通過獨立公司或控股合作公司專門開展大數據服務不失為一種好的發展模式,可供國內的運營商借鑒。
Q 此前運營商談的較多的是流量經營,通過分析不同的業務等級提供不同級別的服務從而獲得差異化經營,大數據的數據分析以及商業轉型似乎和流量經營有同樣的方向,大數據服務如何融入到流量經營策略中?
湯太軍:流量經營的一個核心是要能對流量進行高效的識別和分析,要實現基于流量的精細化運營更要求系統能對大流量數據實現實時化的分析處理,從而為流量管控提供真實可靠的參考信息,因此流量經營一定程度上可以說是大數據在大流量數據實時分析處理方面的一個典型應用。
但大數據的一個最重要的優勢就是數據可以通過再利用發揮更大的價值,需要不斷發現新的價值模式。以流量經營為例,通過對實時流量數據的分析可以實現流量的及時管控和流量疏導均衡,這些實時的流量數據是否過時就沒用呢?不是的,通過對一段時間歷史流量數據的批量分析,運營商又可以發現整個網絡的流量分布特征,這可以指導運營商調整網絡的規劃布局,發掘新的流量增長點。通過對特定人群的流量數據分析,可以推出個性化的流量套餐,進一步提升套餐價值。需要說明的是,流量數據僅僅是大數據中的一種類型,通過把流量數據與其它的業務經營數據結合進行相關性分析,還能獲得更多的商業機會,流量經營僅僅是運營商結合大數據分析拓展收入的一個方向而不是惟一方向。