本刊記者│刁興玲 張鵬
運營商拓展大數據業務還需“精耕細作”
本刊記者│刁興玲 張鵬
運營商意識到,海量數據規模的優勢只是基礎,如果不能在應用或者解決方案方面有所突破,運營商仍然只是管道而已,只不過原來是通信管道,現在成了數據管道。
對話:
中國電信北京研究院燈塔大數據研發與運營中心主任 .........孫靜博
中國電信上海公司新興業務運營管理部大數據運營中心主任 ...馮耀洲
山西移動IT支撐技術專家 ...................................盧山

行業應用創新是運營商大數據應用面向客戶的最后一步,也是至關重要的一步。經過了兩年多的概念導入和市場宣傳期,如今的運營商在大數據領域早已跨過了研究與規劃階段,走上了更為踏實和充滿挑戰的“大數據變現”之路。那么,運營商應該如何充分利用自身已有的數據規模優勢,通過數據開放平臺,構建以服務為核心的數字商業模型?本期《通信世界》特邀多位運營商專家,共話電信業大數據的未來。
《通信世界》對于運營商而言,當下較為棘手的并不是如何研究和規劃大數據,而是如何將“大數據”付諸實踐,目前運營商大數據應用較為成熟的領域和業務系統有哪些?
孫靜博:在大數據浪潮中,電信運營是率先開展大數據研究和應用的行業之一。通過利用運營商海量網絡大數據資源,中國電信北京研究院通過大數據技術創新,自主研發了燈塔大數據行業應用創新平臺。在燈塔平臺的基礎之上,打造了一套完整的“5+1+1”大數據產品體系,5個產品方向包含精準營銷、金融征信、人力資源、市場研究和地理商業智能,1個平臺指的是Data Fusion&Insight能力平臺,另外一個“1”指的是交易市場。
在精準營銷方向,我們利用數據拼接技術,實現跨屏、跨網、跨平臺的用戶對齊,并利用深度標簽技術,打造更加立體的用戶畫像,從而為客戶提供更加有效的精準營銷服務,既包括新客獲取也包含老客營銷,使數據真正帶來營銷活動ROI的提升。
在金融征信方向,我們通過整合傳統信貸數據之外的其他數據源,輔助各類金融機構對借貸主體,無論是個人還是企業,進行信用評級與風險定價,有效對央行征信報告進行了補充。此外,由于我們的能力平臺可以關聯和識別用戶的多重身份,所以在貸后的風險預警和逾期催收的應用方面也很有優勢,同時在不良資產處置方向上也大有機會。
在人力資源方向,我們創新地引入用戶互聯網行為,形成求職者的勝任力、學習能力、專注度、敬業度等指標,試圖把人力資源這種“非標”資產標準化,進而嘗試對人力資源做資產定價,并推出了相應的獵頭與“背調”服務,打破傳統人力資源行業的信息不對稱,降低企業的用工風險與用工成本。
在市場研究方向,我們將全量、跨平臺、多維度等大數據的優勢,與傳統市場研究中的小數據結合,目前已經打造了諸如消費者洞察、商業指數分析、決策路徑分析等諸多成功案例。
在地理商業智能方向,我們通過引入第三方數據源,將用戶線下的位置信息精確到店鋪級別,再關聯上用戶的線上行為,于是就產生了區域人口洞察、店鋪選址、客流分析等一系列地理方向的應用。
盧山:目前運營商大數據應用較為成熟的領域和業務主要分為大數據實時營銷、網絡分析與數據合作等幾類。
大數據實時營銷,基于對客戶需求的精準把握,開展個性化、精準、場景化的實時營銷,將合適的業務在合適的時間通過合適的渠道推廣給合適的客戶。大數據實時營銷強調的是快和個性,快是獲取用戶需求的速度比較快,制定決策的速度比較快,響應的速度比較快;個性是獲取個性化的用戶需求、個性化的營銷策略、組織的扁平化,并把營銷主體下放給個性化的客戶經理。
基于網管域數據的網絡分析,以優化網絡體驗、提高用戶網絡感知以及完成網絡情況的實時監控為目標,建立網管健康數據分析系統,利用大數據平臺引入全省的網絡數據,實現網絡與業務數據融合,構建面向業務的實時分析系統。
數據合作,依托企業數據中心強大的處理能力與海量數據,基于完全匿名和聚合的移動數據,利用統計分析、數據挖掘等技術,向客戶提供標準化數據產品、大數據分析報告、高效Open API服務。為社會、政府、企業以及家庭、個人客戶提供經過分析挖掘而形成的價值產品與服務,實現數據價值提升與共享。
馮耀洲:中國電信從2013年底開始進行大數據應用探索,經過幾年的實踐,目前已經將“成為國際領先的大數據運營商”作為自身長遠發展的愿景和使命。
中國電信在產業角色上,定位于大數據能力和產品的提供者、業務和應用的參與者。準備利用3年時間達到國內領先、數據能力規模發展、數據產品重點行業全覆蓋;對內支撐上,建立專業化大數據業務運營組織、標準化流程和一體化支撐體系,支撐前端營銷和后端運營,降低運營成本,促進價值增長;對外合作上,形成強勁的大數據增值能力和大數據資產變現能力,建立中國電信主導的大數據生態體系,并探索混合所有制經濟,實現合作共贏;在具體應用上,目前的電信DMP標簽業務、區域洞察服務、精準營銷及效果監測及風險管控等業務相對開展得比較成熟。

《通信世界》運營商將大數據應用分為“對內”和“對外”,“煙囪式”的封閉業務系統是否是第一個“攔路虎”,您對“實現數據共享”有何解決之道?
盧山:在架構層面,以BI系統為起點,以降低技術與業務的耦合度,避免單個小系統建設為核心,以共性能力沉淀(業務抽象、共性技術剝離),迭代建設,統一管理為設計思路建設大數據平臺。
在數據層面,建設資產管理體系,為DAAS、PASS和SAAS提供底層的數據支撐,數據框架基于數據實體、業務語義組織、應用接口的核心模型思想進行數據的收集、組織、準備、服務和管控,提供統一、標準的業務語義和數據服務訪問方式,使得數據消費者達成一致的數據理解,數據消費者無需關心數據的真實物理部署,僅需通過統一的數據訪問接口便可以簡單、便捷、高效、安全地獲取所需數據,有效屏蔽異構數據平臺差異,有助于提升企業數據資產的管控效率和數據開放共享的效率。
馮耀洲:中國電信在大數據應用開展的過程中,越來越意識到兩點,一是內部數據必須集約。為此,中國電信集團從2014年著手推動數據集約工作,目前已完成大部分數據的集約。二是內部數據必須與外部數據打通,才能實現更大的價值。為此,中國電信與業界各方成立了BDU,推動各聯盟企業在數據領域進行開放合作。
當然,所有的數據合作都是基于不泄露用戶個人隱私的基礎上。在具體舉措上,中國電信設立了大數據開放平臺,將部分歷史數據進行脫敏后開放給合作方進行研究,共同推動大數據的應用。在真正的開放合作上,我們也希望政府能夠牽頭,制定大數據開放的法律法規,使企業數據開放能真正做到有法可依、有法必依。
《通信世界》您認為目前運營商的BI系統發展現狀如何,是否已經最大化地激發出了大數據在電信運營業的潛能?
盧山:目前BI經過多年的建設已經沉淀了比較深度的數據基礎與數據分析方法論,對于跨域整合數據、融合數據分析、對外共享應用是一個很好的起點。但隨著網絡數據的不斷引入,應用規模的擴大。BI傳統的IT架構存在瓶頸,需要進行x86化演進以及引入大數據新技術進行架構升級,才能最大化地激發大數據在電信運營業的潛能。
馮耀洲:BI系統目前還處于探索階段,底層數據匯聚和加工已經初具規模,但要形成具有智能化推薦結論的自動推送,還需花更大的力量去研究和實現。目前我們正在向這個方向努力。
《通信世界》在大數據的“對外合作”方面,礙于數據安全法律法規方面的限制,目前運營商還是摸索中前行,那么運營商應該如何做好數據管理、數據脫敏等工作,是否會存在一定的數據安全風險?
孫靜博:中國電信燈塔大數據在數據安全方面,采用六重安全保障方案,全流程保障數據安全。
1.數據采集:對自有數據采用專有網絡采集,對外部數據采集通過識別Sybil攻擊和ID欺騙攻擊的算法防止被攻擊。
2.數據清洗:對隱私數據進行脫敏處理,對關鍵數據進行加密處理。
3.數據傳輸:自有數據專有網絡傳輸,關鍵數據加密后傳輸,通過嚴格的校驗規則保證傳輸的完整性。
4.數據存儲:通過HDFS的機制保證多份存儲,通過多租戶的管理,保證不同用戶的數據保持獨立,關鍵數據加密存儲。
5.數據運算:為任務分配合理資源,保證平臺安全,通過日志記錄數據使用情況,并進行細粒度審計,對系統進行實時監控。
6.數據服務:通過數字簽名控制服務接入,采用流量控制,保證合理負載。
盧山:保證客戶隱私數據的安全是安全管控的重中之重,建立數據安全管理體系,明確敏感數據不出局,嚴管隱私數據。對數據活動的事前、事中、事后進行技術與流程管控。
馮耀洲:首先運營商數據要集約管理,這樣才能從管理角度更好地防范數據安全風險;其次,在內部數據采集后進入存儲環節時,必須做數據脫敏,并嚴格控制非脫敏數據的使用權限;第三,對所有的數據使用務必做好全量審計;第四,數據應用渠道與大數據平臺必須實現全自動對接,并在數據使用過程中做到虛擬化,盡量減少人工干預的環節;第五,要有嚴格的信息安全管理制度并嚴格執行。

《通信世界》有觀點認為,國內運營商從事大數據業務主要優勢依然是數據規模的龐大,而不是解決方案和商業模式的成熟,您對此如何評價?
孫靜博:運營商近兩年已經逐漸探索出一條落地的,可復制的大數據解決方案和商業模式之路。中國電信燈塔大數據平臺在大數據的變現能力打造方面分為3個層次,整合多源數據、打造能力平臺、創新行業應用。
在多源數據整合方面,我們整合了電信內部云公司與省公司的一些數據源,包括脫敏后的固網及移動管道數據(DPI)、客戶注冊信息(CRM)、流量及話單數據(ODS)、位置(信令)等;同時,我們也積累互聯網數據,包括電商、視頻、觸媒、汽車、地產、金融、社交等垂直領域公開數據約4億條;同時我們接入了大量的第三方數據資源,包括約200個數據接口API,覆蓋教育、工商、航空、公安、法院、銀行等領域?!罢隙嘣磾祿钡亩ㄎ恢形覀冏非蟮氖恰皬V”。
在能力平臺打造方面,我們在多源數據整合之后,對數據進行了進一步的清洗、融合與能力封裝。在數據清洗環節,我們對原始數據去噪聲、結構化,保證數據質量;在數據融合環節,我們通過ID的mapping,打通多方數據源,將數據的整合提升到數據的融合,實現1+1>2的數據融合增益。
在能力封裝環節,我們在保護用戶隱私的前提下,面向不同的大數據應用場景,把人與物多重的時空關聯關系,做定量的刻畫與預測,并以API的形式做能力封裝?!按蛟炷芰ζ脚_”的定位中我們追求的是“準”。
在行業應用創新方面,我們與合作伙伴一起,在能力平臺封裝的數據能力之上,針對客戶的需求與痛點,共同研發面向通用領域與垂直行業的,大數據產品與解決方案,使得大數據服務能夠真正為客戶帶來價值。我們希望與合作伙伴一起,營造燈塔大數據生態圈,進而加速大數據的商業創新與應用落地,為傳統產業升級和經濟結構轉型貢獻力量?!皠撔滦袠I應用”的定位中我們追求的是“深”。
盧山:目前我們還在摸索和不斷發展中。在數據的可信度方面,加大源數據的數據質量建設,沉淀與凝聚企業數據資產,讓數據能夠實話實說,在社會上建立數據權威。在數據的實時性方面,由于移動通信設備的普及,運營商獲取個體、團體的位置信息、行為特征的實時性數據有較大價值,我們正在針對上述訴求采用內存及流計算技術提高數據處理和響應的實時性。
馮耀洲:目前運營商在大數據領域的主要優勢的確是海量用戶數據,但并不只有這一個優勢,除此之外,還有實名制優勢,連續而不間斷的位置數據等優勢。
但運營商也意識到,以上優勢只是基礎,如果不能在應用或者解決方案方面有所突破,運營商仍然只是管道而已,只不過原來是通信管道,現在成了數據管道。所以運營商需要從4方面著手實現提升。首先,在一些行業領域進行深耕,希望能形成完整的行業大數據解決方案;其次,要與其他數據方合作,提升用戶畫像能力;第三,豐富標簽體系;第四,提供實時數據能力。
編輯|張鵬 zhangpeng@bjxintong.com.cn