劉苑明,黃志豪
(中國移動通信集團廣東有限公司中山分公司,中山 528400)
通過近年來的3G/4G網絡建設和G3手機營銷,截至2014年7月,中山的3G/4G網絡覆蓋率已達到98%,而3G/4G終端用戶已超過156萬(其中3G/4G終端132.61萬、LTE終端23.57萬),但無論從網絡側還是話單側進行統計,GSM網絡負荷仍然嚴峻,GSM網絡的GPRS流量持續飛漲,而3G/4G網絡的利用率和3G/4G流量都仍比較低,如何引導客戶使用3G/4G網絡,充分利用3G/4G網絡,提高客戶的數據業務感知成為移動市場經營的一個重點課題。
為解決該問題,通過對3G/4G終端用戶和GSM高流量用戶進行定位跟蹤分析得出,除部分鎮區由于3G/4G覆蓋漏洞原因外,有部分3G/4G終端用戶在有3G/4G覆蓋的2G小區產生較多的GPRS流量。經過詳細分析,主要是由于用戶對3G/4G終端進行了鎖GSM網使用。
由此,引導鎖網終端的用戶解鎖并使用3G/4G網絡,提高網絡體驗質量就成了流量經營的重點工作之一。其中如何精確定位鎖網終端的用戶成為解鎖營銷活動的主要難點和重點,本文利用大數據理論,結合CS域信令、PS域信令和話單數據,層層剖析,研究鎖網終端分析模型精確定位鎖網用戶。
PS域數據即指移動用戶進行手機上網行為時通過的GPRS移動核心網絡設備所產生的話單、信令、日志等數據。從圖1可以看到一個客戶進行數據業務行為時,流量和信令所經過的核心設備:BSC—Gb口→SGSN—Gn口→GGSN—Gi口→WAP Gateway。PS域的分析數據基礎為:
SGSN話單:其包含成功上網的通過SGSN設備的流量數據,包含用戶號碼、每次上網的流量、發起上網業務的小區信息、用戶終端IMEI信息。
(1) Gn口信令信息:包含所有用戶附著、激活PDP的信令數據,包括失敗信息,能夠獲取用戶號碼、用戶分配到的IP地址、用戶上網請求的上網目標地址、上網所在的小區信息、終端信令。
(2) WAP Gateway業務日志信息:包含通過CMWAP上網的客戶的用戶號碼、用戶上網的目標地址、用戶失敗的原因代碼、用戶上網時操作系統的UA信息。
總括以上信息,從PS域的數據中,能夠獲取用戶上網終端信息(品牌型號、終端制式、操作系統等)、用戶上網所在區域信息(是否是3G/4G覆蓋區域等)、用戶的上網流量信息(GSM產生的流量、3G/4G產生的流量)、用戶的上網喜好信息(喜歡聊天或音樂等)。
基于該數據基礎,能夠確定以下基礎分析條件:
(1) 根據上報的IMEI信息和UA信息,確認用戶使用的終端品牌型號,以該品牌型號所具備的功能確定是否為3G/4G終端;
(2) 使用該終端的客戶是否在有3G/4G覆蓋的小區使用過GPRS網絡;
(3) 用戶是否有使用3G/4G的流量。
CS域數據是指移動用戶進行通話、短信、位置更新等行為時在移動網絡核心設備中產生的信令等數據。廣東移動CS域移動網絡的信令采集的位置主要位于核心網絡MGW和MSC之間的IP承載網設備CE的入端口,該接口在移動網絡中也被稱為Mc口。從該接口采集的信令經過采集、篩選和解釋后將送往信令采集系統的服務器,其系統架構如圖2所示。

圖1 GPRS網絡組網圖

圖2 移動采集系統架構圖
Mc接口中的A接口過程可以分為CM(呼叫管理)、MM(移動性管理)、RR(無線資源管理)、SS(補充業務)和SM(短消息)5類。其中:SS和SM都屬于用戶應用層面;RR是無線資源管理層面;CM是處理呼叫的過程;MM是移動性管理。
(1) CM呼叫管理信令和SM短消息主要依靠于用戶的主動操作,或通話或接發短信,從信令中均可以精確獲取相關用戶的操作時間和所在位置(以移動網絡最小定位單位“小區”)。
(2) MM移動性管理信令主要包括位置更新信令和切換信令,本專利主要使用位置更新信令。移動網絡中的位置更新是指網絡為了解用戶位置以快速完成被叫操作目的,定期的網絡與用戶手機終端的交互。一般來說,在現有的移動網絡內是以30 min為時間間隔,定期與手機終端進行交互,確認手機終端所在的位置。
利用CM、SM和MM信息能夠準確判斷用戶是否出現過在3G/4G覆蓋的區域,是否曾經使用過3G/4G網絡。
通過大量的網絡調查,發現網絡中存在一種偽鎖網終端,該終端將影響我們鎖網終端分析模型的準確率。偽鎖網是一種復雜的情形,諸如用戶刷機,山寨機隨意編IMEI等情形皆可導致偽鎖網。偽鎖網終端的存在是由于“是否為3G/4G終端”的判斷依據來源于對用戶所持終端IMEI的前8位TAC的識別,以及后續WAP日志中UA字段的匹配的雙重判別,但是,往往判別過后的某些終端并不如實代表該終端的實際參數(如某終端實際為山寨機,其TAC隨意編撰為某品牌終端,而UA上傳缺失或比較大眾),則可能導致對于鎖網用戶判斷的不準確。因此,衍生出“偽鎖網用戶注 ”問題,該類用戶涉及的相關終端為“疑似問題終端”。偽鎖網用戶的存在嚴重混淆了現網對于鎖網用戶統計的真實性與準確性,極大影響了相關專業人員對于市場3G/4G使用情況的判斷,直接導致了相關市場決策制定的必要性與有效性。
為精確剔除偽鎖網用戶,我們引入Gb數據為分析基礎,通過精確定位終端芯片上報3G/4G支持參數,實現對于偽鎖網用戶的識別。
在Gb口信令BSSGP層的下行方向上(SGSN→ MS)攜帶了表征終端對于3G/4G支持能力的兩個參數:UMTS 3.84 Mcps 3/4GD Radio Access Technology Capability、UMTS1.28 Mcps 3/4GD Radio Access Technology Capability。若參數取值為1,表示支持3G/4G網絡;若取值為0 ,表示不支持3G/4G網絡。由于該參數來源于底層芯片信息,因此,能夠準確反映終端對于3G/4G網絡的支持能力。
為形成便于統計和分析的XDR表,在對相關信令的拆解包過程中,為便于理解,UMTS 3.84 Mcps 3/4GD Radio Access Technology Capability、UMTS1.28 Mcps 3/4GD Radio Access Technology Capability 兩個參數被重命名為umts_1283/4Gd_1800與umts_1283/4Gd_e兩個屬性。屬性取值為“1”表示支持3G/4G網絡,取值為“0”表示不支持3G/4G網絡。
本研究使用Oracle數據庫進行數據存儲,使用NavicatPremium進行關聯查詢,使用SPSS和DI V-integra進行數據建模與分析,將CS域和PS域信令數據相結合,配合“移動集團公司終端數據”和“資管系統覆蓋區域信息”進行關聯分析,通過交叉關聯進行數據定位,結合隨機分布的數理特性進行鎖網終端用戶的匯總分析。
基于PS域、CS域和Gb口信令數據基礎分析,建立精確的鎖網終端分析模型,該模型分析流程如圖3所示。
最終模型具體說明如下:
以一個月為周期,統計滿足以下條件:
(1) 基于PS域數據上報的TAC與UA相符,確認為使用3G/4G終端。
(2) 基于CS域數據和PS域數據,進行匯總確認,確定使用該終端的用戶曾經出現過在有3G/4G覆蓋的區域,但只使用GSM網絡。
說明:理論上僅使用PS域數據中的路由區信息是否與3G、LTE的路由區重疊覆蓋能夠獲取用戶是否活動在有3G/4G覆蓋的區域。但在研究過程中發現,由于部分用戶僅使用CS網絡或者僅在無覆蓋區域使用PS業務的行為特征,將造成僅用PS域數據判別鎖網終端的準確率偏低,為提高判別的準確率,故最終采用CS域與PS域數據雙數據重復確認機制,整合用戶曾出現過的區域,進行判別用戶是否進入過3G/4G覆蓋范圍。舉例:2013年6月中山地區的數據為例,CS域用戶為500萬,PS域用戶為392萬,而使用PS域數據判別是否3G/4G覆蓋,其中判別為無在3G/4G網絡覆蓋范圍的用戶有12.3萬,使用CS域數據和PS域數據進行重復認定后,無在3G/4G網絡覆蓋范圍的用戶為9.1萬,故僅使用PS域用戶的鎖網終端判別準確率僅為65.18%。
(3) 基于PS域數據,確定使用該終端的客戶有使用GPRS服務,即產生GSM流量,從未產生3G/4G流量。
(4) 基于Gb口信令數據剔除終端芯片上報不支持3G/4G網絡的用戶。
通過使用最終的3G/4G終端鎖網分析模型,對中山公司6月的數據進行了總體分析,確定中山公司共有3G/4G終端鎖網用戶9.1萬,占中山本地總體3G/4G終端的12%,其中精確定位偽鎖網用戶共710人,可識別IMSI用戶647人,中山本地用戶505人,故偽鎖網終端對準確率的營銷為1.02%。由于偽鎖網終端的判別使用了大數據量的Gb口信令,而該信令仍未為集團統一要求的信令采集端口,故最后的模型將次優化作為可選方式,如果本地條件不允許的情況下,可以暫跳過該判斷條件。

圖3 最終分析模型流程圖
3G/4G網絡的使用依賴于網絡的建設完善、終端的支持和用戶的使用習慣,本研究通過移動公司內部網絡線條與市場線條的緊密合作,基于信令、話單和規劃等多種大數據聯合分析,建立了精確的3G/4G終端鎖網分析模型,廣東中山公司于2013年使用該模型進行了鎖網用戶專項營銷活動。
通過3G/4G終端鎖網分析模型精確定位了鎖網用戶(中山地區鎖網終端用戶的分析數據如圖4所示),并將鎖網用戶(包括用戶號碼、終端類型、用戶活動范圍等)提供給數據業務中心和市場部后,數據業務中心和市場部開展了一系列的營銷活動,主要有:
(1) 分終端解鎖引導:數據業務中心對用戶分布較多的終端,挖掘解鎖步驟,通過10086短信下發解鎖引導,以及解鎖贈送流量優惠,引導用戶主動解鎖。
(2) 精準定位點對點引導:將疑似鎖網用戶下發到各個服營中心,由服營中心點對點進行解鎖引導。
(3) 對偽鎖網用戶提供換機優惠套餐,建議其更換正版的G3終端,能夠得到更好的業務體驗。
通過兩個業務部門開展的營銷活動,3G/4G鎖網用戶積極參加,“解鎖”效應得到充分體現,主要有以下幾個方面。
(1) 截至10月底中山累計解鎖用戶數達到8.27萬。
(2) 解鎖后流量大幅提升:用戶解鎖前人均流量63.75 M,解鎖后人均流量144.30 M,流量提升達126.35%,其中3G流量82 M。
(3) 解鎖后流量收入有效提升:用戶解鎖前用戶人均流量收入13.79元,解鎖后人均流量收入17.24元,收入提升25.03%。
2013年9月,廣東省公司引入了中山公司的3G/4G終端鎖網分析模型,并固化到省建“集中性能管理系統”,并將分析出來的3G/4G終端鎖網用戶推送到省數據業務中心和21個地市,由省數據業務中心在全省利用智能管道3G/4G引導策略進行用戶引導和地市個性化營銷活動。

圖4 中山市試用3G/4G終端鎖網分析模型所得鎖網用戶分析圖