楊磊
中國電信股份有限公司徐州分公司
本文主要以數據深度挖掘、關聯分析為主要手段,并基于該數據對市場前端進行業務指引。通常的數據分析劃分為:
(1)業務結構:全網各類業務占比分析,展現熱門業務應用;
(2)用戶偏好:不同用戶使用TOP業務類型,獲悉用戶業務使用偏好;
(3)時間軌跡:24小時網絡利用情況,閑時資源讓利用戶,提升好感度;
(4)終端分析:定位問題終端,減少質差終端推廣;終端性能比較,根據用戶使用需求推薦終端。
本文的數據分析目的如下:
(1)投放熱門應用相關業務:微信、優酷視頻定向流量包;
(2)閑時資源讓利給用戶:1點到6點,網絡資源閑置,可推閑時流量包;
(3)每個用戶需求不同:有人偏愛視頻,有人偏愛新聞,可根據終端性能推薦使用手機;
(4)挖掘潛在用戶:引導高流量消耗的3G用戶使用4G終端、4G業務;
(5)選擇行業合作伙伴:哪個平臺用戶保有量最多,哪個平臺訪問量最大,選擇熱門網站實現強強合作。
本文的用戶分析,主要關聯大數據分析平臺,按終端類型、區域、時間點、用戶標簽等多個緯度進行綜合分析,以便于真實、有效的反映現網用戶現狀。文中所使用的數據,均來自于徐州電信4G業務范圍的公開數據。

圖1 區域流量時段
1.1.1 活躍時段分析
本節以徐州行政區域為例分類分析。對比各區縣流量可發現,各區域用戶的流量峰值時段,均為中午11點至下午18點之間,且在該時段內,各區域流量基本平穩,持續保持在峰值區間,可根據流量峰值分布情況選擇業務推送時間。從全區看,視頻類業務流量都高于瀏覽類業務流量;基于視頻業務分析,泉山、銅山人均流量較高,邳州、新沂人均流量較低,通過對各區域用戶流量使用占比進行分析,便于分區域進行業務、流量套餐推廣。

圖2 各區域人均業務分布
1.1.2 業務流量分析
通過分析不同用戶組的流量消耗及對應APP的差異,便于針對性地進行定向流量包、套餐等推廣。
(1)4G流量用戶分析
在流量使用不同時,用戶應用比例分布不同。徐州高流量用戶視頻流量較多,中、低流量用戶視頻流量很少。(日流量5-40M定義為低流量用戶,日流量40至200M定義為中等流量用戶,日流量大于200M定義為高流量用戶)
1)低流量用戶應用特點:騰訊應用(含微信)占56%,視頻類APP占比較??;
2)中流量用戶應用特點:騰訊應用(含微信)占45%,百度、愛奇藝等占比增多;
3)高流量用戶應用特點:芒果TV應用占48%,騰訊、優酷、搜狐等占比34%。
(2)3G流量用戶分析
使用3G卡并且使用3G終端的總體占比最多,需引導用戶更換4G卡和4G終端。使用4G卡但使用3G終端的,主要分布在農村場景,需引導這部分用戶更換4G終端。使用4G卡4G終端的(用戶主動關閉),占比最少,其中縣區中占比較高,需加大業務的宣傳和4G流量推送。
本部分數據主要體現徐州區域內不同用戶組的4G流量消耗總量及對應APP使用時段的差異,以便于針對性地進行定向流量包、套餐等推廣。
1.2.1 APP流量早晚對比
從圖3可看出天翼視訊流量遠超其他APP,天翼視訊、騰訊視頻、優酷、秒拍等APP流量占比在晚上明顯上升,而QQ、百度、淘寶、微信等APP晚上流量占比明顯下降,可看出用戶在晚上偏向于使用視頻類APP,白天偏向于聊天類APP。

圖3 常用APP流量占比變化
1.2.2 APP用戶早晚對比
如圖4所示,統計APP用戶數情況,微信、百度、QQ及淘寶等APP用戶保有量最高。微信晚上用戶數占比增加最多,但流量減少,說明單用戶平均流量在減少,其余各類APP白天和夜晚用戶數占比變化不大??梢愿鶕脩舭滋旌屯砩系氖褂昧晳T制定定時流量包,例如白天聊天類定向流量包,晚上視頻類定向流量包。

圖4 常用APP用戶占比變化
本部分數據主要對不同類型的終端進行軟件使用性能分析,以便于向用戶介紹更適合的終端類型,進行區域性的、針對性的終端銷售推廣。可根據用戶的不同業務需求級別,分類進行終端推薦,比如視頻業務需求較高的用戶推薦使用蘋果手機;網頁瀏覽類業務需求較多的用戶推薦使用華為、OPPO等品牌的手機。
1.3.1 終端型號分布
取終端類型占據前五的手機,分別列出了每款手機在分區銷售前三的終端類型,詳情如下:
(1)終端品牌:華為、蘋果、OPPO占據前三,其中華為占比27.25%,蘋果占比21.19%,OPPO占比14%,總比例達到62%左右;
(2)品牌型號:蘋果手機中Phone 6、Phone 6 Plus、IPhone 6S占據前三,占比70%;華為手機中Mate 8、Ascend P7、Ascend Mate7占據前三,占比21%;小米手機中REDMI NOTE、H3A、H3X LTE占據前三,占比33%。
1.3.2 終端場景分布
從四個場景來看,除農村Che1-CL10占據第三名外,其余場景iPhone 6、iPhone 6 Plus、IPhone 6S均占前三名,說明大多數用戶還是使用蘋果終端;各場景蘋果手機占比相差不大。
可根據不同場景開展針對性手機推銷業務,比如農村場景除了蘋果手機外,可推廣Che1-CL10 終端。

圖5 終端區域場景分布
1.3.3 終端綜合性能分析
(1)視頻性能
從視頻下載速率來看,蘋果iPhone6、iPhone6 Plus、三星SM-G935V排在前列,說明這幾款終端適合視頻類業務。
(2)會話性能
從http平均時延排名來看:Vivo V3L、vivo Y929、華為HUAWEI P8性能較好,接收信息快;三星SM-N9200、華為VNS-CL00、三星Galaxy Note5三款終端平均打開時延較高,性能較差。
(3)瀏覽性能
從頁面打開時延排名來看:華為_Mate 8、Oppo_A33m、小米_H3X LTE終端性能較好,網頁打開快。iPhone系列手機排名最后,主要因為此類終端的服務器大多落于國外,導致平均時延及成功率均不高。

表2 終端綜合性能指標排名
本部分數據主要通過用戶分布區域,來定義用戶分組標簽,通過對不同的用戶分組行為進行分析,從而進行針對性的業務推送。
1.4.1 業務分布
(1)不同用戶群體業務請求分布
從業務請求來說,各群體騰訊系列的APP使用頻率最高,主要為微信、QQ,新浪、百度、淘寶等APP的請求次數次之,可定位重點SP軟件,進行專項感知指標提升,保障用戶使用感知。
1)銀行職工偏向于使用微信、淘寶、百度等APP軟件;
2)醫生使用微信最頻繁;
3)藍領除了微信以外,其他各類APP使用分布比較均衡;
4)公務員偏向于使用微信;
5)學生群體使用較為頻繁的為微信、QQ、以及新浪網;
6)白領群體使用微信占比最高,其他業務占比很少。
(2)業務流量分布
白領、醫生、學生、銀行人員的流量分布主要集中在瀏覽類及聊天類業務上;公務員及藍領在視頻業務上花費較大流量,可針對這些業務進行適當流量推送或者制定定向流量包。
1)銀行職工微信、大申社區等APP流量使用較多。
2)醫職人員大申社區、微信以及愛奇藝等視頻APP流量使用最多。
3)藍領群體流量主要集中在騰訊視頻、大申社區、微信等APP上。
4)公職人員愛奇藝、天翼視訊、騰訊、App Store等APP占用流量較大。
5)學生群體的視頻類業務相比其他群體有很大提升,天翼視訊占比最高。(備注:天翼視訊還包括愛看4G產生的流量,目前天翼視訊、愛看4G都有定向流量包,可看出定向流量包對于拉動自有業務的使用有推動作用)
6)白領群體流量主要集中在天翼視訊以及騰訊、微信等APP。

表3 綜合群體業務分布
1.4.2 用戶群體綜合分析
綜合分析六類群體可以發現,醫生、藍領、銀行人員這三個群體流量主要分布在個別時間段,且其余時段流量較為平均,整體人均流量低;學生的人均流量在六個群體中為最高,其次為公務員和白領。
(1)銀行職工的流量使用高峰期在12、13、14及21點;銀行人員白天的業務均為低流量業務,但中午時段及下班后,人均流量有所提升;
(2)醫生人員除1時至7時流量較少外,其余時間流量消耗比較平均,峰值時段為晚上11點;
(3)藍領群體整體的流量消耗水平偏低,但在晚上23點整體流量飆高,可在使用最頻繁的23點推送廣告或者業務消息;
(4)公職人員群體除1時及23時流量較多外,流量消耗整體較為平均,無明顯波動趨勢;
(5)從流量消耗和業務請求次數可以看出,學生群體3-6時人均流量及請求次數較低,峰值時段在早上8點,其余時段流量消耗接近,處于中間水平;
(6)從白領24小時流量及業務請求次數來看,白領群體除0-6時業務請求及流量較少,早上7點和8點為流量峰值時段,其余時段較為平均,與學生群體類似。
本部分數據主要通過用戶分布區域,來定義用戶分組標簽,通過對不同的用戶分組行為進行差異分析,從而進行針對性的業務推送。
1.5.1 業務使用類型
(1)業務請求
統計徐州農村場景,微信及淘寶業務請求次數最高;統計居民區場景,業務請求次數方面,微信占比最高;商業區場景的業務流向,騰訊類業務請求次數最高。
(2)流量分析
統計徐州農村場景,流量對象除騰訊、快手以外,主要還是流向視頻或社交APP;統計居民區場景流量方面,除了天翼視訊以外,主要還是流向微信、大申社區等社交視頻APP或門戶網站;商業區場景的流量方面,除了微信外,主要還是流向快手、大申社區、天翼視訊等社交或視頻APP。

圖6 區域業務分布
1.5.2 流量消耗時段
各場景的活躍時段基本吻合,業務請求的峰值時段分布在8點至18點,流量占比的峰值時段分布在10點至22點,且在峰值時段內,各區域曲線基本平穩,持續保持在峰值區間。

圖7 區域流量時段
本次用戶分析從多個維度進行,相比傳統指標統計模式,更高效、直觀地展現了徐州現網的4G用戶行為現狀,體現了現網分析與大數據平臺的結合效果,在一定程度上,突破了我們以往分析問題的局限性,對于提升現網指標、指引前端市場,均有良好效果。
在后續的開發過程中,將更緊密地結合各項分析需求,比如前端數據采集、用戶信息、指標信息、覆蓋現狀、基站工參資料等等,不斷地進行完善、提升,更好地適應大數據的發展趨勢。