張 靖,侯曉晶
(中國移動通信集團山西有限公司朔州分公司,山西 朔州 036002)
近幾年來,通信行業的外部競爭日益激烈,用戶流量大幅提升,但流量單價持續下跌,語音收入持續下降,導致收入增長乏力且變化趨勢不容樂觀[1]。從競爭環境、“提速降費”等國家政策等宏觀層面分析收入變化是一方面,除此之外,我們想要充分發揮我網客戶規模處于行業主導地位、客戶份額超過60%的優勢,結合數據挖掘技術,構建全量客戶消費預警模型,將整個收入的變化映射到全量客戶的個體變化,實現預測收入目的;并通過監測全量客戶的消費行為,圈定重點客戶,及時采取針對性措施,打好精細化運營的基礎。
按月提取我網11位手機用戶(剔除11位固話、物聯網卡用戶)的消費、流量、語音、流量收入、語音收入,基于線性回歸擬合、二次函數擬合,對每個用戶的消費、流量、語音建立線性方程式、二次函數方程式,實現以下目標:一是預測全量客戶總收入;二是根據用戶消費、流量、語音變化,輸出重點客群,輔助營銷;三是根據流量單價、語音單價變化,明確增收方向。
主要包括模型構建、收入預測、客群輸出流程,以對全量用戶的消費進行建模、輸出、預測為例。流程圖如圖1所示。

圖1 建模流程圖
2.1.1 提取樣本
按月提取我網11位手機用戶(剔除11位固話、物聯網卡用戶)的消費、流量、語音數據。
2.1.2 擬合單個用戶消費(流量、語音)曲線
2.1.2.1 線性擬合
選擇一元線性回歸方程進行擬合,將用戶的消費(流量、語音)設為因變量y,取時間序列為自變量x,通過最小二乘法[2],按照式(1)求系數a、b,構建一條擬合曲線y=a+bx。

(1)將預測月作為x,代入曲線,即可求出預測月用戶的消費(流量、語音)。
(2)通過線性擬合的系數b可以直觀反映用戶通信行為變化,b>0表示上升,b<0表示下降。
2.1.2.2 二次函數擬合
為提高預測值得精準度,更好地切合用戶消費變化曲線,我們選擇了擬合度更高的二次函數,進行二次函數構建[3]。將用戶的消費(流量、語音)設為因變量y,取時間序列設為自變量x,求取系數a0、a1、a2,構建一條擬合曲線y=a0+a1x+a2x2。

(1)將預測月作為x,代入曲線,即可求出預測月用戶的消費(流量、語音)。
(2)求出預測時間點處的切線y=kx+b,其斜率k的正負表示用戶消費的升降,斜率k絕對值大小表示用戶消費變化的強弱。
(1)原理:根據全量手機用戶往前推10個月的月消費數據,構建每個用戶的消費(流量、語音)兩條擬合曲線:線性擬合y=a+bx、二次擬合y=a0+a1x+a2x2,二次擬合函數的精度高于線性擬合函數,因此以當前月份作為自變量x代入二次擬合函數,可預測用戶當前月份的消費(流量、語音)。
(2)示例:2020年7月初,會根據用戶2019年9-12月、2020年1-6月分月全量手機用戶的消費數據,構建每個用戶的消費擬合函數y=a0+a1x+a2x2,先預測每個用戶的7月收入,再全量求和,作為7月的手機用戶預測收入。
2.3.1 參數分析
線性擬合y=a+bx曲線中的系數b,能夠表示用戶整個分析區間內的變化走向[4],當b為負值時,表示曲線存在下降趨勢,即用戶消費(流量、語音)下降,b值越小,下降趨勢越明顯。當b為正值時,用戶消費(流量、語音)平穩或上升,b值越大,上升越明顯。二次函數擬合斜率k能夠表示用戶在預測月附近的變化走向,當k為負值時,表示曲線存在下降趨勢,即預測月附近用戶消費(流量、語音)下降,k值越小,下降趨勢越明顯。當k為正值時,預測月附近用戶消費(流量、語音)平穩或上升,k值越大,上升越明顯。
2.3.2 綜合實際數據與參數的分析,總結三類趨勢
通過對用戶實際消費等數據的變化分析,結合參數的變化,總結出三類趨勢:
(1)下降:線性擬合系數b<0,二次函數擬合斜率k<0。
(2)上升:線性擬合系數b>0,二次函數擬合斜率k>0。
(3)趨于平穩:線性擬合系數b、二次函數擬合斜率k正負相反。

表1 三類趨勢說明

?

表2 示例用戶1-12月消費數據
2.3.3 輸出重點客戶,輔助分類營銷
按照用戶的消費、流量、語音三個維度的下降、上升、趨于平穩變化,劃分顏色預警,有的放矢開展營銷。
(1)紅色預警:消費、流量、語音均下降。營銷策略:高危客戶,通過流量贈送、體驗實現業務量維穩,實現業務回流。
(2)黃色預警:消費、流量均下降。營銷策略: 不穩定客戶,營銷中優先考慮,主套餐價值適當下降,以不限量打折活動推動遷轉實現客戶穩定。
(3)藍色預警:消費、流量任一下降,或消費、流量趨于平穩。營銷策略:較穩定客戶,主推資費平移,實現收入保持。
(4)綠色預警:消費、流量、語音均上升。營銷策略:穩定客戶,堅持價值向上運營原則推不限量,實現收入增長。
2.3.4 輔助決策,明確增收方向
基于曲線回歸分析,將1-10月份存量用戶的流量單價、流量總量作為樣本,繪制變化曲線[5],可看出:一是流量單價處于持續下降狀態,且從7月份開始,下降趨勢放緩;二是流量總量持續上升,上升幅度較穩定,7、8月明顯,10月開始放緩。按照收入=單價×總量計算,繪制流量收入曲線,可看出流量收入持續下降。
通過繪制1-10月份存量用戶的語音單價、語音總量分布圖,可看出單價、總量兩者變化均較平穩,沒有明顯下降或上升趨勢。
由此看出,用戶收入的變化,以流量收入的變化為主,因此想要實現收入增長,仍需持續開展流量經營,實現流量爆發式增長,彌補流量單價下降損失,最終達到提升收入的目的。

圖2 流量單價、流量總量、流量總收入趨勢圖

圖3 語音總量、語音總收入趨勢圖
2.4.1 收入預測
模型構建完成后,每月利用該模型進行收入預測、客戶分類,輔助市場營銷。
每月7號之前,通過模型預測當月存量手機客戶收入,2019年5月為收入趨勢變化轉折點,5月之前, 預測收入趨勢均為下降,5月及之后,收入開始維穩回升,2019年11月,收入出現下滑,2020年3月,疫情過后復工復產,收入趨勢回升,預測收入變化趨勢與真實收入變化趨勢基本一致,且相對差距未超過5%。

表3 收入預測數據
2.4.2 分類營銷
(1)2019年8月輸出本網紅色預警客戶1.98 萬,截止2019年12月底,離網1.13萬戶,離網率達57.1%,說明該類用戶確實屬于高危客戶。
(2)模型累計輸出流量紅色預警客戶14.7萬, 通過引導用戶體驗業務,3.7萬用戶流量止跌回升, 挽留成功率25.2%。
(3)存量客戶套餐經營是一項持續推進的工作,通過客戶預警模型,提前為目標客戶附加顏色預警,有效縮小了目標客戶規模,平均營銷成功率為12.36%。

表4 示例用戶1-12月消費數據
以往對于市場收入的趨勢分析,是站在宏觀角度預測分析,對個體的收入預測屬于空白,本論文將全量收入的變化趨勢映射到個人,構建全量客戶消費預警模型,來指導市場經營。使用PHP語言實現了一元線性回歸、一元二次回歸兩種算法,通過對用戶消費、語音、流量數據進行曲線擬合,達到對收入的預測目的,且相對誤差控制在5%以下。通過預測個體的消費趨勢,圈定重點客戶,劃分顏色預警,有的放矢制定營銷策略,及時采取針對性措施, 打好精細化運營的基礎,以定量的模型代替以往通過經驗來定性的行為,使市場經營更精準[6]。