許建新,董 冰,王寶俊(中訊郵電咨詢設計院有限公司廣東分公司,廣東廣州 510627)
近幾年的網絡大建設和收入天花板的出現,使投資對收入的驅動越發減弱。如何能最大化發揮投資對收入增長的拉動作用,是移動網絡規劃和建設需重點關注的問題。
本文嘗試在對收入解構、成本模塊化和覆蓋區域分類的基礎上,將網絡投資與對增量收入的拉動和存量收入的維持等進行分析建模,形成一套可直接反映投資效益的模型。
2.1.1 用戶分類
中國聯通為了扭轉弱勢運營商的局面,以混合所有制改革試點為契機,加快業務模式創新優化改革。與互聯網公司進行戰略合作推出B2I 號卡產品,以此贏得差異化競爭優勢,獲取生存空間。
B2I 產品受到年輕用戶的青睞,發展迅速。但由于B2I 產品普遍資費較低且多為重流量用戶,隨著用戶規模的擴大,網絡單價流量也將快速拉低。在對基站投資效益測算時,原有的收入預測方法無法適應當前實際情況,采用用戶一刀切的方法,容易造成收入預測偏高,從而造成投資回收期測算失真。
基于此,可依據用戶建檔時間進行用戶劃分,即將建檔時間為當年的用戶定義為增量用戶,其余為存量用戶。
2.1.2 存量/增量用戶消費行為
通過對不同類型的用戶賬單進行數據挖掘分析,構建用戶畫像模型及其網絡行為特征,以網絡流量單價為著力點進行深入研究,精確解構基站出賬收入,為后續運營發展提供有力的數據支撐。
圖1為南方聯通部分地(市)的用戶消費行為對比圖,從圖1 可以看出,增量用戶人均出賬收入(ARPU)普遍低于存量用戶,而人均月消耗流量(DOU)則顯著高于存量用戶,且各地(市)之間亦存在較大差異。

圖1 部分地(市)用戶ARPU值和DOU值
2.1.3 增量用戶發展情況
中國聯通通過與騰訊、阿里巴巴等為代表的互聯網企業進行優勢互補戰略合作,推出了一系列資費低廉的高流量號卡產品,由此吸引了一大批年輕人入網,尤其是校園、工業園和廠園等區域,為中國聯通4G用戶規模的告訴增長做出了巨大貢獻。
提取南方聯通部分地(市)用戶賬單進行大數據分析,增量用戶數/收入/數據流量占比如圖2 所示,可以發現,用戶數占比略高于收入占比,說明增量用戶ARPU 值較低,而流量占比則顯著高于用戶數占比,從側面驗證了增量用戶的高流量特性。

圖2 某地(市)增量用戶占比圖
為了與增量/存量用戶形成匹配對應關系,以及為后續網絡建設提供精確的數據指導,可依據基站建設年份的不同,將當年建設基站定義為新建基站,往年建設基站定義為存量基站。
2.2.1 存量/新建基站
存量基站代表當前已經形成的網絡規模,主要用以保障用戶的基本通信需求,維系用戶的正常使用;增量基站則用以完善廣度覆蓋和加強深度覆蓋,意在大力度保障用戶,不斷提高的業務需求,并通過更高質量的網絡來搶奪通信市場。
基站的建設年份不同會導致投資成本存在差異,同時對存量基站和新建基站的部署區域進行挖掘,更有利于后續的成本解構。
2.2.2 價值區域內外新建基站情況
以廣東聯通某部分地(市)為例,分析當年新建基站的分布可知,價值區域內的新建比例仍高于價值區域外,且不同地(市)間存在一定差異,說明投資比重依然側重價值區域(見圖3)。

圖3 某地(市)新增基站價值區域占比圖
2.3.1 收入解構目的
明晰收入基本構成,細化增量、存量用戶差異,通過對基站/用戶進行多源多維度分析,建立相應的數學模型以評估投資效益,為后續網絡建設提供精準的數據指導。
基站收入解構是一個多維度的網絡建設后評估過程,與傳統的基站收入估算相比涉及的因素多且復雜。以用戶和基站角度為評價出發點,根據用戶是否屬于存量用戶以及基站是否屬于新建等因素考慮,借助大數據分析工具,結合多源多維度數據,對基站收入的基本構成進行解析,所涉及的關鍵模塊如圖4 所示。

圖4 基站級收入解構框圖
2.3.2 收入解構難點
以往對于現網基站收入的評估,一般將該地(市)的出賬收入直接除以總基站數目,此時得到的基站收入實際上為統計狀態下的平均值,而沒有考慮不同基站因為所處場景及資源稟賦等因素帶來的差異。之所以無法進一步細化,一定程度上在于數據采集等網絡運營管理系統的發展跟不上網絡建設的步伐,隨著增量市場的逐步萎縮,高效益精細化投資顯得尤為重要。
隨著運維等數據采集系統的上線和大數據的發展,對于基站內用戶使用網絡流量的情況可進行監控和跟蹤。借助用戶詳單,可計算得到每個用戶在駐留基站使用的總流量情況。只需要知道流量價格,便可以得到基站出賬收入。現有條件下,并無實際可用且切合實際的流量價格計算算法,這是收入解構過程中的一大難點。
2.3.3 流量價格測算
2.3.3.1 傳統算法
目前針對流量單價的測算,不同分公司有不同的方法,較為普遍的方法是在扣除月租基礎費和彩鈴等增值費用后,依據話務量和數據流量的比例進行折算分攤計算。例如將通話時長按照50 kbit/s 進行折算,并依據該地(市)2G/3G 網絡話務占比,對話務折算流量按比例分攤至2G/3G 網絡,最后再匯總計算各地(市)流量單價。這種方法雖然較為簡單,但無法反映真實的業務單價,且地(市)之間缺少應有的差異性,無法呈現數據流量價格隨時間動態變化趨勢。
2.3.3.2 多元線性回歸算法
在用戶賬單中影響出賬收入的最主要的因素是通話時長和總使用流量,而總使用流量按照網絡可分為2G 網絡流量、3G 網絡流量和4G 網絡流量。因此可將其和通話時長作為自變量實行基于多元線性回歸的業務量單價預測,則第i個用戶的回歸模型可寫為

式中:
Yi——第i個用戶的當月出賬收入
Xi,1——通話時長
Xi,2、Xi,3、Xi,4——2G、3G、4G網絡流量
α——語音單價
β0——常數項
β1、β2及β3——對應網絡的流量單價
εi——隨機殘差
由于用戶使用套餐不同,對應的固定支出(如月租或來電顯示等)也不同,而在預測網絡建設投資回收期時一般按照業務量計算收益。為了弱化固定支出的影響,令β0始終為零,此時用戶當月出賬收入僅與業務量有關,且為線性疊加關系。殘差εi服從均值為零的正態分布,且對于所有的應變量Yi具有相同方差。
在求解線性回歸系數時,其基本原則在于使得經過線性回歸后的應變量與原始數據之間的均方誤差最小,即存在

采用最小二乘法可計算得到上述回歸系數。
為了驗證多元線性回歸的準確性,采用歸屬地為某地(市)的B2I產品中的騰訊大王卡2017 年2 月賬單作為測試對象,其主要原因在于騰訊大王卡計費簡單。該卡接聽免費,主叫0.1 元/min,騰訊系應用業務免流量費,省內套外流量在不足10 MB 時按0.1 元/MB收取,超過10 MB 則觸發1 元日租包,即10~500 MB 免流量費,可疊加多個流量日租包。因此,可將語音通話費用直接去除,然后進行多元線性回歸,可得回歸模型為:

其中流量單位為GB。
事實上該卡套餐外收費流量最低為2 元/GB,且4G網絡流量占比93.0%,人均使用流量為15.94 GB,流量費用為47.5元(含19元月租在內),可粗略計算得到套餐內4G 網絡流量單價約為3.2 元/GB,與估計值1.5元/GB相差懸殊。
2.3.3.3 聚類最小二乘算法
多元線性回歸算法輸出效果受奇異點分布影響較大,對于4G 網絡流量單價估計過低,難以反映真實情況。在此背景下,提出了一種基于歷史趨勢數據的最小二乘算法對各地(市)單月語音單價及流量單價進行聯合估計。
根據中國聯通現行套餐政策,老用戶套餐保持不變,流量優惠基本只有新入網用戶才能享受。另外語音單價總體上變化不大,半年之內保持平穩,而流量單價則每月都呈現出較大變化,尤其是高流量B2I 產品的推出。
基于上述假設針對單個地(市)可設語音單位為α min/s,2016年7月至2017年2月全網流量單價為βi分/MB(1 ≤i≤7),那么根據2016 年7 月該地(市)賬單統計結果可得如下方程:

式中:
1) 浙江段“十三五”期計劃建設三級航道整治工程,其中杭州段“四改三”34 km和二通道新開挖段26.4 km,航道整治后全線達到三級航道標準。
Y1——該地(市)2017 年7 月出賬用戶收入之和(min)
X1,1——通話時長之和(s)
X1,2——總使用流量之和(MB)。
同理可得2016 年8 月至2017 年2 月方程,最后得到的方程組如下:

將式(5)改寫為矩陣方程可得:

式中:
Y及?均為列向量Y=[Y1,Y2,…,Y7]T,?=[α,β1,β2,…,β7]T,系數X為7行8列的矩陣,第1列為逐月通話時長[X1,1,X2,1,…,X7,1]T,而后7 列則為逐月數據總流量組成的對角陣
利用最小二乘算法求解矩陣方程(6),可得

式中:
X+——矩陣X的偽逆矩陣。
值得注意的是,上述方程組聯合求解時有可能出現與實際值相差較大的情形,此時需要對用戶按照人均流量、人均通話時長及出賬收入等維度進一步做聚類分析,并將異常點剔除,而后對每一類用戶單獨求解,最后再對語音單價加權綜合計算。
依據語音通話單價,可根據用戶月度賬單上的總出賬收入和總通話時長計算得到相應的流量收入。通過求解方程,可知語音單價α,設Dn,1、Dn,2、Dn,3、Dn,4分別為第n個用戶當月總通話時長及2G/3G/4G 網絡使用流量,則第n個用戶流量收入為:

對于用戶而言,2G/3G/4G 網絡流量單價并無差別,因此可利用上式計算得到的單用戶流量收入及月度賬單數據中的2G/3G/4G 網絡流量進一步測算2G 網絡流量收入。該用戶2G/3G/4G網絡出賬收入分別為:

流量價格為所有用戶單網絡流量收入之和除以該地(市)單網絡流量之和即可,匯總某地(市)所有出賬用戶,統計平均得2G/3G/4G網絡業務單價:

根據上述過程,可分別對存量用戶和增量用戶進行數據流量測算,從而使得出賬收入更加細化和精準化,作為后續收入解構的基礎。
2.3.3.4 部分地(市)流量價格測算結果
采用聚類最小二乘算法對部分地(市)過去一年的業務量單價進行測算,可以看出,2G 網絡流量單價最高,原因在于2G網絡流量用戶以2G終端為主,該部分用戶所用套餐多為2G/3G 時代老套餐,套外流量最高可達0.3 元/MB,因此其流量單價最高。另一方面,2G 終端用戶對于數據流量需求較小,而4G 終端用戶4G 流量駐留比高達90%以上。說明2G 網絡流量單價雖高,但受制于體量,對于全網數據流量單價影響有限。經濟發達的地(市)的語音單價較低,原因在于該類地區3G/4G套餐比例較高,對應的優惠力度大,而經濟欠發達地(市)則依舊存在不少2G套餐,且通話需求更為強烈。
存量用戶數據流量單價顯著高于增量用戶,且4G網絡流量單價總體上呈現出逐月下降趨勢。說明隨著“提速降費”政策的大力執行以及市場競爭的加劇,數據流量的資費下調得到了落實,為廣大用戶提供了實惠。另外2018 年1 月受春節因素影響,人均語音通話時長較平時顯著提高,數據流量并未成比例上升,導致2018 年1 月出賬收入增大,而語音單價則與往月持平,從而導致數據流量單價在2018 年1 月有所上漲,2018年2月開始出現回落。
2.3.4 基站級收入解構步驟
借助第2.3.3 條可計算得到各地(市)增量用戶和存量用戶的4G 網絡數據流量單價,而4G 網絡無法承載傳統語音,且VoLTE 并未進入實質性商用過程,因此只需要將基站當月消耗流量乘以對應的單價即可得到出賬收入(見圖5)。

圖5 基站出賬收入結構
2.3.4.1 用戶—基站使用流量映射表
在計算單個用戶在各基站使用流量時,需要用到用戶數據業務詳單表、工參表和用戶賬單表。具體處理時,首先將4G 工參表與數據詳單表通過關鍵字段EGCI即小區標識進行關聯,可篩選出4G 網絡基站,如圖6所示。而后通過數據詳單表與用戶賬單表借助用戶編號這一唯一標識匹配,得到增量/存量用戶在增量/新建基站每一次數據業務流量使用情況,將其匯總便可得到各用戶在某基站月使用總流量,從而得到用戶—基站使用流量映射表。
2.3.4.2 基站當月出賬收入

圖6 用戶—基站使用流量各數據源關聯圖
依據存量/增量用戶流量單價p1,4G/p2,4G,以及用戶i在基站m使用流量Ti,m,可得該基站當月收入為:

圖7給出了基站收入解構步驟。

圖7 基站收入解構步驟圖
2.3.5 基站級收入解構結果
以某地(市)為例,價值區域內/外單基站存量用戶占比分別為74%和68%,區域外增量用戶擴散顯著。價值區域外新建基站增量用戶單站使用流量最高,增量用戶駐留基站數目(移動性)高于存量用戶(見表1)。

表1 某地(市)價值區域內外單站收入解構典型值
分析基站成本組成、細化不同類型基站成本間的差異,通過參考往期工程造價和最新招標價格,對存量基站和新建基站的成本進行模塊化分析,為構建網絡投資效益匹配模型提供精準指導。
為便于效益評估,基站成本主要分為建設成本和運維成本2 個部分,其中建設成本主要包括基站設備天饋以及電源配套的投資,而運維成本則體現為租金和電費。成本解構的整體示意如圖8所示。

圖8 基站成本解構整體示意圖
按照通用原則,從基站設備天饋、電源和配套3個維度,對建設成本進行模塊化解構,整體示意圖如圖9所示。

圖9 建設成本模塊化整體示意圖
基站成本主要包括主設備、天饋線、施工費和其他費用,其中設備成本區分主設備新建/擴容區域;以某地(市)為例,價值區域的基站綜合造價為11.37 萬元,外圍區域的基站綜合造價為10.73 萬元。具體的模塊化細分過程如圖10所示。
通過細分電源的配電方式獲取模塊化的電源標準價,配套成本則根據機房和架設物的不同獲取模塊化的配套標準價;根據價值區域內外不同的電源和配套比例,對某地(市)歷史數據進行匯總分析可知,價值區域的自建站點的電源綜合造價為10.1 萬元,外圍區域的自建站點的基站綜合造價為11.6 萬元。電源配套的細分模塊如表2所示。

圖10 基站成本模塊化示意圖

表2 電源配套成本模塊
根據中國聯通自有產權站點的運營數據和鐵塔產權的租金數據,對中國聯通自有產權站點和鐵塔產權站點進行分類測算;以某地(市)為例,自有產權站點為29%,鐵塔產權站點為71%,則具體的價值區域內外運營成本如表3所示。

表3 運營成本模塊
通過對本地網現網數據進行分析,尋找投資與收入之間的關系拐點,其核心思想是“收入-成本>0”。
其中,從單站維度進行模型構建時,該站的收入需大于成本才能滿足建設準入門檻;從區域維度考慮時,可選取一片區域(例如價值區域),對站點的收入/成本的值進行從大到小排序,然后分別對收入和成本進行累計求和,尋找收入與成本之間的關系拐點,當△(收入-成本)=0時,區域投資趨于飽和。
通過收入和成本構建單站效益評估模型,并在單站的基礎上構建區域效益評估模型(見圖11)。

圖11 區域效益評估模型
以廣東省某地(市)為例,當年建設站點中價值區域內站點比例為65%,建設完成后全網價值區域內站點比例將達到70%。
對當年建設站點的投資效益進行測算,全網共有63%的站點滿足網絡投資匹配模型,其中價值區域內的網絡投資滿足匹配模型的比例為73%,價值區域外的網絡投資滿足匹配模型的比例為41%。
針對不滿足網絡投資匹配模型的站點,需要重點關注投資精準性和低效益整治,尤其針對價值區域外不滿足投資效益的站點,應盡量把控建設節奏,可結合市場承諾和投資回收期逐步提升覆蓋效果。
以廣東省某地(市)為例,按照前述的用戶解構分析,對2018 年價值區域進行投資效益測算,當站點建設比例達到88%時投資收益拐點出現(見圖12)。

圖12 某市價值區域站點投資效益評估
本研究與市場部門深入對接,從目前市場收入結構進行分析,對增量收入的構成和存量收入的構成進行解構,并對網絡投資基于深度覆蓋提升區域、廣度覆蓋擴展區域等進行分類,進而將網絡投資與對增量收入的拉動和存量收入的維持等進行對接建模,形成測算模型,用于網絡投資合理性的分析和后評價。