[徐正國 周明 金鑫 傅傳家]
隨著4K、VR 等視頻技術成熟和工信部“雙千兆”行動計劃中千兆寬帶指標要求[1],千兆寬帶等同5G,已納入國家“新基建”,10G GPON 開始規模部署。如何精準預測10G GPON 建設規模,是10G GPON 網絡規劃建設的難題。目前,關于10G GPON 部署策略是根據GPON端口忙時帶寬利用率或GPON 端口千兆用戶數超過某個閾值[2],升級10G GPON COMBO 板,但帶寬利用率和GPON 端口千兆用戶數在規劃時難以準確。本文通過對現有GPON 口承載的千兆用戶分布分析,對不同千兆用戶規模下,分布在GPON 口數進行正態模型驗證和回歸分析,給出10G GPON 建設規模預測模型,結合市場千兆用戶發展規模,應用模型預測10G GPON 建設規模,實現精準投資。
正態分布最早由德國數學家和天文學家棣莫弗于1733年在求二項分布的漸近公式時提出,后由德國數學家高斯將其應用于天文學研究誤差測量,故正態分布又叫高斯分布,拉普拉斯和高斯研究了其性質。
若隨機變量X 服從一個數學期望為μ、方差為σ2的正態分布,其概率密度函數為:

μ 是服從正態分布的隨機變量的均值,σ2是此隨機變量的方差,所以正態分布記作N(μ,σ2)。正態分布的期望值μ 決定了其位置,其標準差σ 決定了分布的幅度。對任意服從N(0,σ2)的隨機變量,正態曲線下橫軸上一定區間的面積,反映變量值落在該區間的概率,則橫軸區間(μ-σ,μ+σ)面積為68.26%。

橫軸區間(μ-2σ,μ+2σ)內的面積為95.45%。

橫軸區間(μ-3σ,μ+3σ)內的面積為99.73%。

這說明,X 落在(μ-3σ,μ+3σ)以外的概率小于3‰或落在(μ-2σ,μ+2σ)以外的概率小于5%,基本符合正態分布。
建立基于正態分布的10G GPON 建設模型,需從如下兩步研究:
(1)驗證千兆用戶數與GPON 口數是否符合正態分布:首先從家寬資管中提取所有用戶的簽約帶寬、對應GPON 口;再從GPON 口維度統計承載用戶數,分別統計分析不同簽約帶寬用戶數;最后計算統計簽約帶寬為千兆對應的GPON 口數,驗證GPON 口數是否落在(μ-2σ,μ+2σ)區間內,即是否符合正態分布。
(2)回歸分析,然后反復輸入數據,得出千兆用戶與GPON 口分布模型公式。
從家寬資管中提取所有用戶的簽約帶寬、對應GPON口,分別統計分析不同簽約帶寬用戶數,如表1 所示。

表1 GPON 口承載不同簽約帶寬用戶數
目前市場簽約帶寬以200 M 為主,300 M 為輔,300 M用戶是下一步最先升級為千兆用戶,所以下面以300 M 和千兆數據樣本為例,分別統計承載1 個千兆用戶的GPON口數,2 個千兆用戶的GPON 口數……,同理統計300 M用戶GPON 口數,如表2 所示。
將表2 數據通過Excel 散點圖,分析出千兆和300 M用戶的GPON 口數分布,如圖1、2 所示。

表2 不同簽約帶寬用戶對應GPON 口數統計表
如圖1,千兆用戶超4 個的GPON 口數,越來越少,本次取定單GPON 口超4 個千兆用戶的GPON 口數進行直方圖分析,具有正態分布性,如圖3 所示。

圖1 千兆用戶GPON 分布

圖2 300 M 用戶GPON 分布

圖3 超4 個千兆用戶的GPON 口數直方圖
為進一步分析超4 戶千兆用戶數(X)對GPON 口數(Y)的關系,需對上述數據進行線性回歸分析。線性回歸分析是利用最小二乘函數對一個或多個自變量(X)和因變量(Y)之間關系進行建模的一種方法,涉及總體回歸模型、總體回歸方程等,計算復雜,而SPSSAU 是一款網頁版數據科學算法平臺工具,包括分類匯總、相關、回歸等16 類算法,僅需把超4 戶千兆用戶數(X)和GPON 口數(Y)樣本數據輸入,可得出分析結果,本文使用SPSSAU工具線性回歸分析方法[3],輸入超4 戶千兆用戶數(X)和GPON 口數(Y)樣本數據,具體計算結果如表3 所示。

表3 線性回歸分析結果(n=5)
從表3 可知,將千兆用戶數作為自變量,而將GPON口數作為因變量進行線性回歸分析,預測線性模型公式為:
超4 戶GPON 口數=2773.190+0.113×千兆用戶數
模型R 方值為0.973,說明 GPON 口數的97.3%變化原因。對模型進行F 檢驗時發現模型通過F 檢驗(F=109.366,p=0.002<0.05),也即說明千兆用戶數對超4 戶的GPON 口數產生顯著的正向影響關系。
根據模型公式(1),取不同千兆用戶發展規模,預測超4 戶GPON 端口數,按照中國移動集團建設指導意見,當單GPON 口超某一個閾值(本案例取定4 戶),將此GPON 口升級為10G GPON 口,測算10G GPON 口建設規模,如表4 所示,根據市場發展規模,取不同千兆用戶數,測算10G GPON 口建設規模。當千兆用戶發展10 萬時,需建設配置約1.4 萬10G GPON 口,當30 萬時,需建設配置約3.7 萬10G GPON 口,接近當前網絡規模。

表4 不同千兆用戶對應建設10G GPON 規模表
不同簽約家寬用戶服從正態分布或近似正態分布,如:承載22個300 M用戶GPON口數、承載4個千兆用戶數等,因此在千兆寬帶建設中可使用正態分布,預測10G GPON建設規模。應用正態分布預測10G GPON 建設規模,需根據現網資料的分布特點,選用恰當步驟:
(1)散點圖:將千兆用戶分布GPON 數用散點圖呈現,確定閾值。
(2)直方圖:驗證是否符合正態分布。
(3)回歸驗證分析:將千兆用戶數作為自變量,GPON 口數作為因變量進行線性回歸分析,確定模型公式。
(4)預測結果:輸入不同千兆用戶數,測算10G GPON 建設規模。
在降本增效背景下,落地實施國家“雙千兆”網絡的建設,如果盲目超前建設,給運營商帶來資金壓力。本文分析驗證GPON 口承載的千兆用戶數正態分布,給出預測模型和應用模型步驟,提高了10G GPON 部署演進的精準度,有效指導運營商千兆寬帶建設,確保投資效益。