盛莉莉 谷俊江
中國聯合網絡通信有限公司江蘇省分公司
隨著移動互聯網業務的普及,人們對無線移動網絡質量的要求越來越高。尤其是視頻、游戲業務的發展使得用戶對于數據業務的流量要求越來越高。無線小區的業務流量也成為網絡后期規劃擴容的依據。但是從KPI指標體現的業務流量是否反映了該小區下用戶的實際流量需求?最常見的,容量的瓶頸會導致用戶的實際業務需求無法滿足,同樣,由于干擾,覆蓋等問題也會導致用戶在使用業務時由于速率過低放棄繼續使用數據業務的情況。這就是用戶的實際流量需求被壓抑的情況。因此,現網中由于各種因素的干擾,KPI指標所反映的業務流量和實際用戶需求流量是存在差異的。如果用現網的指標作為流量預測的根據,將會導致預測不準,使得網絡規劃跟不上用戶需求的發展,最終導致用戶感知和滿意度的下降,因此,需要有手段對網絡中的流量壓抑進行識別,并將還原后的流量指標作為網絡擴容規劃的依據。同時也需要對流量受壓抑的根因進行判斷,以便做出快速有效的調整措施,及時改善用戶感知。
本方案通過標桿小區的確定,找到指標正常、感知正常、不存在流量壓抑情況的小區,探索其流量和指標之間的特性并建立模型,將其他小區的指標輸入模型之后判斷是否存在流量壓抑,整個流程分為分類、擬合、異常識別、壓抑預估、根因判斷5個步驟,實現方法如圖1所示:

圖1 流量壓抑識別流程
PRB(PHYSICAL RESOURCEBLOCK)利用率是反映無線網業務量最為直觀的指標,正常情況下該指標會隨著用戶數和業務量的增加而增加。因此,小區的PRB利用率和小區的流量一定存在直接的關系,但是由于實際網絡環境的復雜性、用戶行為的差異以及無線環境的差異,兩者之間的關系也一定存在差異,比如,在存在干擾的情況下會存在PRB利用率虛高的情況,少量的小包業務也會影響PRB的調度。因此,需要通過多個維度對小區進行分類,以確定不同類型下標桿小區的PRB利用率和流量之間的不同關系。分類的維度可以包括:社會場景、業務類型、用戶規模、無線環境、頻段特征等。利用以上維度作為特征值,采用k-means聚類算法,可以獲得無線小區的分類。
分類完成之后首先進行標桿小區的確定,標桿小區即不存在容量瓶頸的小區。
擬合,是為了獲得PRB利用率和流量之間的關系。對于每一類標桿小區的數據集,計算該場景下PRB利用率和流量之間的關系模型即流量預估模型,為增加魯棒性,此處采用線性模型。
任何原因的流量壓抑均會導致用戶的感知惡化,但是由于KQI指標比較主觀,相應的指標需要從信令中匯總計算獲得,處理復雜度較大。并且KQI性能惡化不一定是單個因素造成,可能是多個因素組合導致。因此,本文首先對通過FPGrowth算法學習無線性能指標惡化與用戶感知異常事件的關系,并形成網優性能指標與感知異常的關聯規則庫(KK關聯規則庫),并通過設置置信度門限甄別出感知異常小區。
(1)輸入正負樣本
正樣本包括正常小區及其無線性能指標,負樣本包括異常小區及其無線性能指標。正負樣本提取需要部署用戶級定界組件,針對定界后的結果進行規則學習。
(2)獲得關聯規則
通過FPGrowth算法,學習無線性能指標與感知的關系規則庫,即當小區哪些無線性能指標惡化時會導致感知惡化以及該規則在過往歷史中的置信度。
數據處理:對數據進行一致性檢查、缺失值的處理、數據關聯、異常值處理等;
機器學習:對數據進行數值離散化處理、規則挖掘并進行模型檢驗及優化;
建立規則文檔:將挖掘出來的規則生成文檔。即哪些因素會導致該KQI差,并包含其對應的置信度(即該組合導致KQI劣化的概率)。
(3)感知異常小區識別
通過設置置信度門限,有效甄別出由于無線原因導致的感知異常小區。
對于前面獲取的感知異常小區再根據擬合步驟中得到小區的流量預估模型計算得到理論的流量值。流量理論值減去實際值的差即為流量壓抑預估值,當流量壓抑預估值大于設定的門限時,認為該小區存在流量壓抑的情況。具體步驟如下:
(1)匹配分組:按找對應的場景、頻段、業務類型,人數規模等維度匹配對應分組,并獲得相應的線性回歸標桿函數f(x);
(2)估算小區應有流量:將目標小區的用戶平均數據代入其對應分組的線性回歸標桿函數f(x),估算小區應有的總流量。(當估算PRB利用率小于當前利用率時,按照當前利用率計算);
(3)計算小區壓抑流量:小區應有流量減去其現有流量得出受壓抑流量,即受壓抑流量= f(x)–目標小區當前流量(當數值小于零時,填為零);
(4)與設定門限值對比,判定是否存在流量壓抑。
流量壓抑識別后,需要對造成流量壓抑的無線側根因進行定位。本方案采用根因矩陣識別算法進行根因識別。本方案對覆蓋、質量、容量、切換、干擾指標進行分級,根據設定絕對門限和質差門限,分為指標良好,指標較差、指標差按三個等級。
STEP 1:覆蓋、質量根因識別
如表1所示。覆蓋差定義為RSRP>-105的采樣點比例滿足絕對門限。

表1 覆蓋問題判斷示意圖
覆蓋較差定位為RSRP>-105的采樣點比例滿足質差門限。
覆蓋好定義為RSRP>-105的采樣點比例不滿足絕對門限,也不滿足質差門限。
質量差定義為CQI≥7的比例滿足絕對門限。
質量較差定義為CQI≥7的比例滿足質差門限。
質量好定義為CQI≥7的比例不滿足絕對門限,也不滿足質差門限。
STEP 2:干擾根因識別
如表2所示。基于無線、質量根因識別的結果,再結合干擾的情況進行根因識別。干擾嚴重定義為干擾噪聲平均值滿足絕對門限。
有干擾較差定義為干擾噪聲平均值滿足質差門限。
無干擾定義為干擾噪聲平均值低于質差門限。

表2 干擾問題判斷示意圖
STEP 3:切換根因識別
切換差定義為切換相關指標中有一項滿足絕對門限。
切換較差高定義為切換相關指標均不滿足絕對門限,但有一項切換指標滿足質差門限。
切換好定義為切換相關指標中沒有一項滿足絕對門限,同時也沒有一項滿足質差門限。
STEP 4:容量根因識別
如表3所示。負荷很高定義為容量相關指標中有一項滿足絕對門限。

表3 質差門限、絕對門限定義
負荷較高定義為容量相關指標均不滿足絕對門限,但有一項容量滿足質差門限。
負荷正常定義為容量相關指標中沒有一項滿足絕對門限,同時也沒有一項滿足質差門限。

根因類別 質差門限 絕對門限175 ≥250最大RRC連接用戶數 容量31(800M) ≥90干擾噪聲平均值 干擾 ≤-95dBm ≤-90dBm X2接口切換成功率 切換 98% 95%eNodeB內切換成功率 切換 98% 95%
本文涉及的功能已經在江蘇聯通上線并應用。從數據評估上看,蘇州流量壓抑較為嚴重,且根因分析判斷大部分為覆蓋引起,這與現網實際情況比較一致?,F網對于干擾引起的流量壓抑問題進行了整改,效果較為明顯。圖2是針對蘇州的流量壓抑小區SZ_KS_HW_仕泰隆拉遠電信雞鳴塘_FL_B_1的分析處理結果,根據根因判斷,該小區由于干擾問題導致流量壓抑,從表4的KPI指標中可以明顯看出該小區存在干擾。圖3顯示,采取優化措施解決干擾問題后,日均流量顯著提升。

圖2 系統分析界面

表4 受壓抑小區指標
經實際驗證,基于機器學習算法和KQI/KPI指標關聯可以有效識別網絡中的流量壓抑情況,對于識別網絡中的偽低負荷小區,還原用戶實際流量需求,激發網絡流量,改善用戶感知有積極作用,也能為網絡擴容和規劃發展提供更精準的決策數據。

圖3 調整前后日均流量對比