郭華,張東林,徐維華,張航,陳超
(中國移動通信集團吉林有限公司,吉林 長春 130033)
隨著4G/5G 網絡的不斷深入建設,無線網絡運維成本急劇上升,將人工智能技術與無線網絡運維相結合成為了重要的解決途徑。目前業界在該方面的研究仍然處于探索階段,文獻[1] 探討了人工智能技術在異常數據診斷、指標趨勢預測、小區擴容等方面的應用,文獻[2] 給出了機器學習在無線網絡規劃中的應用,文獻[3] 梳理了人工智能當前在通信領域的研究和應用進展,并給出了網絡智能化解決方案,文獻[4] 探討了多元線性回歸模型在5G 功耗建模中的應用,文獻[5-7] 分別從流量預測、用戶感知速率預測、認知無線網絡優化等高階應用方面進行了研究,文獻[8] 和[9] 給出了人工智能技術在網絡運維中遇到的困難,文獻[10] 和[11] 則進行了人工智能在5G 網絡中的應用探討。近年來,雖然在光無線網絡自治、資源分配、移動性管理等方面進行了研究[12-13],但是當前基于機器學習的網絡參數自優化的研究與應用仍然較少。
無線小區負載均衡[14]優化是指在特定的無線環境下,通過無線參數調整等手段對同站內具有一定覆蓋重疊度的小區實現流量均衡分擔,是近年通信網絡感知優化的重點方向。現有的負載均衡優化只能根據人工經驗逐個比對同扇區內的負載不均小區對之間的相互關系,以制定參數調整方案,往往需要大量反復的手動核查,準確率、效率均無法有效提升。以吉林省通化、白山、遼源、長春這四地市為例,每周2 000 個負載不均小區中需要反復關聯、核查、計算的十大類參數共計約35.7 萬條,數據量巨大,人工優化已經很難勝任。鑒于此,本文介紹了基于XGBoost(eXtreme Gradient Boosting,極限梯度提升樹)[15]集成學習方法和DNN(Deep Neutral Network,深度神經網絡)[16]的無線小區負載均衡參數自優化原理以及實驗實現。利用機器學習的自學習機制,實時自動化輸出負載不均衡小區的主要均衡參數,從而實現負載均衡的自優化,使得工作效率顯著提高。
本文提出一種基于機器學習的負載均衡自優化方案,利用XGBoost 算法以及DNN 網絡對負載均衡小區參數配置進行建模學習,然后自動輸出負載不均小區優化方案。整體流程方案如圖1 所示:

圖1 整體流程方案
主要流程如下:
(1)基于均衡小區的切換事件建模:采用XGBoost算法,以現網均衡小區的無線網絡特征數據作為輸入、均衡小區的切換事件配置作為學習目標,對XGBoost 模型進行訓練,這里切換事件配置主要包括A3/A4/A5 三類。
(2)負載不均小區切換事件預測:基于上述訓練模型,將待優化的不均衡小區的無線網絡特征數據作為輸入,輸出不均衡小區對的切換事件配置,即對不均衡小區按A3/A4/A5 進行分類,由此確定了切換事件。
(3)基于均衡小區的切換事件門限建模:在確定切換事件的基礎之上,采用全連接網絡,以均衡小區的無線網絡特征、切換事件配置作為輸入,以各小區對應的切換事件門限作為學習目標,對神經網絡進行訓練,此步驟屬于多任務回歸問題。
(4)不均衡小區切換門限預測:以待優化的不均衡小區無線網絡特征以及切換事件作為輸入,輸出不均衡小區切換事件對應的門限配置。
本文首先介紹如何對均衡小區的無線網絡數據進行特征選擇,然后分別針對負載均衡小區切換事件、負載均衡小區切換事件門限的建模過程以及預測進行詳細描述。
無線小區的負載均衡參數配置需要考慮眾多網絡因素,如兩個負載小區的用戶數、流量、PRB 利用率、頻率、接通成功率、切換成功率、掉線率、MR、覆蓋距離等指標,以及兩個負載小區對間的共性因素,如兩個小區的方位角覆蓋偏差、小區對間切換次數、小區對切換成功率、同扇區小區數目、最近鄰距離等。
通過對吉林省通化、遼源、白山三地市負載均衡小區網絡數據進行整理,按負載均衡小區定義關系,匹配小區對后得到網絡特征共計73 個,采用卡方檢驗法對特征進行選擇[17],挑選對負載均衡影響最大的topN特征??ǚ街涤嬎愎饺缦拢?/p>

其中,A為變量的觀測值;E為理論計算值。應用到特征選擇,對于特征X與分類Y的卡方值,有:

其中,count(X)、count(Y)、count()、count() 分別表示包含特征X的頻次、包含分類目標Y的頻次以及不包含特征X的頻次、不包含分類目標Y的頻次。
這里取打分值在前90%的特征為最終的特征選擇結果,最終得到60 個主要特征,卡方得分值為1萬~30 萬,具體分布如圖2 所示:

圖2 特征得分分布
部分特征得分如表1 所示,基于特征選擇結果進行后續的建模。

表1 部分特征得分表
小區負載均衡主要依靠調整小區對間互操作參數實現,其中最重要的為切換調整,主要包括負載不均小區間的切換事件調整以及對應的切換門限調整。具體參數如表2 所示:

表2 切換事件-對應門限
(1)切換事件:取值包括A3/A4/A5 三類。
(2)切換門限:在確定切換事件的前提下,有各自對應的門限參數。
本節采用XGBoost 實現切換事件的預測,屬于分類問題。XGBoost 為GBDT[18]梯度提升樹的一種高效實現,不同之處在于XGBoost 在目標函數、樹節點分裂方式、特征離散化等細節進行了諸多改進,無論執行速度還是準確率都有顯著提高。一般形式如下,假設第t次迭代需要訓練的模型ft(x),則有:


表3 XGBoost參數配置
以吉林省通化市2021 年8 月份3 609 對負載均衡小區數據作為樣本數據。將樣本數據按8:2 比例劃分為訓練集、測試集,對訓練集數據依次按[0.1,0.325,0.55,0.775,1] 比例劃分,并進行交叉驗證。訓練集、測試集準確率學習曲線對比如圖3 所示,當樣本數量達到1 500 以后,模型性能達到穩定。

圖3 訓練集、測試集學習曲線
進一步用訓練數據集對XGBoost 模型進行訓練,然后用測試集驗證結果。A3/A4/A5 預測結果混淆矩陣如表4 所示,整體預測準確率為97.37%。

表4 測試集混淆矩陣
利用XGBoost 庫的predict_proba 函數分別輸出A3/A4/A5 事件預測概率,并繪制對應的ROC 曲線如圖4 所示,橫坐標表示假陽率,縱坐標表示真陽率,可見ROC曲線呈現出靠近左上角趨勢。用sckit-learn[19]的sklearn.metics.auc 函數分別計算圖4 中A3/A4/A5 ROC 曲線面積(即AUC 值)分別為98.16%、97.02%、97.02%,可見模型較為穩定,具有較強的泛化能力。

圖4 A3/A4/A5分類ROC曲線
對XGBoost 模型中的樹結構進行繪制,為一個7 層的樹結構模型,具體如圖5 所示。

圖5 XGBoost結構圖
本節主要介紹采用全連接神經網絡實現負載均衡切換門限預測,屬于回歸問題。定義一個具有2 個隱藏層的DNN 網絡,可以擬合任何精度的平滑映射。
(1)輸入層:包含同扇區下小區對間的方位角60 個特征以及A3/A4/A5 某個切換事件之一,共計61 個節點。

(2)隱藏層:共計2 層,第一層20 個節點,第二層5 個節點,用以處理中間輸入。設輸入層節點為x1~xn,輸入xi到隱藏1 層鏈接權重為,則有:其中,f為隱藏層激活函數,采用RELU 作為激活函數[9]。兩個隱藏層之間添加一個BatchNormalization[20]層,并設置Dropout=0.5[21],用以控制過擬合。
(3)輸出層:針對不同的事件門限預測,不設置激活函數,輸出節點數與A3/A4/A5 事件對應的參數門限數分別一一對應,門限參數詳見表1。由此得到對應的網絡結構圖整體如圖6 所示:

圖6 網絡結構圖
以吉林省通化、白山、遼源三地市2021 年8 月份8 536對負載均衡小區數據作為樣本數據,對樣本數據集分別按A3/A4/A5 切換事件進行劃分,得到基于A3 切換的小區對4 092 個、基于A4 切換的小區對2 070 個、基于A5切換的小區對2 374 個。
按訓練樣本、測試樣本8:2 比例進行數據集劃分,損失函數采用平均絕對誤差MAE,分別以A3/A4/A5 切換事件對應的切換門限,包括A2 門限值、CIO 值、A4 門限值、A5 門限值為學習目標,最終得到對應門限平均損失函數曲線如圖7 所示。當迭代次數達到100 次以后,訓練、測試數據集損失曲線逐步趨于穩定,A3/A4/A5 對應的參數誤差波動在2~4。

圖7 A3/A4/A5門限訓練-測試誤差分布圖
以A4 切換事件為例,A4 事件相關聯的三個門限值:CIO 值、A2 門限值、A4 門限值的預測平均絕對誤差以及在現網中的取值范圍如表5 所示??梢园l現,相對于各類門限的現網取值范圍,預測誤差的波動在可接受范圍之內,可以用于實際的優化工作中。

表5 預測誤差與現網取值范圍
進一步采用擬合優度R2得分對模型進行預測能力綜合評估,擬合優度計算方法如式(6) 所示,R2≤1,當R2越接近1,代表預測值與實際值越接近,預測效果就越好。

各切換事件對應參數的擬合優度值依次如表6 所示,R2值全部在0.6 以上,CIO 擬合優度在0.6~0.7,切換門限擬合優度全部在0.7~0.8,可見模型的擬合效果較好。

表6 各參數擬合優度值
本文分別給出了負載均衡小區的均衡事件、門限的自優化方法,包括網絡特征選擇、基于XGBoost 和深度學習網絡的負載均衡優化原理以及實驗結果。通過該方法可以在較高的準確率下,實現對無線網絡負載均衡切換參數的建模學習。目前人工智能技術在此方向的應用仍然較少,本文進一步拓寬了AI 賦能無線網絡優化的研究思路與方向。后續將進一步融合其他方法以增強模型的表達能力,如加入知識圖譜用以描述小區間關系、加入強化學習用以實現獎懲策略等,并擴展應用到無線網絡優化的其他領域,如鄰區切換自優化、小區選擇自優化、功率設置自優化等。