李小聰
(中國電信股份有限公司北京分公司,北京 100032)
目前,隨著用戶的需求越來越多樣化,如何保證網絡正常運轉成為了一個重大的難題。網絡故障診斷技術是一種能夠實時監控網絡和其相關節點的改變情況,觀測鏈路之間是否正常運行,若發現問題則第一時間反饋給管理系統的技術[1-4]。該技術主要是保障網絡服務的質量,及時提供故障預警信息。隨著人工智能技術的興起,研究者逐漸在網絡故障診斷領域引入人工智能技術[5-9]。與傳統的人工診斷方法相比,基于人工智能的網絡故障診斷可以進一步提升故障診斷效率。
以毫微微小區、微小區與宏小區覆蓋的4G 網絡場景為研究目標,其異構無線網絡場景如圖1 所示。該研究目標具有復雜的系統結構,因此難以有效管理網絡。針對該研究目標探討如何診斷網絡故障,首先分析和關聯衡量網絡性能的關鍵性能指標(Key Performance Indicator,KPI)與常見的網絡故障,這也是構建模型的必要前提工作。

圖1 異構無線網絡場景
生成對抗網絡(Generative Adversarial Network,GAN)從提出至今受到了領域內許多研究者的歡迎。GAN 分別包括生成模型和判別模型2 種模型,即模型G和模型D。模型G和模型D之間會不停對弈,在對弈中模型各自的性能也會隨之提高。基于模型D,模型G可以在無大量先驗知識的情況下產生相近的數據。多層感知器定義的優化目標函數公式為
式中:E為數學期望;D(x)為真實輸入x經過模型D的輸出值;G(Z)為噪聲輸入Z經過模型G的輸出值;pdata為輸入x的分布;pz為輸入Z的分布。
更新模型D參數時,希望D(x)的輸出結果最優可以在1 附近或者等于1,即最大化logD(x)。對于基于噪聲產生的數據G(Z)而言,希望D[G(Z)]的輸出可以是0,即當模型D產生的數據足夠逼真時,仍可以篩選出D[G(Z)]輸出數據中的假數據,因此需要最大化log{1-D[G(Z)]},從而要求判別器輸出結果最大化。
更新模型G的參數時,盡量保持pz=pdata,因此log{1-D[G(Z)]}的值越小越好,即最小化生成器的輸出。
博弈過程中,基于真實數據,可以取樣出x并將其作為模型D的輸入數值。輸入該數值后,模型D可以基于自身的邏輯框架生成一個在[0,1]內的數值,該數值越接近1 越好,從而可以判斷模型D的輸入數據是真實數據。之后,模型D和模型G會進行不停的訓練。模型G的輸入信號為服從特定分布規律的噪聲,其可以基于真實數據進行學習直到可以產生相似的數據,然后將該數據輸入模型D,模型D可以基于自身的邏輯判斷框架生成一個[0,1]范圍內的數值,且輸出值越接近0 越好,表示模型可以判斷數據為假數據。
基于GAN 的網絡故障診斷模型如圖2 所示。首先,基于異構無線網絡收集和關聯不同網絡情況下的KPI 數據,收集來的數據需要先通過歸一化處理,然后基于GAN 進行數據擬合,得到附有標記的模擬數據(不同網絡狀態下)。其次,分別處理由原始網絡和GAN 模擬制造的2 種數據集,同時利用極限梯度提升算法(Extreme Gradient Boosting,XGBoost)降維數據,篩除冗余的數據,在診斷故障時選擇輸入參數的最優特征組合。最后,基于XGBoost 算法的訓練可以得到最優模型。

圖2 基于GAN 的網絡故障診斷模型
網絡故障診斷模型必須具備可以識別多個故障的能力,因此需要確定不同網絡狀態對應的癥狀。將具有m個KPI 的輸入向量(不同網絡狀態下)定義為S,S=[KPI1,KPI2,KPI3,…,KPIm];網絡的狀態定義為C=[FC1,FC2,FC3,…,FCn]。
被研究小區的KPI 可以組成小樣本數據,作為異構無線網絡的輸入數據。如果在某一區間時段內,有網絡故障FCi出現,那么相應的網絡狀態公式為
式中:KPImt表示第m個KPI處于t時刻的數值。
輸入數據時,歸一化特定的KPIi'以保證其具有相似的動態范圍。基于每個最大KPI 進行歸一化操作,其計算公式為
式中:KPIi'表示對第i個KPI進行歸一化處理后得到的數據;max(KPIi')表示在已收集的數據中出現的最大的第i個KPI。式(3)表示排除[0,1]范圍內的KPIi,對特定的KPIi范圍進行轉換。
網絡狀態經過歸一化后變成
GAN 框架如圖3 所示,需要具備2 個處于競爭狀態的網絡并同時優化目標。

圖3 GAN 框架
第一個網絡是基于均勻噪聲或者給定高斯噪聲來輸出模擬輸入數據的生成器模型G;第二個網絡是判別模型D,其用0 或1 來標記判斷樣本,進而判斷輸入數據是生成的還是來自真實采集。經過迭代,該競爭網絡模型可以更好地完成任務。生成模型G甚至可以產生出以假亂真的輸入數據。優化的目標函數公式為
基于GAN 生成模型,僅僅需要一個噪聲(有一定規律)、2 個網絡(可逼近函數)和一些數據(實際數據),不會存在特別困難的計算問題。2個模型(判別器和生成器)彼此間互相博弈,判別器穩定時,可以由生成器獲取不同的網絡狀態,輸入數據的分布也趨向于實際數據分布'FCi,其計算公式為
此外,本研究利用了帶梯度懲罰的Wasserstein GAN 算法(Wasserstein GAN with Gradient Penalty,WGANGP)[10]。
首先,進行仿真時,在數據處理階段采用WGAN-GP 算法學習小樣本數據,該數據具有特定規律性;其次,得到附有標記的大量虛擬數據,并基于得到的虛擬數據集與小樣本數據,采用XGBoost 算法診斷網絡故障,網絡故障診斷正確率如圖4 所示。由圖4 可知,本研究提出的方法隨著迭代次數增加最終可以達到0.9848 的正確率,一定限度上提高了網絡故障診斷的正確率。

圖4 網絡故障診斷準確率
由于傳統方法難以解決基于異構無線網絡狀態下大量獲得附帶標簽的歷史數據問題,受GAN 啟發,提出一種新的異構無線網絡故障診斷方法。首先基于WGAN-GP 算法,對從網絡環境中收集得到的小樣本進行學習,隨后得到大量帶標記的模擬數據,利用XGBoost 算法對數據進行網絡故障診斷,最后進行仿真實驗,證明該方法可以顯著提高網絡故障診斷的準確率。