趙晉明
(山西省太原市文通電子有限公司,山西 太原 030002)
一種基于隨機映射的網絡狀態評估方法
趙晉明
(山西省太原市文通電子有限公司,山西 太原 030002)
近年來,機器學習技術在網絡管理領域得到了廣泛使用。然而由于通信網絡日益復雜,網絡中的非線性和不確定因素使得機器學習變得十分困難。為了提升機器學習的效果,提出了一種采用隨機映射的人工神經網絡方案,其特點是引入機器學習和網絡拓撲的隨機性,使得神經網絡對學習目標具有更大的適應性,并實現更快、更精確的收斂。相關成果已經在中國移動通信集團山西有限公司(以下簡稱山西移動)的實際網絡中得到了應用并取得較好的效果。
機器學習;隨機映射;神經網絡;網絡管理
隨著網絡規模的不斷擴展,網絡管理系統需要管理越來越多的網絡設備。與此同時,由于網絡環境日益復雜,對于網絡狀態的判斷也更加困難,即使是擁有豐富經驗的網絡管理者也很難準確了解網絡當前狀態。由于當前網絡規模十分巨大、相互交互十分復雜,網絡狀態與采集到的網絡參數之間具有非常明顯的非線性關系。在這種無法明確建立模型和機制的情況下,通過對大量網絡中實際運行數據的分析,可以更充分地了解當前網絡的狀態,發掘網絡系統的演化規律,從而實現更加有效的網絡管理。
神經網絡是一種可以有效處理上述復雜系統的數學工具,目前已經廣泛應用于工業、經濟和社會等復雜系統中。神經網絡可以通過大量數據擬合分析挖掘出數據中潛在的有用知識,并自發構建成可以操作的模型。采用神經網絡不僅可以為系統控制和分析提供支持,而且可以幫助人們更深入地理解和認識復雜系統。
神經網絡的原理是通過相空間重構等方法將復雜的非線性關系轉化為函數逼近問題,進而采用遞歸優化的方式進行求解[1,2]。當前相關工作主要集中于前饋型神經網絡(feedforward neural network,FNN)的運用,例如徑向基函數 神經網 絡[3](radial basis function,RBF)和 支 持 向 量機[4](support vector machine,SVM)等。然而,這類神經網絡對數據質量要求較高、自身收斂較慢[5,6],因此十分依賴數據分析人員的經驗。這種缺陷使得傳統前饋型神經網絡難以得到運營商的大規模應用。
和機器學習不同,人類通常可以基于少量的數據,快速學會識別和理解復雜的系統。實驗表明,人類可以使用少于機器學習1%的數據實現同樣的學習效果。對于機器學習而言,“隨機映射”在很大程度上可以幫助傳統的神經網絡實現人類學習的這一特性[7]。隨機映射與神經網絡的結合最早起源于20世紀90年代隨機向量函數連接型[8](random vector functional-link,RVFL)神經網絡的思想。這一思想的核心就是模仿人類在學習過程中所表現出的“直覺”,通過隨機構造神經網絡的感知層來提升學習效率。
目前,隨機映射的研究方興未艾,針對通信網絡的特點,采用隨機映射的機器學習可以更加有效地實現對網絡的理解,并幫助網絡管理人員更好地管理網絡。目前,各大運營商都開始研究如何提升網絡對業務的實時感知,網絡服務體驗的提升將帶來更好的用戶黏性,從而帶來更多的利潤。為此,提出了采用隨機映射的方式更快地訓練機器,并基于更少的數據實現對網絡狀態的準確判斷。該方法已經在中國移動通信集團山西有限公司(以下簡稱山西移動)得到了示范應用并取得了一定的效果。本文的工作對于相關領域的研究和工程實踐具有一定的借鑒和指導意義。
隨著通信網絡中網絡管理技術的不斷發展,網絡中產生的大量信息和數據都得到了采集和存儲,這些數據和信息呈現出“爆炸式”增長,并形成了海量的信息環境。然而,面對網絡中的海量數據,網絡管理人員往往只對于其中的一些具體目標感興趣。因此,如何高效地從海量網絡數據中提取出網絡管理人員所關心的信息,并根據這些信息對網絡狀態做出準確的評估是一個亟待解決的問題。
傳統的網絡管理對于數據的處理更類似于“檢索”,即通過關鍵字、屬性或標注等方式在海量數據中檢索信息,并將檢索到的信息經過簡單的處理和分析后向網絡管理者呈現。這一技術的發展比較成熟,但是這一方法面臨以下3個問題。
(1)結果不充分
網絡中的數據實際包含著非常豐富的信息和意義,單單提取幾個指標或者屬性無法充分對網絡的實際情況進行描述。
(2)主觀判斷帶了的不確定性
不同的網絡管理人員對于同樣的數據和指標可能會做出不同的理解判斷,這種主觀傾向最終必定給網絡狀態的評估帶來較大的不確定性。
(3)工作量巨大
面對網絡中日益增長的海量數據,無論是機器還是人工都需要耗費大量的工作對其進行處理,這種系統實現方式會帶來巨大的開銷。
為了解決上述問題,利用隨機映射與神經網絡相結合的極端學習機器(extreme learning machine,ELM)改進了傳統的數據檢索和比對方法,使得網絡管理系統在使用更少量數據的情況下,進行更為精確的評估。例如,人類只需要看到過床的一角,而不需要看到床的全貌,就可以識別出“床”。同理,網絡管理系統也可以僅從少量的數據中得到對于網絡狀態的判斷。隨機映射可以看作這樣一種提升機器學習能力的機制,使得機器可以建立如人類“直覺”一樣的能力。
具體而言,“隨機映射”通過對少量已知案例的學習,借助神經網絡對于非線性關系良好的表征能力,實現對網絡整體狀態的泛化的檢索和匹配,而不是簡單對于某些具體指標和參數的匹配。這一方案的核心就是利用隨機映射所帶來的學習能力,實現人類從少量樣本中學習和辨別復雜系統的能力。根據上述思想,構建了網絡狀態評估系統,如圖1所示。該系統的功能由3部分組成,即網絡特征提取、網絡狀態索引、相似性匹配。這種檢索方法可以避免傳統檢索方法的局限性,使得網絡管理者可以更好地對網絡狀態進行管理。
所構建的系統中,基于隨機映射的極端學習機器可以很好地完成“網絡狀態索引”和“相似性匹配”這兩項任務,而特征提取是一個單獨的過程。對于計算機系統而言,由于輸入數據的格式、數量、含義有巨大差別,為了便于處理就需要將輸入數據首先轉化為特征向量。特征向量的提取對于不同的數據各不相同,相關研究已經十分成熟,在此不再進行展開研究,第3節主要就隨機映射在網絡狀態評估的應用進行闡述。

圖1 網絡狀態評估的功能流程
為了對網絡狀態進行評估,就需要盡可能準確地描述出系統采集到的網絡數據與實際網絡狀態之間的關系。在傳統的網絡管理系統中,時延、抖動、帶寬等指標常常被認為是衡量網絡狀況最有效的指標。然而,隨著網絡規模的擴大和網絡結構的日益復雜,現在已經不能簡單憑借這些指標對網絡狀態做出評價。例如在無線接入網中,小區覆蓋的信號強度(received signal strength,RSS)是評價網絡質量的重要指標,但是在實際運營的網絡中,一些信號強度較好的小區依然出現較多的掉線、語音不清或者回音等現象。
這種依靠網絡參數對網絡狀態進行評估的方法,從數學角度來看是建立輸入數據與網絡狀態之間的函數擬合。然而,傳統的網管系統通常將網絡數據與網絡狀態之間的關系簡化為線性,這種方法對于結構簡單的網絡可以獲得較好的擬合,然而隨著網絡規模的日益擴大、網絡結構的日益復雜,當前的通信網絡已經成為一個巨大的復雜動力學系統,需要引入更有效的數學模型對網絡進行描述。
如上所述,神經網絡作為對于非線性系統非常有效的描述方式,已經廣泛應用于許多領域,在網絡管理領域也得到了很多應用。然而傳統的神經網絡需要大量的樣本進行訓練,同時為了得到較好的學習效果,需要仔細調整網絡結構和拓撲,避免網絡訓練陷入局部最優,這造成了神經網絡的應用結果差強人意。
為了解決這一問題,利用隨機映射結合極端學習的方式實現高效的神經網絡學習,使得網絡狀態評估在更少的樣本下可以得到有效的實現。采用的神經網絡是最簡單的三層神經網絡,具有典型的三層結構:輸入層、隱藏層和輸出層,其結構如圖2所示,數學表達式如下:


圖2 本文所采用神經網絡的結構
其中,O為神經網絡輸出值,xk∈Rd表示第k個輸入向量,Win為連接輸入層和隱藏層的權值矩陣,b=(b1,…,bn)表示隱藏層的偏置向量,w表示隱藏層和輸出層之間的權值向量,g(·)為激活函數,取 Sigmoid 函數。
機器學習的目標是通過不斷的迭代更新輸出權值,每次迭代的變化量為:

網 絡 的 隱 藏 層 輸 出 矩 陣 ,t=[t1,t2,… ,tn]為 期 望 輸 出 向 量 。的計算式為:

神經網絡方法學習的核心就是通過對式(3)的不斷迭代,找到最優的權值w,使得輸出值與目標值之間的差值最小,這一過程就是對式(3)的求解。在實踐中,對式(3)求解的方法有很多種,本文采用嶺回歸方法并對目標進行正則化,相應的解可表達如下:

其中,I為單位矩陣,C為正則化系數。在權值更新的過程中,為了實現更加有效的學習,引入隨機映射的思想——對于每次訓練的迭代,計算網絡當前輸出值與目標值的差值時,使用相似度函數而不是差值的絕對值來行度量。對于神經網絡的輸出集O和目標集T,相似度函數sim(O,T)的表達式為:

其中,Pr(O=T)表示輸出集O和目標集T一致的概率。這樣,相似度函數的引入使得可以更快達到神經網絡學習結束的閾值,避免了對于目標的過度擬合造成的泛化能力下降,同時也減少了對于訓練數據規模的要求。與此同時,為了避免神經網絡結構對學習過程造成的影響,本文采用了動態可變化的網絡結構。首先初始化最簡單的網絡結構,在學習過程中每次隨機生成多個隱藏節點,并根據情況選擇其中一個加入網絡。新增節點的權值由式(6)給出:

其中,e(i)表示第 k個隱藏節點加入之前,第 i個樣本對應的殘差,g(Win(k),bk,xi)表示由第 i個樣本激活得到的第k個隱藏節點的輸出。上述過程實際是通過一個凸規劃過程對神經網絡的節點進行優化,力圖獲得最簡單的結構模型。從而從神經網絡的結構上保證訓練所需的樣本最少,學習過程的效率更高。
為了對所提出的算法進行驗證,采用山西移動的6 000組網絡樣本對網絡的服務體驗進行評估對比。樣本的服務體驗采用語音通話的MOS(mean opinion score)值來衡量,MOS值是最廣泛使用的一種對語音質量評價的方法,對通話采用1~5分進行評分,當MOS值低于3分時,通話質量較差,反之則可以認為網絡滿足了基本的通話服務體驗要求。
MOS值是一種主觀評測方法,在實際的網絡中,需要通過網絡參數等指標對網絡能提供的MOS值進行判斷。對比采用傳統神經網絡方法和本文所提出方法對于學習MOS值評估的效果。采用的學習樣本包括信號強度、掉線率、阻塞率、網絡CPU利用率、無線資源利用率5個網絡指標以及對應的MOS打分。顯然,上述5個指標與MOS之間具有較強的非線性關系,可以通過對神經網絡的訓練進行較好的擬合。
采用神經網絡學習的一個重大難點是需要足夠的訓練樣本,并建立合理的神經網絡結構。這一要求對于傳統的神經網絡學習是一個巨大的挑戰,而采用隨機映射的神經網絡可以較好地解決上述問題。以采用不同數量的訓練樣本對比傳統評估方法和本文所提出的評估方法,得到的結果如圖3所示。

圖3 本文所提算法與傳統算法比較
可以看到,對于本案例,傳統的神經網絡學習隨著訓練樣本的增加沒有顯著提升判斷的正確率,一方面是由于傳統的神經網絡學習過于追求訓練的擬合程度,使得網絡早早陷入局部最優。另外,神經網絡的結構能否有效地實現對問題的表征也決定了學習的效果。本文所提出的方案可以有效解決這一問題,從圖3的結果可以看出,系統判斷的準確性隨著訓練樣本的增長實現了顯著提升。雖然在樣本較少時,由于算法的隨機性造成了訓練效果較差,但本方案極大地增強了系統的學習能力,使得系統可以用更少的樣本實現快速學習。
目前,該方案已經在山西移動的網絡中進行了試驗應用,并取得了較好的效果。可以預見,人工智能的未來將為人類的生產生活帶來巨大的改變,因此,相關工作的不斷進行有著十分重要的理論與實際意義。
隨著人工智能的發展,機器對于通信網絡這種巨大的復雜系統的理解和管理都將顯著超越人類。為了更好地管理網絡,就需要人工智能更多地參與到網絡管理的過程中,更多依靠機器學習而不是網絡管理人員的經驗來管理網絡。基于這一背景,將隨機映射的思想引入網絡管理的機器學習中,使網絡管理系統可以利用更少的數據實現更加“直觀”的學習。相關研究的開展將為未來網絡管理研究的提供重要的支撐。
[1]KARUNASINGHE D,LIONG S Y.Chaotic prediction with global model artificial neural network [J].Journal of Hydrology,2006,323(1):92-105.
[2]黎明,張化光.神經網絡建模方法研究[J].自動化學報,2002,28(1):27-33.LI M,ZHANG H G.Research of neural network modelling method[J].Acta Automatica Sinica,2002,28(1):27-33.
[3]YU H,REINER P D,XIE T,et al.An incremental design of radial basis function network [J].IEEE Transactions on Neural Networks and Learning Systems,2014,25(10):1793-1083.
[4]MALL R,SUYKENS J A K.Very sparse LSSVM reductions for large-scale data [J].IEEE Transactions on Neural Networks and Learning Systems,2015,26(5):1086-1097.
[5]PEARLMUTTER B A.Gradientcalculationsfordynamic recurrent neural networks:a survey [J].IEEE Transactions on Neural Networks,1995,6(5):1212-1228.
[6]ATIYA A F,PARLOS A G.New resultsonrecurrent network training:unifying the algorithmsand accelerating convergence[J].IEEE Transactions on Neural Networks,2000,11(3):697-709.
[7]ARRIAGA R I,RUTTER D,CAKMAK M,et al.Visual categorization with random projection [J].Neural Computation,2015,27(10):2132-2143.
[8] PAO Y H,TAKEFVJI Y.Functional-link net computing [J].IEEE Computer Journal,1992,25(5):76-79.
A network status evaluation method based on random projection
ZHAO Jinming
Wentong Company Limited,Taiyuan 030002,China
In recent years,machine learning has been widely used in network management.However,the complexity of the communication network is increasing,nonlinear and uncertain factors in the network make the machine learning more difficult.In order to improve the effect of machine learning,a scheme of artificial nervous network based on random projection was proposed.The characteristic of such scheme was the introduction of randomness in machine learning and network topology,which took the learning process more adaptability,and achieve faster and more accurate convergence.
machine learning,random projection,neural network,network management
TN913.2
A
10.11959/j.issn.1000-0801.2016224
2016-07-05;
2016-08-04

趙晉明(1973-),男,山西省太原市文通電子有限公司研發主管,主要研究方向為網絡管理系統的架構和關鍵算法,具有豐富的理論和工程經驗,為中國移動通信集團等運營商解決了大量運維難題,并實現多項關鍵技術突破。