楊 燕
(中國電信股份有限公司北京研究院,北京 100035)
移動網絡運維中關鍵指標預警分析及驗證
楊 燕
(中國電信股份有限公司北京研究院,北京 100035)
從關鍵指標的預警意義出發,通過分析研究提出了一種移動網絡關鍵指標的預警分析方法,并通過兩種具有代表性的網絡關鍵指標的現網數據進行驗證,為運營商實現高質高效的運維管理提供技術參考。
移動網絡;運維管理;預警;關鍵指標
傳統的移動網絡運維工作重點在于保障網絡正常運行的維護和優化,而隨著移動網絡運營商對預測和提升用戶體驗工作的日益重視,監測網絡性能、預測其變化趨勢、避免優良用戶感知的惡化,成為網絡運維工作新的重心之一。利用網絡性能在時間維度上的延續性,運營商可以根據歷史時期的網絡性能數據(關鍵指標,簡稱KPI)預測當前網絡在未來短時間內的變化趨勢,并根據預測結果進行針對性的網絡維護和優化工作,從而在提高運維工作效率、保證優良的用戶感知的基礎上提升市場競爭力。
如何實時預測并提前預防未來移動網絡性能的惡化趨勢,是大多移動網絡運營商在網絡運維和網絡優化工作中遇到的難題。由于日常網絡維護和優化工作中運維部門可以做到對當前網絡指標的實時統計,因此利用移動網絡在時間、空間維度上的“慣性”特征,運維部門通過對網絡KPI的深度分析,使這樣的預測工作成為可能。
如果沒有特殊的重大事件發生的情況下,移動網絡的網絡性能在一段時間范圍內,在同一片地理區域內,通常呈現相似性、可繼承性,就是上述的“慣性”特征。由此可見,利用某一區域移動網絡的某一歷史時期的網絡關鍵性能指標,通過定性定量的算法,可以預估未來一段時間內的移動網絡性能,以此表征網絡是否穩定、性能是否保持。
圖1較為形象地表征了某區域某網絡KPI1的預警過程。利用T0前的一段時間現網統計的KPI1指標,通過預警算法得到(T0,T1)之間的預警值(X0,S0);(T0,T1)時期內,利用(X0,S0)度量預警期(T0,T1)之間的KPI1指標。

圖1 關鍵指標預警示意圖Fig.1 The early warning of KPI
通過上述方法類推,利用T1前的一段時間(包括T0前、(T0,T1)之間的時間)現網統計的KPI1指標,利用新產生的(T1,T2)時期預警值(X1,S1),度量預警期(T1,T2)之間的KPI1指標,產生圖1中橢圓框1、橢圓框2的網絡警示信息;利用T2前的一段時間(包括T0前、(T0,T1)、(T1,T2)之間的時間)現網統計的KPI1指標,利用新產生的(T2,T3)時期預警值(X2,S2)、度量預警期(T2,T3)之間的KPI1指標,產生圖1中橢圓框3的網絡警示信息。
對于橢圓框的網絡警示信息,運維部門可以對網絡進行性能優化和故障排查,及時避免用戶感知的下降、重要用戶產生大量投訴,甚至高端用戶的退網和轉網[1]。由此可見,KPI的預警工作意義重大,能夠對用戶感知做到盡可能“先知先覺”,從而避免在網用戶特別是高端用戶的不知不覺流失。
網絡KPI預警的理論思路是:利用無線網絡的“慣性”,對前期KPI大量樣本進行數理統計,獲取預警值,用以評測后期網絡KPI的警示區(如圖1中的橢圓框范圍)。具體的步驟包括樣本選擇、有效樣本的統計分析和預警值的警示預測三步。
(1)樣本的選擇
選取一定以往時間維度上KPI大量樣本中排除無效樣本,保證有效樣本量(以下用樣本量N表示)。理論上N值越大,預警效果越好,但工作量也隨之增大。N值的確定建議由運維工程師的經驗所得,通過多頻次的KPI預警周期后運維工程師通常會有較為權威的判斷。
(2)C2耐紋波無機酸化成箔:高壓水煮后皮膜耐壓上升、皮膜抗水合性好、漏電流小。一般化成箔在經過水煮試驗后其皮膜耐壓會下降,但這種化成箔水煮試驗后耐壓上升 (這是此類化成箔最顯著的特點)。該化成箔對電解液的適應性強,適用各型耐紋波鋁電解,皮膜損耗低,而且它在頻繁充、放電鋁電解中表現更好:發熱量小、壽命長。缺點:化成耗電量高,容量轉化率低。
(2)有效樣本的統計分析
通過統計分析算法得到預警值Y,而Y=X±S,其中X表示樣本期望值,S表示樣本波動范圍。預警值Y可以用(X,S)來表征,即表示在X值基礎上可向上或向下波動S的范圍。X、S值的計算可以選擇常規數理統計方法,下文提到的典型KPI的預警分析驗證中,X的算法選擇樣本值的加權平均算法,S的算法選擇標準差算法[2],具體如下:

式中,X代表加權均值,Xk代表樣本值,n代表樣本容量。
(3)預警值的警示預測
利用預警值Y來衡量預測時間范圍內的KPI統計值P,當P小于Y,表示網絡性能趨勢穩定正常,反之則表示網絡性能趨勢呈現惡化。
KPI預警的第一步也是關鍵步驟之一就是有效樣本的選擇。如何判定該樣本是合乎統計要求的標準樣本,其關鍵還是要具體分析這個KPI會受到哪些因素的影響。有效樣本的考慮因素主要有如下幾個方面:
(1)排除網絡上發生的特殊重大事件,比如自然災害、大型娛樂活動、重要政治經濟事件、運營商的網絡割接等。如果當前KPI所在時間網絡上發生了特殊重大事件,必然會產生KPI的重大波動,這樣的KPI樣本就不合乎統計要求;
(3)結合其它KPI聯合排除個別無效樣本。被預警的KPI,可能與其它一個或多個KPI產生相關或互斥的邏輯關系,這些存在邏輯關系的KPI對有效樣本的選擇也提供了參考。例如無線網絡的語音掉話率與當前區域的話務總量密切相關,在掉話率呈現較高統計值而當天話務總量極少的情況下,運維工程師需要具體分析是否是話務量驟減引起的掉話率統計值的升高;
(4)排除明顯的無效樣本。在實際網絡運維工作中,可能由于樣本的不準確性導致KPI值明顯無效。在下文提及的典型KPI預警分析驗證過程中,筆者就發現一些明顯無效的樣本。例如當“前向突發吞吐量”為0,而“數據業務掉線率”為4.7%的情況出現,出于前向突發吞吐量與分組業務掉線率密切相關的考慮,可以很肯定地排除該無效樣本。
KPI預警的時間維度的考慮包括兩方面,一是用于預警的樣本量的時間區間,取決于有效樣本量N的大小,以及有效樣本的實際選擇原則;二是預警期的時間區間,如圖1中示意的(T0,T1)時期,預警期的時間區間可以考慮以月、周、日多個不同的維度,即利用預警值Y可驗證未來一個月、一周、一天的KPI指標,對于不同的KPI,建議預警期的時間區間考慮不同的時間維度,比如下文提到的典型KPI預算分析驗證案例中,語音掉話率考慮的維度以周為宜,而前向突發吞吐量考慮的維度以日為宜。
通常運營商關注的網絡性能的KPI不止一個,因此KPI預警應該涉及到多個關鍵KPI。以語音業務為例,語音掉話率[3]是運維部門考核的重點KPI之一,而對于數據業務而言,業務信道的前反向突發吞吐量(或理解為上下行數據業務量)也是關鍵的網絡KPI。本節以“語音掉話率”和“前向突發吞吐量”[4]為例來驗證KPI預警分析方法的應用效果。
如圖2所示,以某地區某BSC系統忙時掉話率為具體KPI樣本,樣本量的時間區間考慮為2個月內(即2010年5月到6月),可以考慮更大的時間區間。預警值算法采用Y=X+S。第一次預警選取5月份第二周至7月份第一周有效樣本計算出期望值X為0.38%,樣本標準差S為0.03%,得到預警值Y為0.41%,度量7月份第二周工作日每天系統忙時掉話率指標,可見該周前6天在預警值范圍內波動,屬于正常范疇,網絡運行正常,只有一天掉話率超出預警值約0.08%,需要警示運維部門采取相應監測和優化手段給予關注。

圖2 掉話率預警(第一次)Fig.2 The early warning of loss rate(the first time)
而對于7月份第二周采取第二次預警,如圖3所示。5月份第三周至7月份第二周有效樣本計算出期望值X為0.39%,樣本標準差S為0.03%,得到預警值Y為0.42%,度量7月份第三周工作日每日系統忙時掉話率指標,圖3表明該KPI連續幾天有逐漸上升趨勢并導致掉話率超出了預警范圍??梢妰纱晤A警效果很相似,能夠反映一周內網絡的“慣性”特征。

圖3 掉話率預警(第二次)Fig.3 The early warning of loss rate(the second time)
通過遞歸式的多頻次預警分析可見,以周為維度的預警期內運維部門需要在一周以內前半段(上升期)采取相應措施應對后半段KPI超出預警范圍現象的發生。
如圖4所示,以某地區某BSC系統忙時前向突發吞吐量(單位kbit/s)為具體KPI樣本,樣本量的時間區間考慮為1個月內(即2010年7月),可以考慮更大的時間區間。預警值算法采用Y=X-S。

圖4 前向突發吞吐量預警(第一次)Fig.4 The early warning of forward burst throughput(the first time)
第一次預警(如圖4所示)選取7月12日到30日的有效樣本計算出期望值X為868.45 kbit/s,樣本標準差S為29.89 kbit/s,得到預警值Y為838.57 kbit/s,度量8月2日系統忙時前向突發吞吐率高于預警值,網絡運行正常。
第二次預警(如圖5所示)選取7月13日到8月2日的有效樣本計算出期望值X為864.14 kbit/s,樣本標準差S為26.41 kbit/s,得到預警值Y為837.73 kbit/s,度量8月3日系統忙時前向突發吞吐率低于預警值16~26 kbit/s,需要運維部門盡早關注網絡運行趨勢。

圖5 前向突發吞吐量預警(第二次)Fig.5 The early warning of forward burst throughput(the second time)
第三次預警(如圖6所示)選取7月14日到8月3日的有效樣本計算出期望值X為859.94 kbit/s,樣本標準差S為28.55 kbit/s,得到預警值Y為831.38 kbit/s,度量8月4日系統忙時前向突發吞吐率高于預警值,網絡運行正常。

圖6 前向突發吞吐量預警(第三次)Fig.6 The early warning of forward burst throughput(the third time)
以此類推,通過對8月份逐日指標預警,發現8月網絡運行趨勢基本平穩,偶然出現的超出預警現象(如8月3日情況)與當時網絡中用戶行為有一定關聯。
根據上述預警方法的研究及驗證,運維部門可以自主開發關鍵指標預警分析工具,用于KPI預警工作。由于不同運營商、不同的設備商對于各種關鍵KPI的定義和統計方法有所差異,該預警分析工具的開發實現達到統一標準存在一定的難度,建議運營商根據自身情況進行定制性開發,以滿足自身運維部門實際的運行維護和網絡優化工作需要。隨著移動通信市場競爭的日益加劇,移動網絡運營商的運維壓力也備增。移動網絡預警工作已經被大多國內外運營商關注并付諸實施,預計隨著運營商對這項工作的實施力度與范圍的逐步提升和擴大,業界將會出現更多的預警分析算法。多種預警分析算法的靈活應用,無疑將為運營商的最終運維目標提供有力的技術參考。
[1] 孔令萍,易學明,王燕川,等.第三代移動通信網絡管理[M].北京:人民郵電出版社,2010:131-143.
KONG Ling-ping,YI Xue-ming,WANG Yan-chuan,et al.The management of 3G mobile communication network[M].Beijing:People′s Post and Telecommunication Press,2010:131-143.(in Chinese)
[2] 盛驟,謝式千,潘承毅.概率論與數理統計[M].北京:高等教育出版社,2008:55-105.
SHENG Zhou,XIE Shi-qian,PAN Cheng-yi.Probablity and Statistics[M].Beijing:Higher Education Press,2008:55-105.(in Chinese)
[3] 張艷超,高澤華.移動網絡中數據業務關鍵性能指標KPI探討[J].通信技術,2009,42(10):211-215.
ZHANG Yan-chao,GAO Ze-hua.Discussion of Key Performance Indicators for Data Services in Mobile Network[J].Telecommunication Technology,2009,42(10):211-215.(in Chinese)
[4] 張傳福.CD MA移動通信網絡規劃設計與優化[M].北京:人民郵電出版社,2006:140-150.
ZHANG Chuan-fu.The planning and optimization of CDMA mobile communication network[M].Beijing:People′s Post and T elecommunication Press,2006:140-150.(in Chinese)
Early Warning Method and Im provement of Key Performance Indicators in Operation and Management of Mobile Network
YANGYan
(Beijing Research Institute,China Telecom Corporation Limited,Beijing 100035,China)
According to the analysis of the significance of early warning of key performance indicators(KPIs),an early warning method for mobile network is proposed,and the improvement of two typical KPIs for the current network is explained in detail,which is hellpfu l to enhance the efficiency of operation and management of mobile network for network operators.
mobile network;operation and management;early warning;KPI
TN929.5
A
10.3969/j.issn.1001-893x.2011.02.015
1001-893X(2011)02-0075-05
2010-10-18;
2010-12-01
楊 燕(1976-),女,湖北孝感人,2000年于華中科技大學獲工學碩士學位,現為高級工程師,主要從事移動通信技術研究和網絡規劃工作。
YANG Yan was born in Xiaogan,Hubei Province,in 1976.She
the M.S.degree from Huazhong University of Science and Technology in 2000.She is now a senior engineer.Her research concerns mobile communication technology and network planning.
Email:yangyan@ctbri.com.cn