黃海,周靈
(1.廣東第二師范學院,廣州510000;2.佛山科學技術(shù)學院計算機系,佛山528000)
基于曲線擬合的分組域業(yè)務分析模型及算法實現(xiàn)
黃海1,周靈2
(1.廣東第二師范學院,廣州510000;2.佛山科學技術(shù)學院計算機系,佛山528000)
對電信移動網(wǎng)絡(luò)而言,分組域業(yè)務分析模型及算法研究是一個嶄新的領(lǐng)域?;谇€擬合研究分組域業(yè)務分析預測模型;并進行算法設(shè)計與實現(xiàn)。同時,利用移動分組域監(jiān)控系統(tǒng)的實時測量數(shù)據(jù),實現(xiàn)分組域業(yè)務分析預測原型,進行3G用戶激活附著比、Gn口流量統(tǒng)計的分析和預測。結(jié)果表明,利用曲線擬合進行移動分組域的業(yè)務分析正確且有效。
分組域;曲線擬合;業(yè)務分析;實驗測量;算法模型
隨著移動通信新業(yè)務和IP技術(shù)的迅猛發(fā)展,數(shù)據(jù)通信和多媒業(yè)務在GSM移動通信中日益增多,甚至超過傳統(tǒng)的語音話務量而成為移動通信網(wǎng)的主要承載業(yè)務。因此,國際通信標準化組織對電信移動通信網(wǎng)進行了擴展,在傳統(tǒng)電路域(Circuit Switch,CS)的基礎(chǔ)上引入了GPRS、EPC分組域(Packet Switch,PS)。相對CS域而言,GPRS分組交換實現(xiàn)了同一信道由幾個用戶共享,極大地提高了無線資源的利用率,數(shù)據(jù)通信可以實時在線并按流量計費;EPC系統(tǒng)則以GPRS分組交換技術(shù)為基礎(chǔ)進一步演化而來,定位于構(gòu)建高速率、低延遲、數(shù)據(jù)PS化、可移植、支持多種無線接入技術(shù)的3G移動通信系統(tǒng)新標準[1]。就體系結(jié)構(gòu)而言,移動通信PS域包括2G/3G/4G分組域和EPC(LTE核心網(wǎng))兩個部分;其中,2G/3G/4G分組域網(wǎng)元包括:服務GPRS支持節(jié)點SGSN、網(wǎng)關(guān)GPRS支持節(jié)點GGSN、HLR、CG;EPC分組域的網(wǎng)元包括:MME、SAE-GW、PCRF、CG等。
傳統(tǒng)GSM通信系統(tǒng)的業(yè)務分析離不開話務模型,設(shè)立話務模型的目的是統(tǒng)計、分析并預測話務量的現(xiàn)狀和發(fā)展,進而進行相關(guān)容量等網(wǎng)絡(luò)參數(shù)規(guī)劃。PS域分組交換技術(shù)引入通信系統(tǒng)之后,“話務模型”概念改成“業(yè)務模型”概念,無法使用傳統(tǒng)的經(jīng)驗公式或者愛爾蘭查表法來確定PS域的業(yè)務量、設(shè)備容量和通信業(yè)務QoS之間的關(guān)系[2]。現(xiàn)有PS域業(yè)務模型的建模與規(guī)劃,主要是通過實驗室數(shù)據(jù),并結(jié)合國內(nèi)外運營商經(jīng)驗,確定用戶業(yè)務模型關(guān)鍵參數(shù),基本上是基于用戶的模型,主要包括用戶附著激活比、同時使用業(yè)務用戶比例、每使用業(yè)務用戶平均流量、用戶平均數(shù)據(jù)包長等;與設(shè)備性能和接口流量無關(guān)。因此,分組域業(yè)務分析模型的建立與算法實現(xiàn)屬于嶄新的研究領(lǐng)域,沒有成熟的方法和模式,這些新情況、新問題尚待研究。
本文基于曲線擬合研究了PS域業(yè)務分析預測模型;并進行算法設(shè)計和軟件系統(tǒng)開發(fā);同時,利用移動PS域監(jiān)控系統(tǒng)的實時測量數(shù)據(jù),實現(xiàn)PS域業(yè)務分析預測系統(tǒng)的原型;并對特定網(wǎng)元的3G用戶激活附著比、Gn口流量統(tǒng)計進行了分析預測。
業(yè)務分析是PS域網(wǎng)絡(luò)分析的重要組成部分。數(shù)學方面的分析預測方法有很多,進行數(shù)據(jù)分析預測應該根據(jù)應用的不同領(lǐng)域,還要根據(jù)當時的實際情況和不同的分析預測要求,在合理分析的基礎(chǔ)上選擇合適的分析預測模型;同時,還有充分考慮各種外圍因素對預測效果的影響。曲線擬合通過建立一個自變量(例如預測對象)與相關(guān)隨機變量(例如時間變量)的回歸分析模型,來分析預測相關(guān)隨機變量的未來值。如根據(jù)歷史數(shù)據(jù)的觀察與初步分析,尋求某兩個變量之間的合理關(guān)系,進而對未來的趨勢和數(shù)據(jù)進行預測[3]。
定義1給定數(shù)據(jù)點(xi,yi)(i=0,1,2,3,…,m),存在函數(shù)(φ為多項式函數(shù)類),使得:

則函數(shù)Pn(x)為擬合函數(shù)。當擬合函數(shù)為多項式時,稱為多項式曲線擬合。
下面,我們將曲線擬合引入到移動PS域業(yè)務分析預測模型中,并進行業(yè)務數(shù)據(jù)預測。假設(shè)有實驗數(shù)據(jù)系列(xi,yi),計算曲線擬合多項式函數(shù)時,可以先寫出正規(guī)方程組,再求解多項式系數(shù)序列(a1,a2,…,an),從而得出多項式函數(shù)。正規(guī)方程組可以用矩陣形式表示如下:

根據(jù)移動PS域監(jiān)控系統(tǒng)的實時測量數(shù)據(jù),可以從后臺的網(wǎng)管系統(tǒng)中獲取一段時間內(nèi)(例如1×24小時、7×24小時、1個月甚至1年內(nèi))的實驗測量數(shù)據(jù),記為:(xi,yi)(i=1,2,3,…,m),xi、yi表示任意一次的實驗數(shù)據(jù),m為實驗次數(shù),即樣本容量。利用這些數(shù)據(jù),根據(jù)曲線擬合的多項式最優(yōu)解原理,可以計算擬合多項式的系數(shù)序列(a0,a1,a2,…,an)。
例如,假設(shè)一次擬合函數(shù)如下:

其中Y是預測對象,x是主要影響因素,a0、a1為回歸常數(shù),ε為回歸余項,ε∝N(0,σ2);對矩陣正規(guī)方程進行化簡,得到兩個以a0、a1為參數(shù)的方程:


求解這個方程組可得系數(shù)a0、a1,表示如下:

下面給出算法設(shè)計與實現(xiàn)的主要內(nèi)容,包括數(shù)據(jù)輸入、輸出、算法主要步驟以及算法實現(xiàn)的數(shù)據(jù)結(jié)構(gòu)等關(guān)鍵問題。
輸入:實驗數(shù)據(jù)(xi,yi)(i=1,2,3,…,m),指定時間xi+1,xi+2,xi+3等;
輸出:根據(jù)指定的時間值輸出對應的預測數(shù)據(jù)yi+1,yi+2,yi+3等。
主要步驟如下:
步驟1:采集網(wǎng)絡(luò)測量數(shù)據(jù)。包括附著用戶數(shù)、激活用戶數(shù)、Gn/Gi/GB/IuPS口流量、防火墻會話數(shù)等分組域系統(tǒng)運行的關(guān)鍵參數(shù),以小時為粒度,從后臺網(wǎng)管系統(tǒng)進行數(shù)據(jù)采集;
步驟2:數(shù)據(jù)預處理。將步驟1提取出的各關(guān)鍵參數(shù)對應的統(tǒng)計數(shù)據(jù)分別按時間先后順序分別組成n個時間序列,并對時間序列進行異常數(shù)據(jù)、噪聲點識別消除;
步驟3:獲取預測所需的測量數(shù)據(jù)。從預處理后的數(shù)據(jù)表中獲取預測所需的歷史測量數(shù)據(jù):(xi,yi)(i= 1,2,3,…,m);
步驟5:求解系數(shù)系列(a1,a2,…,an)。相對一次擬合而言,即求解a0、a1:

步驟6:計算確定擬合函數(shù)。根據(jù)步驟5計算的a0、a1,確定擬合函數(shù)Y=a0+a1x;
步驟7:進行數(shù)據(jù)預測。根據(jù)指定的xi+1,xi+2,xi+3等計算對應的預測值yi+1,yi+2,yi+3等。
步驟8:進行網(wǎng)絡(luò)容量預測,并分析網(wǎng)絡(luò)壓力點。若達到網(wǎng)絡(luò)壓力點,啟動相應設(shè)備擴容。
算法的實現(xiàn)涉及到一些軟件系統(tǒng)設(shè)計與工程方面的問題,有的是軟件系統(tǒng)開發(fā)方面的共性問題,在此不討論;有一些是本PS域業(yè)務分析和預測算法設(shè)計特有的問題,主要有三個方面。
關(guān)于網(wǎng)絡(luò)測量數(shù)據(jù)的處理。獲取的歷史測量數(shù)據(jù)為原始的網(wǎng)管數(shù)據(jù)集,導入到數(shù)據(jù)庫中,按照系統(tǒng)功能需求,設(shè)計多個表,保存在數(shù)據(jù)庫表中。不用按大小排序,只需按時間順序保存即可,并進行數(shù)據(jù)預處理。
關(guān)于數(shù)據(jù)分析和預測的呈現(xiàn)方式,有兩種情況。一是每天只預測業(yè)務量忙時的最大值;另一種是按照樣本數(shù)據(jù)每小時進行一次預測,按照相同時間點的數(shù)據(jù)系列進行預測,數(shù)據(jù)誤差相對較小。再從數(shù)據(jù)庫或者變量中讀取數(shù)據(jù),在坐標區(qū)域用曲線標示[4]。
從移動分組網(wǎng)監(jiān)控系統(tǒng)獲得的PS域業(yè)務數(shù)據(jù),因為個體數(shù)據(jù)的敏感性,只獲取兩天的統(tǒng)計數(shù)據(jù),且僅供本PS域網(wǎng)絡(luò)分析預測研究使用[5]。從網(wǎng)管系統(tǒng)獲得的歷史數(shù)據(jù)內(nèi)容和存儲方式比較繁雜,經(jīng)處理后主要包括:測量時間、網(wǎng)元名稱、3G用戶附著數(shù)、3G用戶激活數(shù)、Gn口流量、GB口流量等。
以Java為開發(fā)語言,使用SQL Server作為后臺數(shù)據(jù)庫,實現(xiàn)了曲線擬合業(yè)務模型和算法。利用這個原型系統(tǒng)對PS域業(yè)務進行分析預測,主要進行了SGSN網(wǎng)元的3G用戶激活附著比、Gn口流量統(tǒng)計兩個方面的分析,具體實驗結(jié)果如圖1、圖2所示。繪制的曲線圖是PS域3天的網(wǎng)絡(luò)分析數(shù)據(jù)(用紅色虛線分開表示),橫坐標的前兩天(2×24小時)為歷史數(shù)據(jù)分析,第三天(1×24小時)為未來數(shù)據(jù)預測。
從圖1可以看出,3G用戶激活附著比符合移動網(wǎng)絡(luò)PS域的歷史實際情況。在每天的凌晨3-5時為最小值,白天10-18時比較穩(wěn)定,為全天的最大值;函數(shù)值全天在0.25-0.4之間變化,忙閑時規(guī)律明顯,并根據(jù)前兩天的歷史測量數(shù)據(jù)預測了的第三天的3G用戶激活附著比業(yè)務量。對于Gn口的流量統(tǒng)計,可以從圖2進行類似分析。

圖1 3G用戶激活附著比圖

圖2 Gn口流量統(tǒng)計圖
本文研究了基于曲線擬合的PS域業(yè)務分析及預測模型;并進行了算法設(shè)計和軟件系統(tǒng)開發(fā)。同時,利用移動PS域監(jiān)控系統(tǒng)的實時測量數(shù)據(jù),實現(xiàn)了PS域業(yè)務分析預測系統(tǒng)的原型,進行了3G用戶激活附著比、Gn口流量統(tǒng)計的分析和預測。結(jié)果表明,利用曲線擬合進行PS域移動通信業(yè)務的分析與預測是有效的,應該進一步研究和在線實驗測試。
[1]TS 23.401.General Packet Group Service(GPRS)Enhancements for Evolved Universal Terrestrial Radio Access Network(E-UTRAN)Access[S],LTE,2009,06.
[2]劉增基,鮑民權(quán),邱智亮編著.交換原理與技術(shù)[M].人民郵電出版社,2014.8.
[3]袁野,孫迪科,張榮.網(wǎng)絡(luò)融合背景下的移動分組域網(wǎng)絡(luò)負荷指標關(guān)聯(lián)模型研究[J].移動通信,2015.1.
[4]Ling Zhou,De-feng Zhang.Least Energy-Consumption Real-Time Routing Algorithm Based on Event Sensitive Node Set[J].Journal of Communications,2014,07.
[5]中國移動通信有限公司.2G/3G/4G融合核心網(wǎng)統(tǒng)一標準模型[S],2014.12.
Model and Algorithm for Capacity Analysis in Packet Switch Based on Curve Fitting
HUANG Hai1,ZHOU Ling2
(1.Guangdong University of Education,Guangzhou 510000;2.Department of Computer Science and Technology,F(xiàn)oshan University,F(xiàn)oshan 528000)
To the mobile telecommunications networks,capacity model and algorithm design for packet switch is a new research field.Studies the capacity analysis model for packet switch based on curve fitting and develops its prediction algorithm.At the same time,the prototype system for capacity analysis and data prediction is achieved by using real-time measuring data from monitoring and control system of mobile telecommunications networks.Analysis and prediction experiments are done about 3G subscriber ratio and rate of flow in Gn port. The experiment results show that it is correct and efficient to use curve fitting to design capacity model and algorithm for packet switch in mobile telecommunications networks.
Packet Switch;Curve Fitting;Capacity Analysis;Experiment;Algorithm Model
廣東省教育廳青年創(chuàng)新人才資助項目(No.2015KQNCX109)
1007-1423(2016)23-0016-04DOI:10.3969/j.issn.1007-1423.2016.23.004