999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于大數據的時間序列預測研究與應用

2016-02-27 03:52:16程艷云張守超
計算機技術與發展 2016年6期
關鍵詞:分析模型

程艷云,張守超,楊 楊

(南京郵電大學 自動化學院,江蘇 南京 210023)

基于大數據的時間序列預測研究與應用

程艷云,張守超,楊 楊

(南京郵電大學 自動化學院,江蘇 南京 210023)

針對傳統時間序列預測算法在分析海量數據時預測精度與預測速率低下的問題,提出一種全新的時間序列預測算法,研究如何將大數據技術應用到移動通信網時間序列形式的核心性能指標(KPI)預測中。文中首先介紹了移動通信網性能指標預測的意義及傳統時間序列預測算法的缺陷。其次,基于移動通信網及時間序列特性,給出了基于大數據的時間序列預測算法的理論推導過程,通過大數據方法將時間序列分解為四個不同分量并進行特征提取,根據提取結果進行預測分析。最后,介紹了方法的實現過程,采用真實網絡核心性能指標進行實驗對比分析,驗證該方法的可行性與效率。實驗結果表明,基于大數據的時間序列預測算法相比于傳統的時間序列預測算法,具有更高的預測精度、更快的預測速率。

大數據;時間序列;預測分析;移動通信

0 引 言

通信網絡中的各項核心性能指標[1](KPI)的預測分析對于通信網絡優化至關重要,而通信網絡中的各項KPI一般均以時間序列形式[2]表示。傳統的時間序列分析預測方法包括Holt-Winters[3]、ARIMA[4]、AR、MA、Vector Auto Regression、梯度回歸等。然而,傳統的通信網性能預測分析所選用的數據量很小且缺乏實時性,實驗結果的準確率也有待提高,而且隨著時間的推移,通信網絡中的數據量越來越大。到2020年,全球以電子形式存儲的數據量將達35 ZB,是2009年全球存儲量的40倍[5]。如此大的數據量,傳統的數據庫工具無法負擔,必須采用專用數據挖掘與分析工具進行分析處理。不過,盡管這些數據挖掘工具價格昂貴,挖掘效果卻仍有待提高。

因此,必須采用新的方法來解決這一問題。文中提出的基于統計模型的大數據算法分析利用真實的測量數據而不是模擬仿真數據或假設場景來研究無線網絡的預測問題。文中首先利用統計模型對海量數據進行分類處理,并進行特征提取,區分小區類別,然后采用大數據算法分析海量實時數據,并對建立的模型進行參數優化,最終得到預測模型。

1 大數據算法分析

時間序列預測算法主要包括趨勢分量預測、季節性分量預測、突發分量預測以及隨機誤差分量預測。以傳統的時間序列預測算法為例,Holt-Winters算法中α,β,γ分別為水平項、趨勢項、周期項的平滑參數。由于α,β,γ一旦確定就不可以改變,且需要反復試驗確定最佳值,因此傳統的Holt-Winters算法對于長期大量的數據分析是不適合的[6]。而ARIMA僅在短期預測中有較好的預測結果,隨著預測時間的推遲,其預測誤差會越來越大[7],因此ARIMA對于長期數據預測是不符合要求的。文獻[8-9]對Holt-Winters進行了一些改進,文獻[10]對ARIMA進行了一些改進,但是對于海量數據的長時間預測效果,其結果仍然不符合要求,所以必須采用新的時間序列預測模型來進行預測分析。

文中提出的大數據算法采用全新的方法來對四個分量進行預測。利用海量數據的優點,將隱藏在數據背后的有效信息挖掘出來,具體推導過程如下所示:

(1)趨勢分量T(t)的預測。

將每一段的起始無線網絡話務量歷史數據Xk和斜率Slopek擬合為一條直線,每個擬合線間首尾連續,將無線網絡話務量歷史數據作為訓練樣本進行建模,獲得趨勢分量T(t)預測模型:

(1)

圖1展示了趨勢分量預測過程。

圖1 趨勢分量預測過程

如此一來,對于趨勢分量T(t)的預測,預測值之前數據的權重變成由歷史數據Xk和斜率Slopek決定。

(2)季節性分量S(t)的預測。

文中首先需要確認的是周期時間,通過統計分析對海量數據進行特征提取,按照式(2)進行差分運算,得到矩陣A。

(2)

對矩陣A的每一行進行線性擬合,得到不同的擬合直線Y=aX+b,其中擬合誤差最小的行數即為周期L。p表示每個周期L里的樣本數,每個q(q=1,2,…,p)位置處的季節分量可表示為p樣本中相同位置q處的數據的平均值,利用式(3)可得出季節性分量。

(3)

(3)突發分量B的預測。

突發分量B產生的原因一般是由于突發事件,比如重大節日、活動、會議等。一般情況下,突發分量具有可列舉性,即每個小區的KPI對應的突發分量B都可以用特定的類別對應特定的數值表示,如式(4):

B(t)value={Burstv1,Burstv2,…,Burstvn}

(4)

在KPI分析預測中,只需要根據小區的ID號,查找對應的突發分量B(t)帶入預測公式即可。

(4)隨機誤差分量R的預測。

在大數據預測模型中,隨機誤差分量不再是獨立分布,而是根據無線網絡話務量歷史數據減去趨勢分量、季節性分量和突發分量得到隨機誤差分量的預估值。處理的結果確保了隨機誤差分量更具有實際性。

(5)KPI預測。

預測目標KPI時,利用公式X(t)=(1+B(t))×(T(t)+S(t)+R(t))即可得到目標結果。

2 大數據算法在KPI預測中的實現

在通信網中,每個RNC下包含大量的小區(一般為500~1 000),而每個小區的KPI又數量眾多(一般為200個)。以一年時間為周期計算,每個KPI每年數據值為17 520個,單個RNC內所有小區的一年內所有KPI總數將過億??紤]到數據量巨大,采用大數據進行的KPI預測分析,需要對小區數據進行一定的處理,具體步驟如圖2所示。

步驟1:插值處理。

在數據導入之前,需要對數據進行預處理,處理的主要工作為缺值插入。文中采用的插入方法為構建線性擬合曲線,具體做法為以缺失值前幾點、后幾點作為一個數據序列,做一個最小二乘法的線性回歸[11],將對應缺失的這點代入線性回歸方程,得出缺失點的值。

圖2 大數據預測模型流程圖

步驟2:小區分類。

對所有小區進行分類處理,將所有小區的忙時進行特征提取,得到不同忙時的特征,區分出不同類別的小區,然后再對每種類型的小區進行分析預測。小區類別事先未知,文中采用統計方法,將所有RNC下所有小區的一天KPI特性進行統計分析,得到不同時間分布的忙時,從而得到不同類別的小區。

步驟3:異常值排除。

對于每種類型數據,取可信度95%,其邊界為u-2σ和u+2σ,來排除異常值。如果時間序列不符合正態分布,則不能通過測試,此時應該采用其他方法來排除異常值。

步驟4:預測分析。

排除異常值之后,根據特征提取結果確定一維周期值[12-13],利用大數據算法分別進行趨勢分量預測、季節性分量預測、突發分量預測及隨機誤差分量預測。

步驟5:結果判定。

對于分別預測得到的趨勢分量、季節性分量、突發分量以及隨機誤差分量,通過公式X(t)=(1+B(t))×(T(t)+S(t)+R(t))得到最終預測值,判別與真實值之間誤差是否在可接受范圍內,若是,則模型建立成功,若否,返回修改模型參數。

3 實驗結果

以通信網絡中某一性能指標(RRC設置成功率)為例。首先任取某一小區,采用不用方法分別對該小區的RRC設置成功率進行長期預測和短期預測,并對結果進行對比分析;其次,對RNC內所有小區進行預測,并對結果進行分析比較。

首先對所有RNC內的小區進行分類處理,根據忙時不同特征分布可以區分得到7種不同類型的小區。選取某一類型小區的某一小區連續30天數據為初始數據集,分別采用不同算法預測不同長度值。先進行周期特征提取,按照式(2)得到矩陣A,并對A的每行數據進行線性擬合。對于每條擬合直線,采用最小二乘法計算誤差,通過計算得到當L=48時,誤差最小,即周期為48。

圖3展示了Bigdata算法對應不同周期L的預測結果。其中點代表預測值,線條代表真實值走勢,虛線表示初始值與預測值分界線。

圖3 Bigdata算法對應不同周期L的預測結果

圖4展示了RRC設置成功率的實際值與Holt-Winters算法、ARIMA算法以及基于大數據算法的預測值對比結果。顯而易見,基于大數據算法的預測結果與實際值具有很大的重合性。

圖4 單小區RRC設置成功率預測結果對比圖

通過統計計算可以得到,在大數據預測模型中,初始數據預測的平均絕對百分比精度[14](誤差結果在1%以內)是95.28%,預測結果平均絕對百分比精度是90.47%。相比于Holt-Winters算法、ARIMA算法的78.28%和70.1%均有很大提高。

表1展示了Bigdata算法、Holt-Winters算法和ARIMA算法三者在長/短期初始數據預測與結果預測精度對比。

通過表中數據可以得到,基于大數據的方法在長期預測跟短期預測的精度差距很小,尤其在預測結果精度方面,而基于Holt-Winters方法和ARIMA方法的預測在長期跟短期結果出現大幅度的下降,即基于大數據方法相比于Holt-Winters方法和ARIMA方法更加適用于長期的時間序列預測。此外,短期預測中三種方法所需時間均在20s內,但是在長期大量數據預測時,基于大數據的方法所需時間僅為另外兩種方法的一半,約為100s。

表1 不同方法對應長/短期預測結果對比 %

同樣選取商業型小區的某一RNC級別內所有小區(共計478),預測某天(周一)忙時(晚上8點)所有小區的性能指標值。圖5展示了RNC內所有小區的實際值與預測值對比,其中點代表預測,線條代表真實值走勢。

圖5 RNC級小區RRC預測值對比圖

在大數據預測模型中,所有小區性能指標的預測值平均絕對百分比精度是84.66%,高于傳統方法的預測精度。

通過分析比較結果可以得出,基于大數據的預測模型的預測結果在長時間預測、大范圍預測均能滿足要求,相比于傳統的預測方法,采用大數據技術的預測模型具有更高的精度以及更快的速度。總體來說,通信網絡中的KPI都可以通過預測模型得到結果,這兩項數值都在可以接受的范圍內,并且未來還有提高的空間,尤其對于單小區的長時間預測結果精度。

4 結束語

新穎的大數據技術及其算法可以克服傳統網絡仿真中的缺點,基于統計模型的大數據算法的無線網絡性能分析將使得網絡特征、用戶特征、話務流量特征等在網絡性能分析評估中得到最準確和最真實的反應[15]。文中的大數據算法模型將使得埋藏在海量數據背后的網絡行為特征得以準確挖掘出來,從而使得傳統的網絡性能分析這一領域到達一個新的臺階。

文中僅對網絡KPI進行預測分析,對于網絡優化中的其他問題,還有待進一步的研究,包括:

(1)預測網絡話務和流量的短期—長期趨勢;

(2)基于網絡話務來推測網絡容量的變化趨勢。

中國從2013開始大規模商用TDDLTE網絡,此方法采用基于大數據的算法分析的網絡性能以及質量評估系統,采用實時數據進行預測分析,預測結果也能夠滿足需求,在未來具有很高的應用前景。

[1]RAN14.0KPI參考手冊—2版[M].出版地不詳:華為技術有限公司,2012.

[2] 林國華.時間序列分析法在移動通信數據分析中的研究與應用[D].廣州:廣州工業大學,2013.

[3]SzmitM,SzmitA.Useofholt-wintersmethodintheanalysisofnetworktraffic:casestudy[J].CommunicationsinComputer&InformationScience,2011,160:224-231.

[4]BoxGEP,JenkinsGM,ReinselGC.時間序列分析:預測與控制[M].王成璋,尤梅芳,郝 楊,譯.上海:機械工業出版社,2011.

[5] 林 丹.4G移動通信技術的現狀與發展趨勢探討[J].科技信息,2013(24):241-241.

[6]RossiM,BrunelliD.ForecastingdatacenterspowerconsumptionwiththeHolt-Wintersmethod[C]//ProcofIEEEworkshoponenvironmental,energyandstructuralmonitoringsystems.[s.l.]:IEEE,2015.

[7] 張小斐,田金方.基于ARIMA模型的短時序預測模型研究與應用[J].統計教育,2006(10):7-9.

[8] 彭帥英,李廣杰,彭 文,等.基于改進遺傳算法的Holt-Winters模型在采空沉陷預測中的應用[J].吉林大學學報:地球科學版,2013,43(2):515-520.

[9] 吳越強,吳文傳,李 飛,等.基于魯棒Holt-Winter模型的超短期配變負荷預測方法[J].電網技術,2014,38(10):2810-2815.

[10]LiC,ChiangTW.ComplexneurofuzzyARIMAforecasting—anewapproachusingcomplexfuzzysets[J].IEEETransactionsonFuzzySystems,2013,21(3):567-584.

[11] 田 垅,劉宗田.最小二乘法分段直線擬合[J].計算機科學,2012,39(6A):482-484.

[12] 段江嬌.基于模型的時間序列數據挖掘—聚類和預測相關問題研究[D].上海:復旦大學,2008.

[13] 微軟中文.大數據挖掘算法之:Microsoft決策樹算法[EB/OL].[2014-10-13].http://www.thebigdata.cn/JieJueFangAn/12096.html.

[14]ZiebarthNL,AbbottKC,IvesAR.Weakpopulationregulationinecologicaltimeseries[J].EcologyLetters,2010,13(1):21-31.

[15]WuX,ZhuX,WuGQ,etal.Dataminingwithbigdata[J].IEEETransactionsonKnowledge&DataEngineering,2014,26(1):97-107.

Research and Application of Time Series Forecasting Based on Big Data

CHENG Yan-yun,ZHANG Shou-chao,YANG Yang

(College of Automation,Nanjing University of Posts and Telecommunications,Nanjing 210023,China)

According to the detection accuracy and efficiency limitation of traditional time series forecasting methods when dealing with a large amount of data,a new time series forecasting method is put forward to study how to apply the big data technology into Key Performance Index (KPI) prediction of mobile communication network,which is form of time series.First,it introduces the significance of KPI prediction for mobile communication network and the defects of traditional time series prediction algorithm in this paper.Secondly,the theoretical derivation of time series prediction algorithm based on the big data is presented according to the characteristics of mobile communication network and time series.The time series is decomposed into four different components and the feature is extracted by the big data method,and the forecasting analysis is carried out according to the results of the extraction.Finally it gives implementation process and uses the real network KPI to carry out experimental comparative analysis for verification of the feasibility and efficiency of the big data method.The experimental results show that the big data method has higher precision and rate compared with traditional methods.

big data;time series;forecasting analysis;mobile communication

2015-06-28

2015-10-13

時間:2016-03-22

江蘇省自然科學基金(BK20140877,BE2014803)

程艷云(1979-),女,副教授,碩士生導師,從事自動控制原理、網絡優化的教學科研工作;張守超(1991-),男,碩士研究生,研究方向為大數據挖掘在通信網絡中的應用。

http://www.cnki.net/kcms/detail/61.1450.TP.20160322.1518.040.html

TN915.07

A

1673-629X(2016)06-0175-04

10.3969/j.issn.1673-629X.2016.04.039

猜你喜歡
分析模型
一半模型
隱蔽失效適航要求符合性驗證分析
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
中西醫結合治療抑郁癥100例分析
在線教育與MOOC的比較分析
主站蜘蛛池模板: 九色91在线视频| 狠狠色噜噜狠狠狠狠色综合久| 中文字幕亚洲乱码熟女1区2区| 亚洲人网站| 在线无码私拍| 成人精品免费视频| 综合久久五月天| 91小视频在线| 国产精品女同一区三区五区| 久久综合色视频| 日本精品视频一区二区| 久久久亚洲色| AV无码一区二区三区四区| 亚洲三级电影在线播放| 久久这里只精品热免费99| 中文字幕在线免费看| 操国产美女| 97se亚洲综合在线韩国专区福利| 日本福利视频网站| 日日拍夜夜嗷嗷叫国产| 71pao成人国产永久免费视频 | 高清视频一区| 国产香蕉在线视频| 国产午夜福利亚洲第一| 久久这里只有精品66| 亚洲色精品国产一区二区三区| 中国成人在线视频| 亚洲欧洲日产国码无码av喷潮| 欧美有码在线观看| 成年人国产视频| 国产91九色在线播放| a色毛片免费视频| 国产成人精品男人的天堂| 久久久久无码精品国产免费| 国产清纯在线一区二区WWW| 国产精品九九视频| 亚洲最大福利网站| 色综合久久久久8天国| 色成人亚洲| 午夜爽爽视频| 青青青草国产| 色综合中文字幕| 国产亚洲精久久久久久久91| 2019年国产精品自拍不卡| 欧美日韩国产精品综合| 国产裸舞福利在线视频合集| 国产情精品嫩草影院88av| 国产精品大尺度尺度视频| 欧美特黄一级大黄录像| 一级成人欧美一区在线观看| 在线日韩一区二区| 亚洲福利视频一区二区| 欧美中文字幕第一页线路一| 99精品伊人久久久大香线蕉| 国产在线小视频| 99久久精品免费看国产电影| 日韩欧美中文字幕一本 | 美女无遮挡免费网站| 国产区网址| 成人国产精品2021| 亚洲欧美日韩成人高清在线一区| 在线99视频| 国产人成在线观看| 欧洲欧美人成免费全部视频| 在线观看av永久| 精品国产成人a在线观看| 亚洲男人天堂久久| 99re66精品视频在线观看| 国产正在播放| 国产成人福利在线| 99久久精彩视频| 国产欧美视频在线观看| 萌白酱国产一区二区| 亚洲人精品亚洲人成在线| 中国国产A一级毛片| 日韩一级毛一欧美一国产| 国产精品成人免费视频99| 精品国产一二三区| 欧美国产日产一区二区| 内射人妻无套中出无码| 亚洲精品无码成人片在线观看 | 日韩高清成人|