魏 伍,張更新,呂 晶,楊晗竹
(解放軍理工大學 通信工程學院,江蘇 南京 210007)
一種用于衛星網絡的業務預測方法*
魏 伍,張更新,呂 晶,楊晗竹
(解放軍理工大學 通信工程學院,江蘇 南京 210007)
針對衛星網絡業務具有自相似的特點,介紹了一種基于集合經驗模式分解的業務組合預測方法(EEMD)。該方法利用EEMD的分解特性,將具有自相似的網絡流量分解成多個只具備短相關性的本征模態函數(IMF),這樣便可使用傳統的流量預測算法進行預測。文中使用人工神經網絡與自回歸滑動平均模型(ARMA)這兩種方法進行預測。最后將多個本征模態函數(IMF)預測的結果相加作為原始信號的預測結果,實驗證明此方法有更高的精度。為了迎合衛星實時性的需求,給出了硬件的框架,該框架采用DSP與FPGA相結合的構架實現連續數據的EEMD實時處理。
集合經驗模式分解;本征模態函數;人工神經網絡;ARMA
隨著衛星技術的發展和日益增長的客戶需求,衛星通信系統不僅承載低速的數據及話音(64kb/s以下)而且需要支持圖像、聲音、視頻相結合的全新、高速率、交互式的寬帶多媒體業務,在此也稱為衛星寬帶多媒體業務。面對有限的衛星帶寬資源,如何對系統進行高效地管理,成為衛星通信系統研究領域的首要問題。
1994年,Leland發現網絡流量數據呈現出的特性與以往電話網絡流量數據具有非常大的差異,稱之為自相似特性[1]。研究表明,自相似性不僅出現在因特網中,Ad hoc網絡與衛星通信系統中都有此特性。自相似性包含了短程相關性與長程相關性。而傳統的預測方法例如,泊松過程,自回歸滑動平均模型(ARMA)[2],自回歸積分滑動平均模型(ARIMA)[3]和卡爾曼濾波[4]等都是短程相關模型。因此,當這些模型被用于自相似性網絡流量預測時,預測誤差會較大。
針對網絡流量的自相似性,近年來取得了顯著的研究成果,一般分為四類:①基于時間序列的預測,如分數差分自回歸求和滑動平均模型(FARIMA)[5],但基于時間序列的模型都是線性模型,所以在預測非線性、不確定性的業務流量時,模型性能變差,在每次計算時都要調整權值,因此計算量過大,預測結果有時要延遲幾個時間段。②基于神經網絡的預測(ANN)[6],主要有BP神經網絡,RBF神經網絡以及模糊神經網絡等。其運用領域廣泛,非線性函數擬合的效果較好。③基于混沌理論的預測,目前基于混沌理論的預測都只處于嘗試階段,并且對混沌現象的本質了解的還不夠徹底。其計算過程還比較復雜,預測的可靠性和精度還無法保證。④組合預測,是指把不同的數據處理及預測方法結合起來,綜合利用各自的優勢,以合理的方式得出組合預測模型和最佳預測結果,從而達到提高預測精度和增加預測可靠性的效果。目前流量預測領域最主要的三類組合預測方法包括:基于神經網絡的組合預測方法,基于小波理論的組合預測方法以及基于支持向量機理論的組合預測方法以及基于集合經驗模式分解(EEMD)的組合預測方法。這些方法的關鍵在于將自相似流量數據轉化為短相關數據,這樣就可以用傳統的方式進行預測了。
其中,EEMD的組合預測方法可以將自相似流量數據分解成若干路窄帶本征模態函數(IMF),并驗證了IMF是短相關的,從而減少了模型的復雜度,由于每路IMF特性有所不同,對此本文提出了一種結合ANN與ARMA的IMF預測方法。
1.1 互補集合經驗模式分解(CEEMD)

(1)

(2)
(3)

接著對原始數據以及CEEMD處理得到的IMF1-3采用R/S進行分析。從圖1,圖2,圖3中可知,原始數據的R/S圖基本為一條直線,得到的斜率即為Hurst參數為0.83,說明原始信號確實具有自相似性(Hurst>0.5,說明序列有自相似性)。而IMF1的R/S圖的數據點已經開始出現離散的情況,且Hurst值分別為0.42。IMF2-3的曲線已不是直線,所以雖然其Hurst值較大,其結果也不具有參考意義。從R/S圖呈現的非直線特性及求得的Hurst值大小,可知這三路IMF中不具有明顯的自相似特性。

圖1 原始流量數據

圖2 IMF1-9的數據

(a)Traffic Data

(b)IMF1

(c)IMF2

(d)IMF3
1.2 廣義回歸神經網絡(GRNN)
廣義回歸神經網絡(GRNN)在1991年由一個學者Donald F.Specht提出。GRNN是徑向基函數(RBF)神經網絡的一種,有著強大的非線性映射能力,適合處理多種非線性問題,并在擬合與學習能力方便強于RBFNN。與BP神經網絡相比,GRNN不僅運算速度快,且在函數逼近能力和學習速度上均具有較強的優勢,可更快地找到合適地預測網絡,但spread因子的選取對GRNN預測地精度有較大影響,網絡的訓練過程實際上是優化平滑參數spread的過程。通過改變 spread,從而調整隱含層的傳遞函數,來獲得最佳的回歸 估計結果。如果 spread 取值不合適,GRNN 就無法達到預期的訓練效果。為獲得理想的 spread,使預測模 型具有良好的推廣能力,采用果蠅優化算[7]法對 GRNN 模型中的平滑參數進行優化。由于果蠅算法[9]有局部最優的問題,這里進行了一些改進,步驟為:1)隨機初始果蠅群體位置;2)附與果蠅個體利用嗅覺搜尋食物之隨機方向與距離;3)由于無法得知食物位置,因此先估計與原點之距離(Dist),再計算味道濃度判定值(S),此值為距離之倒數;4)味道濃度判定值(S)代入味道濃度判定函數(或稱為Fitness function)以求出該果蠅個體位置的味道濃度(Smelli);5)找出此果蠅群體的中味道濃度最高的果蠅(求極大值);6)保留最佳味道濃度值與x、y坐標,此時果蠅群體利用視覺往該位置飛去。為了增加種群的多樣性,每只果蠅移動的范圍不斷擴大,使得移動出局部極值的概率增加;7)重復前6步。
1.3 自回歸滑動平均模型(ARMA)
由于IMF3之后的各路IMF較為平緩,所以可以使用傳統的IMF進行預測。而后的模型可以在分解時改變EEMD的分解規則,只分出3路,而后進行預測。
下面是ARMA(p, q)模型的數學形式,即:
(5)

目前ARMA模型作為一種經典的線性預測模型,其訓練算法已較為成熟。
測試使用了上文所述的BC-pOct89中800點樣本數據作為實驗數據。具體實施時,首先通過CEEMD對所有800點數據進行分解。之后分別對IMF1采用GRNN模型,IMF2-IMF9采用ARMA模型進行建模,如圖8所示。且利用分解結果中的前600點數據作為訓練數據,后200點數據作為測試數據。之前由于數據過大,測試結果的評價采用如公式所示的誤差度量形式:
(6)


圖4 IMF1-GRNN預測

圖5 IMF2-ARMA預測

圖6 IMF3-ARMA預測

圖7 GRNN-ARMA預測

IMFnMSEIMFnMSEIMF1(GRNN)3.71×10-3IMF1(ARMA)9.72×10-3IMF25.57×10-4IMF31.03×10-6IMF45.89×10-8IMF51.89×10-5IMF63.02×10-5IMF71.23×10-4IMF81.09×10-10IMF91.12×10-9IMF3-91.72×10-4——

表2 不同方法的預測結果(MSE)
從圖5,圖6,圖7,表1,表2中,我們知道GRNN的精度高于ARMA。由總體的流量,ARMA與GRNN的仿真結果比單一的方法精度更高。為了迎合衛星實時性的需求,我們給出了硬件的框架見圖8,該框架參考了Lee等人[10]提出了采用DSP與FPGA相結合的構架實現連續數據的EMD實時處理。Lee等人通過DSP構建了EMD專用處理器,實現對數據的高速處理。此外,利用FPGA實現管道和數據的傳輸控制,從而實現了數據的并行處理,提升了數據處理效率。具體的預測步驟是:首先通過EEMD對一段訓練數據進行分析,從而分解得到的3路IMF訓練相應的ANN和ARMA模型。之后基于該模型對下一時刻的流量數據進行預測。當下一時刻數據到來時,更新EEMD分解數據,并重復以上步驟。此外,預測過程中還將實時監測預測誤差情況,并借鑒信號跟蹤中跟蹤丟失判斷思想,采用當預測誤差連續出現5次高于門限誤差ethresh時,則認為流量狀況發生明顯變化,需要重新對預測模型進行訓練。

圖8 基于CEEMD流量預測的實時實現流程
文章對自相似流量預測進行了分析和研究。通過EEMD算法對原始數據進行分解,得到若干路IMF分量。經過理論證明,自相似流量經過EEMD分解后,各IMF分量呈現短相關性。由于分解后的IMF波動性依然較大,分別運用了GRNN與ARMA模型,并且在選取GRNN模型參數時運用了果蠅優化算,實驗證明,單一的神經網絡與ARMA模型精度低于組合算法。而在實時性方面也有理論性的支持,在接下來的研究中,需要進一步進行工程實踐。
[1] Ilow J, Leung H. Self-Similar Texture Modeling using FARIMA Processes with Applications to Satellite Images [J]. IEEE Trans on Image Processing, pp.792-797,2001.
[2] BoxGEP, Jenkins G M, Reinsel G C. Time Series Analysis: Forecasting and Control. Upper Saddle River, [M] NJ: Prentice-Hall, 1994.
[3] YU Guo-qiang, ZHANG Chang-shui. Switching ARIMA Model based Forecasting for Traffic Flow [C]. Proc of ICASSP, 2004.
[4] Yantai S, J Zhi-gang, Z Lian-fang, Traffic Prediction using FARIMA Models[M]. Proc of ICC, 1999.
[5] Kolarov A, Atai A, Hui J. Application of Kalman Filter in High-Speed Networks[C]. Proc of Globecom,1994.
[6] 馬容生.基于自適應神經網絡的 P2P 流量檢測研究[J]. 通信技術,2012, 45(06):113-120.
MA Rong-sheng. Study on P2P Stream Detection based on Auto-Adapted Neural Network[J], Communications Technology,Vol.45,No.06,2012, pp113-120.
[7] WU Zhao-hua and Norden E Huang. Ensemble Empirical Mode Decomposition: A Noise-Assisted Data Analysis Method[C]. Proceedings of the First International Conference on the Advance of Hilbert-Huang Transform and Its Applications, National Central University,Taiwan,2006.
[8] Yeh J R,Shieh J S and Huang N E. Complementary Ensemble Empirical Mode Decomposition: A Novel Noise Enhanced Data Analysis Method[J]. Advances in Adaptive Data Analysis, vol. 2, Issue 2, pp. 135-156, 2010.
[9] PAN Wen-tao. A New Fruit Fly Optimization Algorithm: Taking the Financial Distress Model as an Example. Knowledge-based Systems[C], (In Press), 2011, (SCI).
[10] Lee M, Shyu K, Lee P. Hardware Implementation of EMD using DSP and FPGA for Online Signal Processing [J]. IEEE Trans on Industrial Electronics, 2011, 58(6): 2473-2481.
Traffic Prediction Method for Satellite Network
WEI Wu,ZHANG Geng-xin,LV Jing,YANG Han-zhu
(College of Communication Engineering, PLA University of Science and Technology,Nanjing Jiangsu 210007, China)
For the self-similarity of satellite network traffic, a novel business portfolio prediction method based on EEMD (Ensemble Empirical Mode Decomposition) is proposed. This method uses the decomposition characteristic of EEMD to divide self-similar network traffic into multiple IMF (Intrinsic Mode Function) components merely with short dependence, so that traditional methods could be applied to the prediction. In the experiment, artificial neural networks and ARMA model are used to do the prediction. Finally,the summation of all IMFs perdition data is taken as the prediction result of original signal, and experiment verifies that this method could enjoy fairly high accuracy. In order to cater for real-time requirement of satellite network, the hardware framework is also proposed. This framework uses a combined architecture of DSP and FPGA to achieve EEMD real-time processing of continuous data.
EEMD; IMF; artificial neural networks; ARMA
10.3969/j.issn.1002-0802.2015.11.016
2015-06-09;
2015-09-12 Received date:2015-06-09;Revised date:2015-09-12
國家自然科學基金(No. 91338201)
Foundation Item:National Natural Science Foundation of China(No. 9133201)
TN927
A
1002-0802(2015)11-1285-05

魏 伍(1991—),男,碩士研究生,主要研究方向為衛星通信;
張更新(1967—),男,教授,主要研究方向為衛星通信,衛星導航,衛星測控;
呂 晶(1965—)男,教授,主要研究方向為衛星通信,衛星導航,衛星測控;
楊晗竹(1991—),女,碩士研究生,主要研究方向為衛星導航。