單 銳,代海波,劉 文
(燕山大學 理學院,河北 秦皇島066004)
郵電業務總量是指以價值量形式表現的郵電通信企業為社會提供各類郵電通信服務的總數量.作為國民經濟的基礎性、先導性、支柱性產業,郵電業在經濟增長方式轉變和經濟結構調整中發揮著巨大的作用,對就業、收入、消費、經濟增長、產業調整、競爭力提高等宏觀經濟的關鍵因素都產生了積極影響.因此,郵電業務總量作為觀察通信業務發展變化總趨勢的綜合性總量指標,科學地對其進行預測有利于郵電部門發展規劃和政策的制定,及時解決郵電業存在的問題,對促進我國郵電業進一步發展將有著十分重要的現實意義.
郵電業務總量預測是根據通信需求發展的趨勢,科學地確定通信需求隨時間和空間發展的過程.已有許多方法用于郵電業務總量的預測:通過郵電業務總量與三大產業生產總值的關系,利用模糊推理、聚類分析或支持向量機進行預測的方法[1-3];建立灰色模型、回歸模型、ARIMA 模型或它們的組合模型進行預測的方法[4-7]. 筆者將利用極大重疊離散小波變換(MODWT)和小波神經網絡對時序數列指標值進行分析,得到最能反映數據變化的數學模型,從而對郵電業務總量進行合理預測.
設X 是N 維向量,它的元素是實值時間序列{Xt:t = 0,…,N -1},其中抽樣尺寸N 是任意的正整數,對于任意正整數J0,X 的J0層極大重疊離散小波變換是一個由J0+1 個向量,…和組成的變換,所有這些向量都是N 維的.基于極大重疊離散小波變換系數的定義有:=和J0=J0X,其中向量包含了與尺度τj=2j-1上的變化有關的極大重疊離散小波變換小波系數,向量包含了與尺度λJ0= 2J0上的平均值有關的極大重疊離散小波變換尺度系數,和是N × N 階矩陣.


令Xt=,則有:

(2)
利用矩陣記號上式可表示為


利用矩陣記號上式可表示為

通過上面的關系式我們將極大重疊離散小波變換的細節和光滑表示為


時間序列X 可由它的極大重疊離散小波變換恢復:

小波神經網絡是小波分析與神經網絡相結合的產物,是結合小波變換理論與人工神經網絡的思想而構造的一種新的網絡模型[8]. 目前主要有兩種結合方式:一種是“松散型”,即先用小波分析對數據進行預處理,然后再送入神經網絡處理;另一種是“緊致型”,即將神經網絡隱含層中神經元的傳統激發函數用小波函數來代替,充分繼承了小波良好的時頻局部化性質及神經網絡的自學習功能的優點.兩種結合方式如圖1 所示.

圖1 小波變換與神經網絡的兩種結合方式Fig.1 The two different combination modes of wavelet transform and neural network
大多數緊致型小波神經網絡是一種以BP 神經網絡拓撲結構為基礎,以小波基函數為隱含層節點的傳遞函數,信號前向傳播同時誤差反向傳播的神經網絡.筆者所使用的小波神經網絡是以Elman 神經網絡拓撲結構為基礎的,小波基函數使 用Morlet 小波函數,其表達式為Ψ(t)=cos(1.75t)exp(- t2/2),網絡結構如圖2 所示.

圖2 基于Elman 網絡的小波神經網絡緊致型結構Fig.2 The close-type wavelet neural network based on Elman neural network
筆者采用基于Elman 網絡的小波神經網絡,網絡輸出層節點數為1 個. 而隱含層節點的數目選擇是一個較復雜的問題,往往需要根據經驗和多次試驗來確定,因而在理論上不存在一個理想的解析式來表示. 筆者采用“0.618 法”來確定隱含層的節點數,表達公式為:

其中,m 為隱含層節點數;n 為輸入層節點數;t 為輸出層節點數.時間序列數據x(t)根據小波神經網絡結構劃分為學習訓練樣本向量和測試樣本向量,具體劃分為:輸入樣本x(t)= [x(t - k),…,x(t -2),x(t -1)];輸出樣本y =[x(t)],其中k為網絡輸入層節點數.
近年來,基于小波分解的模型預測方法在時間序列預測中取得了良好的效果,它將復雜的時間序列分解為一定頻段的子序列,然后分層預測以降低預測難度[9].筆者采用有別于離散小波變換(DWT)的極大重疊離散小波變換對郵電業務總量序列進行分解.即:

式中:Dj為極大重疊離散小波變換的細節項;SJ0為光滑項.
對時間序列預測的神經網絡模型有很多,較為常見的有BP 神經網絡模型,該模型為多層前饋網絡模型并廣泛應用于時間序列的預測,但它常常會忽略某些巨大噪音或非平穩數據;RBF 神經網絡模型具有很強的生物背景和逼近任意非線性函數的能力,常應用于復雜的時間序列預測;小波神經網絡兼容了小波變換與神經網絡兩者的優越性,但網絡大多以BP 神經網絡拓撲結構為基礎,易陷入局部極小和引起振蕩效應[10].筆者先對郵電業務總量序列進行極大重疊離散小波分解,再利用基于Elman 網絡的小波神經網絡分別預測光滑項和細節項,然后各項預測值進行重構得到序列的預測值.郵電業務總量預測流程如下:

圖3 郵電業務總量預測流程Fig.3 Flowchart of the business total of posts and telecommunications forecasting
下面利用本文方法(記為MOWNN 方法)分析2000 年1 月到2010 年6 月中國郵電業務總量序列,在此基礎上建立預測模型,并對2010 年6 ~12 月中國郵電業務總量進行預測.
先對郵電業務總量序列進行1 階差分提取出線性趨勢,差分后序列呈現出明顯的周期波動性.選取C(6)小波,當分解層數增加到3 層時,郵電業務總量序列的多分辨分析如圖4.
如圖4 所示,分解得到的細節項D3的每個波動與原始序列X 經過1 階差分后的每個完整波動相對照,光滑項S3和原始序列X 的輪廓相吻合.如果分解層數增加到4 層,細節項D4無顯著周期波動且光滑項S4的趨勢性變差,這說明MODWT分解到第3 層就已經分解充分了.

圖4 郵電業務總量序列的極大重疊離散小波變換多分辨分析Fig.4 The MODWT multiresolution analysis of business total of posts and telecommunications sevies
郵電業務總量序列的MODWT 分解為X =D1+ D2+ D3+ S3,為了減少預測的子層數,將所有細節項整合為一項,即D = D1+ D2+ D3.令S= S3,則郵電業務總量序列的MODWT 分解變為X = D +S.然后對光滑項S 和細節項D 用小波神經網絡模型進行建模和預測,預測步數為6 步.
在用小波神經網絡模型進行建模和預測中,序列數據輸入層節點數是人為確定的,輸入層節點數過多會造成網絡學習次數較大;輸入層節點數過少則不能反映后續值與前驅值的相關關系.經反復試驗對光滑項S 和細節項D 預測的模型輸入層節點數的最終確定為7 個和12 個,根據“0.618 法”得出相應的隱含層節點數分別為11個和19 個.表1 給出了預測結果.
為了驗證MOWNN 方法的有效性,下面給出三種預測方法進行對比.一種是單純用三層BP 神經網絡模型對郵電業務總量進行預測的方法,記為BP 方法;另一種是用基于BP 神經網絡的緊致型小波神經網絡模型進行預測,該方法記為WNN方法;還有一種是離散小波變換與神經網絡松散型結合預測的方法(分解過程中也選取C(6)小波,分解層數同為3 層,神經網絡選取三層BP 神經網絡),該方法記為DWNN 方法.為了檢驗各模型預測的性能,給出兩種誤差評價標準:規范化均方根誤差NRMSE 和標準化誤差NE.

表1 郵電業務總量6 ~12 月預測Tab.1 The forecasting value of business total of posts and telecommunications in June to december

式中:Xi為實際值為預測值=Xi,i =1,2,3,…,M.
表2 給出了MOWNN 方法、DWNN 方法、WNN方法、BP 方法4 種方法的誤差評價.

表2 郵電業務總量預測誤差評價Tab.2 The error evaluation of business total of posts and telecommunications forecasting
(1)MOWNN 方法對郵電業務總量序列的預測效果最好,單純的BP 神經網絡模型方法預測的最差,而且MOWNN 方法可以實現多步預測.
(2)WNN 方法和MOWNN 方法相對于BP 神經網絡模型方法,其預測精度有了很大的提高,這說明小波神經網絡模型充分發揮了小波分析與神經網絡兩者的優點,使其具有更靈活有效的函數逼近能力和較強的容錯能力,可以有效地克服普通人工神經網絡模型所固有的一些缺陷.
(3)MOWNN 方法是在WNN 方法的基礎上引入小波分解的方法,它的預測效果比WNN 方法要好,這說明引入MODWT 進行時間序列預測是可行的.
(4)MOWNN 方法與DWNN 方法相比,小波分析與神經網絡“緊致型”結合的預測效果比“松散型”的要好.
針對郵電業務總量預測的需要,筆者提出了一種基于小波神經網絡模型引入MODWT 分解知識的預測方法.預測結果表明,該方法能夠實現多步預測并較好的預測出郵電業務總量的整體趨勢.與BP 方法、WNN 方法和DWNN 方法相比,該方法的預測精度更高,預測效果更好,說明了該方法是有效的、可行的.對于小波神經網絡隱含層的節點數,采用了“0.618 法”進行確定,其效果并不十分理想.如果引用遺傳算法確定隱含層節點數,優化網絡連接的權值及閾值,這將提高小波神經網絡的預測精度,進而提高整個方法的預測效果.
[1] 高潔.應用多元模糊推理預測方法進行郵電業務總量預測[J].南京郵電學院學報:自然科學版,2000,20(1):58 -62.
[2] 高潔.可拓聚類預測方法及其在郵電業務總量預測中的應用[J].系統工程,2000,18(3):73 -77.
[3] 朱明放,王樹勛.基于支持向量機的郵電業務總量的預測[J].微計算機信息,2008,24(1 ~3):284-286.
[4] 吳惠榮.應用灰色模型預測郵電業務總量[J].南京郵電學院學報,1990,10(2):91 -94.
[5] 王香柯,王金柱.郵電業務總量的預測研究[J]. 西安郵電學院學報,1999,4(3):56 -59.
[6] 明喆,宋向東,胡蓓蓓,等.基于ARIMA-GM 組合模型的郵電業務總量預測[J]. 數學的實踐與認識,2010,40(10):118 -123.
[7] 王燕.應用時間序列分析[M].北京:中國人民大學出版社,2005.
[8] 呂淑萍,趙詠梅. 基于小波神經網絡的時間序列預報方法及應用[J]. 哈爾濱工程大學學報,2004,25(2):180 -182.
[9] DONALD B P,ANDREW T W.時間序列分析的小波方法[M].北京:機械工業出版社,2006.
[10] 傅薈璇,趙紅. MATLAB 神經網絡應用設計[M].北京:機械工業出版社,2010.