劉堅強
(湖北省咸寧職業技術學院,437100)
神經網絡能用于徑流序列的描述,主要是基于神經網絡的函數1F線性逼近功能,從這個角度來看,神經網絡可分為全局逼近神經網絡和局部逼近神經網絡。全局逼近神經網絡的權值和可調參數在輸入空間的每一點對任何一個輸出都有影響,對于每個輸人輸出數據對,網絡的每一個權值均需要調整,從而導致學習速度很慢;局部逼近神經網絡對于每個輸人輸出數據對,只有少量的權值需要調整,從而學習速度很快。徑向基函數(RadialBasisFunction,簡稱RBF)是一種典型的局部逼近人工神經網絡,是最近幾年提出和開始研究并得到一定應用的新型前向神經網絡,其結構和一般前向網絡相同,只是網絡隱層神經元的作用過程和一般的網絡不同。徑向基網絡由一個輸人層、一個徑向基神經元的隱層及一個線性神經元的輸出層組成,徑向基網絡能較好地擬合任意有限值函數[1]。
Rumelhart等(1986)提 出 了 多 層 前 饋 網 絡(multilayer feedforward neural networks,MFNN)的反向傳播(back propagation,BP)學習算法。由于使用BP算法,所以稱為BP神經網絡。BP神經網絡是一種具有一層或多層隱層的前向網絡,通常由輸入層、隱層、輸出層組成,三層前向型BP網絡的拓撲結構。
Powell(1985)提出了多變量差值的徑向基函數(radial—based function,RBF)方法。Broomhead等(1988)對徑向基函數和多層神經網絡進行了對比,并將RBF應用于神經網絡的設計;Jackson(1988)證明了徑向基神經網絡對非線性連續函數的一致逼近性;Moody等(1989)正式提出了徑向基神經網絡,即RBF神經網絡。從結構上看,RBF神經網絡屬于前向型網絡,由一個隱層(徑向基層)和一個線性輸出層兩個神經元層組成。與BP神經網絡相比,RBF神經網絡往往需要更多神經元,但RBF神經網絡的訓練所需時間要少。
單變量人工神經網絡非線性時序模型定義為[2]:
yp為徑流序列經過小波分解后不同尺度的高頻成分和低頻成分的重構序列,p為模型的輸入節點數;iv為輸出層神經元與隱層神經元i的連接權;py為網絡輸出值;θ為人工神經網絡非線性映射,在徑向基網絡中為徑向基函數。
神經網絡是通過大量的神經元相互聯系構成的。神經網絡的結構按照拓撲結構屬于以神經元為節點,以節點間有向連接為邊的圖,可以分為層狀和網狀兩個大類。
1)前向網絡(前饋)
前向網絡可以包含很多層,這種網絡的特點是相鄰兩層神經元之間相互連接,不存在跨層連接,神經元之間沒有反饋。任一神經元只能從前一層接收多個輸入,并統一輸出給后一層的多個神經元。前向網絡中具有計算功能的節點稱為計算單元,輸入節點不存在計算單元。前向網絡具體形式如圖1所示。
2)反饋網絡
反饋網絡指從輸出層到輸入層有反饋,也包括神經元引出又回到自身的自反饋。網絡中的每一個節點都可接收外界輸入和其他節點的反饋輸入,每一個節點成為一個計算單元。
3)相互結合型網絡
相互結合型網絡是一個網狀結構。每一個神經元既可以作為輸入,也可以作為輸出,神經元之間都可以進行相互的雙向聯接。網絡中不存在固定的層次結構,也不存在固定的信號流動方向。當施加輸入信號后,網絡中的所有神經元必然相互作用,共同進行信息處理。當網絡中所有神經元的輸出值收斂到一定程度之后才結束信息處理過程。
4)混合型網絡
混合型網絡是介于層次結構和網狀結構之間的一種聯接方式。既存在層次結構也存在同層神經元之間的互聯。這樣做的目的是減少神經元數量或者避免同層神經元的同時興奮[3]。
根據神經網絡在控制器中的作用不同,神經網絡控制器可分為兩類:
(1)神經控制:以神經網絡為基礎而形成的獨立智能控制系統;
(2)混合神經網絡控制:利用神經網絡學習和優化能力來改善傳統控制的智能控制方法,如自適應神經網絡控制等。
在最優決策控制系統中,狀態空間根據不同控制條件被分成特征空間區域,控制曲面的實現是通過訓練過程完成的。由于時間最優曲面通常是非線性的,因此又必須使用一個能夠逼近非線性的結構。一種可能的方法是將狀態空間量化成基本的超立方體,在這個立方體中控制作用是一個假設的常數。這個過程可由一個LVQ結構實現,需要讓另一個網絡充當分類器,如果需要連續信號,則可以使用表針的方向傳播結構。

圖1 RBF神經網絡的結構
在頻率學派中,概率P(A)定義為:在一個重復性的隨機試驗中。當試驗的次數趨于無窮時,事件A發生的相對頻率,而在貝葉斯分析中,概率P(A)被定義為人們對命題A的相信程度。假設A與B相關,即B中包含關于A的信息,在觀測到B之前對A的相信程度是P(A),在觀測到B之后,根據貝葉斯理論。我們應修正對A的相信程度
如果A表示參數(或向量)θ。B表示樣本y,用概率密度函數代替概率;則貝葉斯公式為:示觀測到數據之前對θ的相信程度;p(θ |y)是θ的后驗分布,表示觀測到數據后對θ更新的相信程度;p(y)是樣本數據的邊緣分布;p(y|θ)是θ給定條件下的樣本分布或樣本似然,即[2]:

(1)檢驗at是否與at?1,at?2,…無關 ;
(2)檢驗at是否與xt?2,xt?3,…無關。
對于AR(n)模型進行參數估計和適用性檢驗后,就可以所建立的AR(n)模型對時間序列 進行預測。
在RBF神經網絡中,輸入樣本經過隱層處理后,在輸出層實現了線性組合。實際應用中RBF神經網絡的訓練步驟如下:(1)確定訓練樣本向量、目標向量和訓練參數;(2)無教師學習,通過輸入層和隱層之間的訓練,確定權值;(3)有教師學習,通過隱層與輸出層的訓練,確定權值。實證部分采用MATLAB神經網絡工具箱提供的 newrb(P,t,goal,spread,mn,df)函數,其中,spread是激勵函數(徑向基函數)的分布密度,其取值的不同會給網絡的預測能力帶來很大影響,spread取值越大,則預測性能的平滑程度越好;反之,spread取值越小,預測性能的平滑程度越差,但網絡的逼近程度較高。故在預測過程中通過多次調整spread的取值,觀察真實值與預測值之間的誤差,從而可確定誤差較小、較為合理的spread值作為預測使用。
時間序列預測就是通過收集和分析某一預測變量的歷史數據,建立出可以反映其規律和關系的模型,再進行趨勢外推的預測方法。這種建模方法適用于從數據中只能獲得少量模型的信息,或者無法將預測變量和解釋變量之問的關系用函數關系來刻畫的情況。過去幾十年中,關于時間序列預測模型的研究和改進已經取得了很多的成果。其中應用最廣的時間序列模型是ARIMA模型,主要是由于其在建模過程中利用了Box—Jenkins建模方法的統計特性。雖然ARIMA模型可以表示多種不同類型的時間序列,但是它主要的限制條件是需要預先假設模型的形式是線性的,而且無法處理數據中存在的異常值的干擾。
人工神經網絡由于其靈活的非線性建模能力和容錯能力,在時間序列預測中的研究和應用已經越來越多。利用它就不再需要指定某一特殊的模型形式,而且能夠基于數據的特點自適應學習和訓練。因此,利用這種數據驅動的方法可以對那些無法預知建模機理的問題給出更精確的解決方法。一些實證研究也表明了使用神經網絡進行時間序列預測的精度要高于傳統的時間序列預測方法。神經網絡模型和ARIMA模型有很多相似之處。它們按照模型自身的結構都可以劃分出很多不同的類型,所以模型識別對它們來說都是非常重要的問題;為了得到更好的預測結果,在建模之前有必要對數據進行預處理的轉換;都需要較多的樣本數據;而且要確定模型的形式都需要反復試驗而且有時還需要進行主觀判斷;它們建模總的原則是模型的結構越簡單越好,一定要避免出現過擬合現象。
[1] 劉喜梅,魏婉韻,于飛.基于人工神經網絡的變壓器勵磁涌流的鑒別 [J].低壓電器,2007,20(19):102-103.
[2] 汪洋,宇仁德,閆建華.基于徑向基函數神經網絡的交通事故預測 [J].交通標準化,2009,15(21):67-68.
[3] 許楊文.基于RBF神經網絡的水輪機故障診斷研究[J]. 光盤技術,2009,18(02):156-157.