●何樹紅 楊博 戴明爽
基于動態遞歸神經網絡的洪水災害損失預測
●何樹紅 楊博 戴明爽
對洪水災害損失進行預測,旨在為我國巨災保險產品的創新提供新的理論依據。神經網絡自身的聯想能力決定了它在預測方面有比較大的優勢,特別是在處理洪水災害損失這類動態問題上,Elman動態神經網絡能很好地預測洪水災害損失,與靜態神經網絡相比,預測所得結果的精度進一步提高。
洪水災害 損失預測 神經網絡
關于洪水災害損失的預測,我國目前仍處于起步階段。常采用定性分析的方法,分析得出有關影響因素,并且進一步分析各因素對洪水災害影響作用的大小。例如楊凱在對包括洪水災害的巨災風險進行分析之后指出我國巨災風險最大的問題是:相關保險的供給不足,需求也不足。其中的根本原因是:國民的巨災保險意識薄弱,巨災保險存在再保險困難,巨災保險目標市場難以確認;但是這些理論研究對我國如何防范洪水災害風險的借鑒性比較小。洪水災害風險防范的核心問題在于洪水災害損失的預測,近年來有學者將數學模型引入到了洪水災害損失預測,例如張正建立了洪水災害損失的數學預測模型,通過利用歷史數據,來完成對未來數據的預測??蛇@種研究方式有一個前提假設,即洪水災害損失是一個靜態問題,但是洪水災害損失是否是一個靜態問題值得商榷。
針對洪水災害損失的特點,本文對其損失的預測將按照以下三個步驟進行。首先,需要對洪水災害的影響因素進行分析;其次,本文分別利用靜態神經網絡和動態神經網絡分別對洪水災害損失進行預測,根據預測所的結果的精度來確定洪水災害損失屬于靜態問題還是動態問題;最后,利用相應的神經網絡對洪水災害損失進行建模,從而實現洪水災害損失預測。
(一)降雨量和持續時間
降雨量和降雨持續時間是洪水災害發生的最直接的兩個因素。洪水災害的發生往往伴隨著強降雨的發生。強降雨主要導致兩方面的結果:一段時間內地面排水系統的排水量嚴重小于降雨量、山體表面的吸水能力嚴重小于降雨量??墒?,僅僅依靠強降雨量來造成洪水災害往往是不可能的。因為即使降雨量再大,持續時間過短,所造成的積水持續時間很短,對于山體的沖刷力度往往不足以造成洪水災害。所以強降雨量加上較長的持續時間才會造成城市積水嚴重以及山體滑坡、泥石流等災害。這兩個因素對于洪水災害的造成缺一不可。
(二)土質結構
土質是指土壤的構造和性質。我國國土幅員遼闊,不同地區之間的土質結構往往不同。我國的土質分為八類土,級別由低到高分別為:松軟土、普通土、堅土、砂礫堅土、軟石、次堅石、堅石、特堅石。級別越高,土壤中所含巖石成分就越高,土質也就越堅固。所以,在洪水發生的時候,在土質級別較低的地區容易發生泥石流等災害,而土質級別越高的地方發生泥石流災害的可能比較小。
(三)建筑物堅固程度
建筑物的堅固程度是指建筑物對于洪水災害的抵抗能力。洪水災害發生對建筑物的影響主要有三方面:第一,洪水發生時對建筑物的直接沖擊作用,這種沖擊力一般比較大,通常情況下結構性能較差的房屋會直接被這種沖擊力沖毀。第二,洪水的不斷沖刷使會使墻體的砂漿流失,砂漿的飽和程度下降,進而使墻體強度下降。第三,洪水災害發生后,建筑物會長期浸泡在水中,水分子會不斷進入土顆粒之間,破壞墻體結構,進而會導致建筑物開裂,結構受損。
(四)該地區洪水災害的歷史情況
該地區洪水災害的歷史情況是指該地區以前是否發生過洪水災害。一次洪水災害的發生所造成的災難并不是在這次洪水災害結束后就全部結束了,有可能上次洪水災害已經造成了災害但是沒有顯示出來,這對下次洪水發生時造成更大的災難做了鋪墊,所以發生過洪水災害和沒有發生過洪水災害的地區兩者相比,相同程度的洪水災害在發生過洪水災害的地區所造成的損失更大。
(五)排水力度
排水設施是指一個地區的積水排放效率和能力。一個城市是否容易造成積水,在不出現特大強降雨量的情況下,排水力度是決定因素。排水力度與能否造成城市積水呈反向關系,即排水力度好的城市產生嚴重積水的可能性就越小。
(一)BP神經網絡的結構
BP神經網絡是最經典的靜態神經網絡,其核心思想是將BP算法運用到人工神經網絡。它是由美國加利福尼亞的PDP(parallel distributed procession)小組將1974年P.Werbos在其博士論文中提出的適合多層網絡的學習算法運用到神經網絡所產生,其結構如圖1所示。BP神經網絡具有人工神經網絡所具有的一切特點,但與一般人工神經網絡不同的是:BP神經網絡的學習過程由信號的正向傳播與誤差的反向傳播兩個過程組成,正向傳播時,輸入樣本從輸入層傳入,經各隱藏層逐層處理后,傳向輸出層。若輸出層的實際輸出與期望的輸出不符,則轉入誤差的反向傳播階段。誤差反傳是將輸出誤差以各種形式通過隱藏層向輸入層逐層反傳,并將誤差分攤給各層的所有單元,從而獲得各層的誤差信號,此誤差信號即作為修正各單元權值的依據。這種信號正向傳播與反向傳播的各層權值調整過程,是周而復始地進行的。一直進行到網絡輸出的誤差減少到可接受的程度,或者到預先設定的學習次數為止。

圖1 BP神經網絡結構圖
(二)Elman神經網絡的結構
Elman動態遞歸神經網絡是一種典型的動態神經網絡,它由Elman在1990年提出,其過程如圖2所示。這種網絡具有與MLP網絡相似的多層結構,但與MLP網絡不同的是,Elman網絡接收兩種信號,一種是外部輸入的信號U(t),另一種是來自隱含層的反饋信號XC(t)。因為它除了普通隱含層以外,還有一個單元延遲模塊(有時稱為承接層),該層從普通隱含層接收反饋信號,承接層內的神經元輸出被前向輸出至隱含層。這里引入承接層的思想是通過對前饋神經網絡中附加狀態反饋神經元來描述系統的非線性動態行為。隱含層不僅接受來自輸入層的信號,還接受隱含層節點自身的一步延時信號(來自承接層),這樣承接層就記憶了上一個模式的網絡狀態。由此可見,承接層能存儲系統過去的信息,從而增加網絡對動態信息的處理能力。

圖2 標準Elman網絡
隱藏層輸出:XC(t)
單位延遲模塊:XC(t)=X(t-1)
輸出層輸出:Y(t+1)=WX(t+1)
(三)Elman網絡相對于BP神經網絡的特點
1.Elman神經網絡具有特殊的結構。Elman網絡保留了前饋神經網絡的基本結構。但是與前饋神經網絡不同的是,Elman加入了承接層。承接層的加入就意味著網絡多了一個記錄信息的單元。而這個單元可以使隱藏層的輸出得到延遲和存儲,然后將存儲的信息與下一時刻隱藏層的輸入自聯。這就加強了網絡對歷史數據的敏感性與動態信息處理的能力,從而達到動態建模目的。
2.Elman神經網絡中隱藏層與輸出層神經元結構搭配特殊。隱藏層的神經元為tansig神經元,輸出層的神經元為purelin神經元,這兩種神經元的組合可以使得網絡以任意精度去逼近任意函數。并且,訓練時間并不會因為逼近對象的復雜性增加而大幅度增加,只需相應增加隱藏神經元數目即可。
3.Elman神經網絡具有動態性的優點。Elman神經網絡由于其特殊的網絡結構,本身具有動態性的特點,所以對于動態問題具有更好的處理效果,不僅可以使網絡具有非線性的動態特征,同時還可以避免靜態神經網絡無法實時改變模型結構以及缺乏對未來突變情況適應性的缺點。
4.Elman神經網絡與靜態神經網絡相比具有雙重聯接的特性,即Elman神經網絡不僅具有前饋聯接,同時還具有反饋聯接。這個特性使Elman神經網絡可以避免前向型神經網絡易陷入局部最小點、收斂速度慢的情況。
利用神經網絡建模,通常包括以下3個階段:數據的收集及處理、設計神經網絡結構、訓練神經網絡。
(一)數據的收集及處理
數據的收集及處理是利用神經網絡建模的基礎,同時也是泛化能力能否實現的關鍵。數據的收集及處理主要內容有:采集問題相關的原始數據、數據的預處理、數據樣本容量是否達標。
采集相關的原始數據是指根據問題需要,查找相關的數據,并且保證數據的真實性。
樣本容量的多少主要由兩方面決定:一個是網絡的復雜程度;另一個是數據中的噪聲大小。最后須將與處理之后的數據進行分類,分為訓練數據和檢驗數據,從而形成所需的訓練樣本和檢測樣本。
數據的預處理是一個比較重要的環節。在進行預測的時候,我們不能將原始數據輸入至網絡進行訓練,特別是要進行多種數據預測時,因為原始數據有時候相差比較大,達到幾倍或者幾十倍。為了防止大數據將小數據的信息湮沒,就必須對數據進行預處理。最常用的數據處理方法為歸一化處理。歸一化是指把某向量除以該向量的長度,而使其長度為1,使得網絡輸入的數值都在0和1之間。歸一化的公式為:

輸出則按照:

還原回來即可。
其中:Vmax:該向量可能達到的最大值
Vmin:該向量可能達到的最小值
Tmax:與Vmax相對應的歸一化后的最大值
Tmin:與Vmin相對應的歸一化后的最小值
T:為實際值V的歸一化值
(二)網絡結構設計
1.網絡層數。Elman動態遞歸神經網絡與BP神經網絡在結構上的不同就是相對于BP神經網絡,Elman動態遞歸神經網絡多了一個承接層。但是承接層具體的結構不用去設計。我們只需像BP神經網絡一樣設置輸入層、隱藏層、輸出層即可。因為Elman本身具有BP神經網絡的特點,所以一個隱藏層的Elman神經網絡在神經元足夠大的情況下,可以無限逼近輸入與輸出的線性關系。所以在這里我們依然采用一個隱藏層的Elman動態遞歸神經網絡。
2.輸入層神經元個數的確定。輸入層起緩沖存儲器的作用,它接收外部的輸入數據,因此神經網絡的輸入層神經元個數由輸入向量的維數決定。
3.隱藏層神經元個數的確定。隱藏層神經元的作用是從樣本中提取并存儲其內在規律,每個節點有若干個權值,而每個權值都是增強網絡映射能力的一個參數。而確定神經網絡隱藏層神經元個數的最常用方法是試湊法。只不過對于不同的神經網絡采用的經驗公式不同。BP神經網絡可先設置較少的隱藏元神經個數訓練網絡,然后逐漸增加隱藏層神經元個數,用同一樣本集進行訓練,從中確定網絡誤差最小時對應的隱藏層神經元個數。BP神經網絡隱藏層神經元個數常用的經驗公式為+c。其中,m表示隱藏層神經元個數,a表示輸入層的神經元個數,b表示輸出層神經元的個數,c表示1~10之間的一個常數。而Elman動態遞歸神經網絡確定隱藏層神經元個數的方法根據輸出單元和輸入單元的多少分為兩種:第一種是當輸入單元和輸出單元比較多的情況下,采用公式,確定其起始值,然后再逐個增加確定神經元個數;第二種是當輸入單元和輸出單元比較少的情況下,采用公式m=2a+d,確定其起始值,然后再逐個增加,通過試探來確定隱藏層神經元個數。其中,m、a、b的含義同前,d表示1~10之間的一個常數。
4.輸出層神經元個數的確定。輸出層起釋放存儲器的作用,它是網絡利用它本身的泛化能力將所得結果輸出。因此神經網絡的輸出層神經元個數由輸出向量的分量個數決定。
(三)網絡的訓練、檢驗
神經網絡結構確定好之后,就可以分別利用訓練樣本和檢測樣本進行訓練和檢測。
神經網絡的訓練是指利用樣本數據修改連接權值或者閥值的過程。使其最終達到能夠反映出訓練樣本數據中輸入向量和輸出向量的隱含關系。神經網絡的訓練并非訓練的次數越多越好。這是因為我們所收集到的數據是含有噪聲的,雖然通過歸一化處理,可以減小噪聲。但是神經網絡的訓練過程是一個反復利用樣本數據的過程,過多的訓練會使得包含噪聲的數據被刻畫的很具體,從而對輸入向量與輸出向量的正確映射關系造成影響。
神經網絡的檢驗是指利用檢驗樣本對已經訓練好的網絡進行檢驗,并根據輸出結果與真實值對比,利用一定的誤差標準來確定網絡的適應性,以及是否具有泛化能力。泛化能力是衡量網絡性能的主要標準,而并非輸出結果與真實值的擬合程度。所以這就是檢驗的必要性的體現。如果利用檢測樣本得出網絡具有泛化能力的結論,我們便可以對洪水災害損失進行預測。
本文將利用靜態神經網絡中的BP神經網絡和動態神經網絡中的Elman神經網絡分別對洪水災害的損失進行模擬。輸入向量采用洪水災害最直接的兩個影響因素:降雨量和持續時間,而輸出向量則采用最重要的洪水災害損失。
(一)洪水災害損失數據
由于我國洪水災害管理體系不健全,數據收錄不完全,本文所采用的19組數據來源于2005-2012年有準確數據可查的19次洪水災害數據。
本文將采用14次洪水災害的數據作為網絡的訓練樣本,5次洪水災害的數據作為檢測樣本。
(二)網絡結構的設計
1.輸入層神經元個數的確定。本文洪水災害損失預測模型的輸入向量的維數為2,所以輸入層的神經元個數為2。
2.輸出層神經元個數的確定。本文洪水災害損失預測模型的輸出向量中只有一個分量,故輸入層的神經元個數就確定為1。
3.隱藏層神經元個數的確定。由于本文輸入神經元個數與輸出神經元個數較少,所以BP神經網絡隱藏層神經元的個數根據經驗公式確定為2,Elman神經網絡隱藏層神經元個數確定為5。
(三)網絡的訓練
BP神經網絡與Elman神經網絡的結構設計好之后,就利用訓練樣本對其進行訓練。對于BP神經網絡分別建立隱藏層神經元個數為2至11個的10種神經網絡,對于Elman神經網絡分別建立隱藏層神經元個數為5至14個的10種神經網絡。訓練誤差為0.05,最多訓練次數為1000次。利用訓練樣本開始進行訓練。
(四)實驗結果與分析
神經元個數為2至11的BP神經網絡與神經元個數為5至14的Elman動態遞歸神經網絡的均方誤差對比如表1所示。
從表1中我們可以得出以下結論:
1.Elman動態遞歸神經網絡針對于BP神經網絡在處理洪水災害損失具有明顯的優越性。用BP神經網絡處理洪水災害損失預測,誤差容易出現。
2.根據靜態神經網絡與動態神經網絡模擬結果的對比,實際數值與動態神經網絡模擬所得結果更為接近,所以洪水災害損失預測應該為動態問題。
3.本文最終模型定為隱藏層神經元個數為10的Elman動態遞歸神經網絡,因為這個網絡的均方誤差已經為0.011092,已經非常精確。再增加神經元個數不但預測精度沒有得到大幅度提高,反而會導致網絡的復雜程度增加。

表1 兩種神經網絡的均方誤差對比表
(五)模型的檢驗
利用事先準備好的檢測樣本,用訓練好的Elman神經網絡進行洪水災害損失的預測,為了對比方便,本文在檢驗時同樣利用BP神經網絡進行了檢驗。在經過反歸一化數據還原后,與實際損失數據進行對比,數據如表2所示:

表2 實際損失與預測損失對比表
從表2中我們可以發現:
1.五次洪水災害的實際損失為32.86、98.74、47.13、40.58、16.91億元,而根據BP神經網絡預測的洪水災害損失為36.08、95.27、42.15、42.23、12、49億元。偏差率分別為9.8%、3.5%、10.6%、4.1%、26.1%,平均偏差率為10.8%。由此我們可知BP神經網絡預測得到的結果雖然大致可以預測洪水災害的損失,但是精度差強人意。
2.根據Elman動態遞歸神經網絡預測得到的洪水災害損失分別為33.64、97.94、46.02、41.23、16.08億元,偏差率分別為2.4%、0.8%、2.4%、1.6%、4.9%,平均偏差率為2.4%。由此我們可知Elman動態遞歸神經網絡的預測精度比BP神經網絡及改進后的BP神經網絡的預測精度都要高,偏差也比較小。平均偏差率控制在了3%以下,預測效果較好。
3.造成BP神經網絡與Elman動態遞歸神經網絡平均偏差率相差較大的原因主要是因為第五組數據所造成,而第五組數據是來源于湖南的洞庭湖地區,這個地區就屬于洪水災害經常發生的地方??梢妼τ诤樗疄暮Πl生比較少的地方BP神經網絡所得結果還勉強可以接受,但是對于經常發生洪水災害的地區,就不能使用靜態神經網絡來進行模擬,否則誤差會比較大。
在實際運用當中,可以通過下述途徑完成預測:首先,收集氣象臺在每次強降雨來臨之前提供的預計降雨量、預計降雨時間這兩個數據。其次,對數據進行歸一化處理,做成神經網絡的輸入向量;最后,輸入準備好的輸入向量,利用訓練好的Elman動態遞歸神經網絡的聯想能力,得到輸出向量。對輸出向量進行反歸一化后,就可以得到洪水災害損失的預測值。這將為我國巨災風險證券化提供一個堅實的基礎。
[1]何樹紅,楊博,戴明爽.基于動態遞歸神經網絡的石油價格預測[J].云南民族大學學報(自然科學版),2013(1)
[2]楊凱,齊忠英,黃鳳.我國發展巨災保險所面臨的供需不足分析及建議[J].商業研究,2006(6)
[3]張正,黃泰松,左春.基于BP神經網絡的災情預測模型[J].計算機工程,2005(1)
[4]施彥,力群,廉小親.神經網絡設計方法與實例分析[M].北京:北京郵電大學出版社,2009
[5]張良均,曹晶,蔣世忠.神經網絡使用教程[M].北京:機械工業出版社,2009
[6]周開利,康耀紅.神經網絡模型及其MATLAB仿真程序設計[M].北京:清華大學出版社,2005
(責編:賈偉)
F840.69
A
1004-4914(2014)05-016-04
教育部人文社會科學研究一般項目(11YJA790040)】
何樹紅,博士,云南大學經濟學院教授,碩士生導師,研究方向:數理金融與風險管理;楊博,云南大學數學與統計學院在讀碩士;戴明爽,云南大學經濟學院在讀碩士云南昆明 650091)