郝婧, 劉強, 張曉琪
(中國海洋大學工程學院, 青島 266100)
近百年來,受全球氣候變化的影響,中國出現了海平面快速上升、海洋變暖顯著、極端事件增多以及海洋酸化加劇等現象[1]。中國是受風暴潮災害影響最嚴重的國家之一,氣候變化加劇和海平面持續上升,使風暴潮出現的強度、頻率和持續時間均呈現增加的趨勢,給沿海地區帶來了嚴重的經濟損失[2]。2000—2020年,在中國造成災害的風暴潮高達131個,造成的直接經濟損失超過 2 150 億元。因此,對氣候變化和臺風風暴潮災害進行科學有效的研究和管理,提升高效的損失評估能力對防災減災事業具有重大的現實意義。
依據災害理論,災害損失的評估方法主要為兩大類,一類是基于統計模型的評估方法,另一類是基于風險關聯的評估方法[3]?;诮y計模型的評估,國外有FCHLPM[4]、FPHL[5]、GCOM2D/3D[6]和HAZUS[7]模型等,中國學者趙昕等[8]運用經濟學角度的投入產出模型分析評估了風暴潮損失?;陲L險關聯的評估,主要包括危險概率評估、脆弱性曲線和指標體系評估等[3]。Mahapatra 等[9]依據GIS加入人口和物理變量的分析進行了沿岸風暴潮脆弱性的評估;Yang 等[10-11]基于極限理論和擴展卡爾曼濾波評估直接經濟損失和人口傷亡預測,構建了我國風暴潮災害風險評估模型。現階段,已有學者將機器學習方法應用于風暴潮損失評估。張穎超等[12]、馮倩等[13]、王甜甜等[6]、江斯琦等[14]分別運用神經網絡組合預測、支持向量機(support vector machine,SVM)組合反向傳播(back propagation,BP)神經網絡(SVM-BP)、天牛須搜索(beetle antennae search, BAS)優化BP神經網絡(BAS-BP)、改進神經網絡與GIS建立風暴潮損失評估模型,均實現了良好的災害損失預測效果。
目前已有的研究成果為臺風風暴潮災害的預警和管理提供了理論支持,為進一步提高損失預測的精準度,基于機器學習理論,構建包括氣候變化的評估指標體系,使用徑向基(radical basis function,RBF)神經網絡和支持向量回歸構建臺風風暴潮損失評估模型,并嘗試使用熵權法將兩種方法組合,比較發現組合方法能夠克服單一模型評估效果不佳的問題,同時驗證氣候變化指標的重要性。
本文中風暴潮災害資料主要來自自然資源部(海平面、風暴潮及其所產生的損失信息)、中國氣象局(溫室氣體信息)、廣東省統計局(相關經濟、人口、設施等信息)、農業農村部(相關經濟信息)、《中國風暴潮災害史料集》[15]。選取從1995—2020年間50個廣東省發生的記錄較為完整的臺風風暴潮損失數據進行研究。所收集的臺風風暴潮數據跨度較全面,如表1所示。

表1 臺風風暴潮直接經濟損失分布情況Table 1 Distribution of direct economic losses from typhoon storm surge
目前,災害損失評估指標體系的構建還未有統一的標準,主要依賴于專家的先驗知識[16]。基于全球氣候變化背景和風險評估理論,從氣候變化、致災因子危險性、承載體易損性和防災減災能力四個方面建立了臺風風暴潮損失評估體系,如圖1所示。

圖1 臺風風暴潮災害損失評估指標體系Fig.1 Typhoon storm surge disaster loss assessment index system
在充分考慮臺風風暴潮數據和減少主觀影響的基礎上,使用主成分分析進行降維處理,篩選出主要因素作為模型的輸入量。主成分分析是一種多變量統計方法[17],使用線性變換提取出具有代表性的獨立綜合變量,能很好地抓住主要矛盾[18],便于進一步分析。
利用SPSS統計工具根據圖2所示步驟計算主成分,最終得到氣候變化、致災因子危險性、承載體易損性和防災減災能力的綜合變量作為4個輸入變量,分別為F1、F2、F3和F4,表達式為
F1=0.58×(0.38Z11+0.58Z12-0.29Z13-0.59Z14+0.30Z15)+0.42×(0.45Z11-0.03Z12+0.54Z13+0.31Z14+0.64Z15)
(1)
F2=0.71×(0.34Z21-0.51Z22+0.51Z23+0.51Z24+0.33Z25+0.08Z26)+0.29×(0.54Z21+018Z22-0.24Z23-0.22Z24+0.55Z25-0.52Z26)
(2)
F3=0.79×(0.41Z31+0.41Z32-0.20Z33+0.40Z34+0.41Z35+0.40Z36+0.02Z37+0.38Z38)+0.21×(-0.10Z31-0.10Z32+
0.61Z33+0.14Z34+0.12Z35+0.15Z36-0.73Z37+0.12Z38)
(3)
F4=0.38Z41-0.41Z42+0.43Z43+0.42Z44+0.42Z45+0.39Z46
(4)

Z為數據正態標準化后的決策矩陣;Xij( i=1,2,…,m;j=1,2,…,n)為第i個評價對象的第j個評價指標值;rij為相關系數矩陣;Fi為第i個主成分的得分;F為主成分分析法的綜合評價值圖2 主成分分析計算步驟Fig.2 Principal component analysis calculation steps
以50個臺風風暴潮為總樣本,按時間序列,前40個樣本作為訓練集,后10個樣本作為測試集,以MATLAB 2019b為平臺,由主成分分析降維后的4個綜合變量作為輸入因子,直接經濟損失和海水養殖受災面積作為輸出因子進行臺風風暴潮損失評估。


圖3 RBF神經元結構圖Fig.3 RBF neuron structure diagram
支持向量機最早主要用于研究分類問題,后引入ε不敏感損失函數提出了支持向量回歸(support vector machine for regression,SVR),得以解決支持向量機在回歸擬合方面的問題且取得了很好的擬合效果,具有唯一的最優解。該算法的提出主要針對小樣本問題,利用非線性變換將數據映射到高維特征空間來構造線性回歸函數,基本思想是尋找一個最優的面使得所有原始的樣本離該最優面的誤差最小[20],如圖4所示。

圖4 SVR基本思想示意圖Fig.4 SVR basic idea diagram
Bates等[21]首次提出了組合預測方法,基于評估對象指標的復雜程度,單一的預測模型往往具有局限性和片面性,因此將多個模型通過定權方式進行有效組合。目前組合預測方法在國內已成為研究熱點,王莉琳等[22]使用方差倒數法將灰色模型和自回歸積分移動平均模型進行組合來預測電力需求;張穎超等[23]基于最優加權法組合廣義神經網絡、極限學習機和支持向量機預測浙江省臺風損失;陳聰等[24]以熵權法確定動態權系數來組合預測飛機的燃油流量全航程。
目前常用的組合預測方法有熵權法、誘導有序加權幾何平均(induced ordered weighted geometric averaging,IOWGA)算子、最優加權法和方差倒數法等。其中,熵權法基于信息熵原理是建立在原始數據的基礎上,充分體現了樣本的顯性信息和隱性信息,適用于解決小樣本或信息匱乏的樣本問題[25]。因此,本文中采用熵權法組合預測支持向量回歸(SVR)和RBF神經網絡(SVR-RBF)進行臺風風暴潮災害直接經濟損失評估。熵權法的基本原則是首先將指標分正負向原則進行無量綱化處理,計算各子模型的熵值、熵權,詳細步驟見參考文獻[25],最終確定SVR和RBF神經網絡的權重。
為了檢驗模型的精度,引入均方根誤差(RMSE)作為參數選擇指標,歸一化均方根誤差(NRMSE)、相關系數(CC)作為預測檢驗指標,其表達式[26-27]為

(5)

(6)
CC=

(7)
式中:N為測試樣本數;ytest,i為測試樣本;yi為預測結果。RMSE和NRMSE反映了預測數據偏離原始數據的程度,越接近于0,表示預測效果越好,預測結果越穩定;CC用于評估預測數據和原始數據的符合程度,接近于1,擬合效果好,精確度高。
為驗證氣候變化對損失評估的重要性,對比不考慮氣候變化的臺風風暴潮損失評估,將F2、F3和F4作為輸入因子進行對比。本文實驗中,RBF神經網絡模型用實驗法比較RMSE對徑向基函數的擴展速度進行確定,SVR模型使用LIBSVM工具箱[28]利用交叉驗證方法確定最優參數(t、c、g),各參數設置如表2所示。

表2 RBF神經網絡和SVR模型的最優參數值設置Table 2 Optimal parameter value Settings of RBF neural network and SVR model
兩種模型評估效果對比見圖5和表3,在直接經濟損失和海水養殖受損面積中,可以看出有氣候變化指標的RBF神經網絡和SVR模型均優于相對應無氣候變化指標模型的評估擬合效果。在直接經濟損失評估中,RBF神經網絡模型在加入氣候變化指標F1后的評估結果NRMSE降低0.042 7、CC

圖5 模型測試集擬合結果Fig.5 Fitting results of model test set

表3 模型測試集評估效果對比
提升0.037 1,SVR模型評估結果NRMSE降低0.022 1、CC提升0.061 6;同樣在海水養殖受損面積的評估結果中,RBF神經網絡模型在加入氣候變化指標F1后的NRMSE降低0.553 5、CC提升0.263 3,SVR模型評估結果NRMSE降低0.015、CC提升0.011。因此,基于兩個模型的整體預測精度,可以驗證氣候變化對于災害損失評估具有一定的影響。
組合預測中的子模型和定權方式均對預測評估結果產生較大影響,根據上文的模型比較發現RBF神經網絡在出現較大直接經濟損失時預測誤差較小且SVR在直接經濟損失的預測中更具穩定性,可以作為子模型進行組合。根據熵權法求得SVR和RBF神經網絡的最優組合權重為0.499 9和0.500 1,按組合預測對直接經濟損失的測試集進行處理,求出預測集誤差的絕對值如圖6所示,可以看出組合預測模型相對于單一模型在直接經濟損失上具有更好的預測穩定性。

圖6 誤差對比Fig.6 Error comparison
比較表4評估結果發現,在對臺風風暴潮直接經濟損失評估中,SVR-RBF神經網絡組合預測模型的RMSE相對于單一模型更好,CC更優,預測效果更具穩定性。因此,組合預測方法發揮了單一模型優勢,提高了災害直接經濟損失評估效果,增加了評估模型的穩定性和可靠性。

表4 組合預測模型測試集評估效果
(1)從氣候變化、致災因子危險性、承載體易損性和防災減災能力四個方面建立了臺風風暴潮損失評估體系,通過主成分分析降維得到4組綜合變量。將直接經濟損失和海水養殖受災面積作為輸出因子,分別使用RBF神經網絡和SVR模型對比有無氣候變化指標的評估效果,預測結果表明氣候變化是臺風風暴潮損失評估的重要影響因素,可為未來研究提供重要方向。
(2)RBF神經網絡在較大直接經濟損失時預測誤差較小,而SVR在預測準確度上更具穩定性,提出熵權法的組合預測方式,對臺風風暴潮直接經濟損失方面比較RBF神經網絡、SVR和組合預測模型的RMSE和CC得出結論:熵權法定權的組合預測模型充分發揮了單一模型的優勢,提高了預測結果的可靠性,穩定了評估效果的精確度。
(3)在氣候變化背景下,且不排除較大較小臺風風暴潮的小概率事件,建立的臺風風暴潮損失評估模型可以較好地進行預測,對災害的管理可以提供科學參考。但由于氣候變化指標選取較少,在此方面存在一定的局限性,且可獲取的臺風風暴潮完整樣本過少,在預測準確性方面還有待提高。引入遙感技術對氣候指標的獲取是下一步的研究工作,以此來完善臺風風暴潮的數據搜集工作。