999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的降雨—滑坡災害鏈直接經(jīng)濟損失脆弱性評估*

2022-02-05 13:43:56李子軒
災害學 2022年4期
關(guān)鍵詞:模型

李子軒,杜 鵑,徐 偉

(1.北京師范大學 地理科學學部 環(huán)境演變與自然災害教育部重點實驗室,北京 100875;2.北京師范大學 地表過程與資源生態(tài)國家重點實驗室,北京100875;3.應急管理部-教育部 減災與應急管理研究院,北京 100875)

現(xiàn)有降雨—滑坡災害鏈的研究主要集中在兩方面:第一個是誘發(fā)滑坡的降雨閾值[1-4],包括降雨誘發(fā)滑坡的閾值形式,不同的研究區(qū)的閾值曲線特點,以及加入閾值曲線的新的變量等;第二個是降雨滑坡敏感性(易發(fā)性)評估,采用不同的方法如邏輯回歸模型、隨機森林模型等實現(xiàn)降雨滑坡敏感性分布圖的繪制[5-9]。而關(guān)于滑坡的社會經(jīng)濟影響方面的現(xiàn)有研究仍然很少[10-11]。一般來說,由于數(shù)據(jù)缺乏,大多數(shù)關(guān)于滑坡的社會經(jīng)濟影響評估是有限的[12],并且在量化方法上呈現(xiàn)一定的復雜性[10]。如ZHANG等[13]利用動態(tài)投入產(chǎn)出模型和重力模型評估公路沿線滑坡導致的間接經(jīng)濟損失;ZUMPANO等[14]以農(nóng)村土地為研究對象基于山體滑坡事件估計了歷史和未來的經(jīng)濟損失。但針對降雨—滑坡災害鏈致災與成害過程聯(lián)系,即脆弱性研究仍較為缺乏。在滑坡脆弱性研究中,往往難以對致災因子的具體強度進行表征,因此研究者更多的關(guān)注社會脆弱性,即通過影響災害損失的社會經(jīng)濟多方面因素進行脆弱性評估。如SAHA等[15]采用深度學習算法結(jié)合災害脆弱性影響要素的空間分布,評估了不丹的滑坡脆弱性。本研究以貴州省畢節(jié)和六盤水兩市的降雨—滑坡災害鏈事件為例,利用機器學習方法建立降雨—滑坡災害鏈直接經(jīng)濟損失脆弱性的定量評估模型,以期為降雨—滑坡災害風險評估提供關(guān)鍵參數(shù),也為風險管理實踐提供參考。

1 數(shù)據(jù)與研究方法

1.1 研究區(qū)介紹

本文以貴州省畢節(jié)、六盤水兩市作為研究區(qū)進行降雨—滑坡災害鏈直接經(jīng)濟損失脆弱性定量評估。兩市地處貴州省西部云貴高原一、二級臺階地區(qū)斜坡地帶,地形地勢復雜;同時位于亞熱帶季風區(qū),全年濕潤,降水較多,時有強降水發(fā)生。兩市滑坡災害發(fā)生頻繁,尤其是在降水密集的6—8月份。根據(jù)畢節(jié)市自然資源和規(guī)劃委(https://www.bijie.gov.cn/bm/bjszrzyhghj)和六盤水市自然資源局(http://zrzyj.gzlps.gov.cn)統(tǒng)計,至2021年年末,兩市共有具有變形跡象的地質(zhì)災害隱患點2 171處,占貴州全省的21.66%。其中滑坡隱患點950處,占貴州全省的19.62%(圖1)。

圖1 研究區(qū)與滑坡編目數(shù)據(jù)位置示意圖(基于貴州省自然資源廳標準地圖服務網(wǎng)站審圖號為黔S(2022)005號的標準地圖制作,底圖無修改)

1.2 脆弱性評估數(shù)據(jù)選取

本文所使用的數(shù)據(jù)如表1所示。基于災害系統(tǒng)的功能體系,本文從致災因子危險性、孕災環(huán)境敏感性以及承災體暴露三個維度,選取可能影響研究區(qū)暴雨—滑坡直接經(jīng)濟損失脆弱性的因子,共3個類別9個變量。

(1)致災因子指標。降雨強度指標直接影響著滑坡發(fā)生的可能性以及影響強度。本文選取降雨持續(xù)時間(D)、累積有效降雨量(CR)作為致災因子指標。其中CR考慮了距離災害發(fā)生時間點不同時間長度內(nèi)的降雨可能對滑坡發(fā)生的貢獻不同,計算公式為[16]:

(1)

式中:CR為累積有效降雨量,i為前期降雨的n個時段,Ri表示每個時段內(nèi)的降水量,α為經(jīng)驗降雨系數(shù),取0.8。

(2)孕災環(huán)境指標。不同地形地貌、植被覆蓋、水文條件、以及人類活動因素都可能對滑坡的發(fā)生產(chǎn)生不同的影響。本文選取高程(DEM)、NDVI、距水系距離(DS)和距道路距離(DR)作為脆弱性模型的孕災環(huán)境指標。

(3)承災體指標。通常,在人口和財富集中的地區(qū),災害可能導致的直接經(jīng)濟損失也會相對較高。本文采用GDP和人口密度(PP)作為脆弱性模型的承災體指標。

在得到各指標原始數(shù)據(jù)之后,將歷史暴雨—滑坡點分布與各指標空間分布圖疊加,提取災害點各指標的屬性值,共同構(gòu)成降雨—滑坡災害鏈直經(jīng)濟損失脆弱性評估的數(shù)據(jù)清單。其中直接經(jīng)濟損失折算為2015年基準價。

1.3 脆弱性評估方法

考慮到影響直接經(jīng)濟損失脆弱性的要素是多方面的,且不存在明顯的線性關(guān)系。為更好地建立致災因子強度—損失的關(guān)系,本文在脆弱性模型的選取中選擇基于決策樹算法的隨機森林、XGBoost機器學習算法進行定量評估,并進行評估效果的對比分析。

(1)決策樹算法(Decision Tree,DT)。決策樹算法本質(zhì)上是一個樹形結(jié)構(gòu)的算法,樹的節(jié)點代表對輸入因子要素的判斷,樹的分叉則代表對每一個判斷結(jié)果進行的輸出,通過多次的輸出過程得到了最后的葉節(jié)點則代表了模型最后輸出的結(jié)果。

決策樹算法常用于分類問題與回歸問題。當目標問題為回歸問題時,主要指CART回歸樹算法,其核心步驟為:

(2)

式中:yi為輸入樣本點的值,c1和c2分別為兩組樣本的輸出均值。式(2)表示在建立回歸樹時,對于任意用于劃分的樣本特征A,對應的任意的劃分點s兩邊劃分成的數(shù)據(jù)集D1和D2,求出一個使得D1和D2各自所對應的均方差最小,同時兩者均方差之和最小所對應的特征和特征值劃分點。通過輸入災害損失脆弱性的影響因素作為回歸樣本,建立非線性回歸模型,通過影響因素的屬性值實現(xiàn)對災害損失的預測。

(2)隨機森林模型(Random Forest,RM)。隨機森林算法是機器學習領(lǐng)域常用于分類問題和回歸問題的算法之一。通過隨機森林的回歸模塊可以實現(xiàn)對災害損失的預測,從而將其使用于災害脆弱性和風險評估中。

隨機森林算法也是基于決策樹的一種算法,不同的是,它是對多個決策樹的綜合運用,來避免單一決策樹容易出現(xiàn)的過擬合問題。用于回歸問題時,隨機森林由多個互不相關(guān)的回歸樹組成,且模型的最后輸出結(jié)果由每一個回歸樹來確定。

(3)極致梯度回歸模型(XGBoost)。XGBoost 是一種用于構(gòu)建監(jiān)督回歸模型的機器學習方法,屬于Boosting算法族GBDT(梯度提升決策樹)算法框架下中的一種。在目標問題為回歸問題時,目標函數(shù)包括梯度提升算法損失和正則化項:

(3)

表1 研究數(shù)據(jù)

表2 脆弱性變量相關(guān)性檢驗矩陣

在回歸問題中常使用reg:linear作為損失函數(shù),之后使用二階泰勒展開近似,在基于殘差的擬合條件下將目標函數(shù)改寫,使其最小化;而正則化項的處理需要將寫成樹結(jié)構(gòu)的形式,并代入目標函數(shù),得到最終優(yōu)化之后的目標函數(shù),即一個二次函數(shù),根據(jù)二次函數(shù)的性質(zhì)公式可以得到最優(yōu)的參數(shù)和目標函數(shù)最小值。

XGBoost由于其正則化,并行計算、引進特征子采樣等優(yōu)點,在避免過擬合的同時,又能減少計算,在處理災害損失預測等多元非線性回歸問題時有著較大的優(yōu)勢。

在進行模型模擬之后,本文采用RMSE(均方根誤差)、MAE(平均絕對誤差)和R2(確定性系數(shù))統(tǒng)計量對模型的擬合效果進行檢驗。其中R2越接近1表示擬合效果越好,反之則越差;RMSE和MAE統(tǒng)計量越接近0表示模型的擬合效果越好。

2 研究區(qū)降雨—滑坡災害鏈直接經(jīng)濟損失脆弱性評估結(jié)果與分析

2.1 變量篩選

在選取變量后,需要對變量的自相關(guān)性進行檢驗,以剔除具有較強相關(guān)性的變量。本文采用斯皮爾曼相關(guān)系數(shù)進行檢驗,該相關(guān)系數(shù)對數(shù)據(jù)的分布沒有要求,適用范圍廣。變量的相關(guān)性矩陣如表2所示。

基于多重共線性的考慮,不存在明顯與其它多個變量均相關(guān)的變量,因此,本文將8個指標均納入模型中進行計算。

2.2 基于機器學習模型的脆弱性評估結(jié)果對比分析

在得到降雨—滑坡災害鏈事件損失數(shù)據(jù)清單之后,將數(shù)據(jù)寫入模型進行訓練。其中,模型的相同類型參數(shù)應盡可能保持一致。本文中選取70%的樣本作為訓練集,30%的樣本作為預測集,構(gòu)建脆弱性預測模型:

Loss~f(D,CR,NDVI,DEM,DR,DS,GDP,PP)。

(4)

模型的訓練結(jié)果如表3所示。模型訓練結(jié)果顯示,隨機森林算法相比于決策樹算法擁有更高的精度,XGBoost算法在研究區(qū)的直接經(jīng)濟損失脆弱性評估中缺乏可靠性。

為了更直觀的展現(xiàn)模型的預測效果,使用模型測試集數(shù)據(jù)建立實際損失—預測損失曲線圖,其中y=x曲線(虛線)表示實際損失與預測損失重合線,即越靠近曲線,模型的預測效果越好。圖2展示了模擬預預測效果較好的隨機森林算法模型4(圖2a)以及決策樹算法模型1(圖2b)的實際損失與預測損失關(guān)系。

表3 不同機器學習算法得到的模型訓練結(jié)果比較

圖2 不同模型的實際損失—預測損失曲線

表4 不同模型事件測試集中損失極值區(qū)域預測的效果實例比較

圖2的散點圖表明,基于測試集的損失預測結(jié)果均落在了y=x曲線的兩側(cè),但對于損失的極大值和極小值的預測效果較差,損失的中位數(shù)附近預測結(jié)果較好。一方面,損失的極值本身就是相對小概率的事件;另一方面,已有的數(shù)據(jù)量條數(shù)較少限制了模型對于損失極值的預測效果。從散點圖的比較來看,決策樹算法的預測趨勢更接近于參照線y=x,總體預測效果要好,隨機森林方法雖然統(tǒng)計檢驗量表現(xiàn)較好,但在實際預測中偏離值仍然相對較大(表4)。

雖然基于機器學習算法的模型無法提供顯性關(guān)系的表達式,但可以通過對回歸分析中變量重要性的計算來比較不同影響因素之間的重要性關(guān)系。圖3是決策樹算法和隨機森林算法的變量重要性結(jié)果。

圖3 不同模型的變量重要性結(jié)果

兩類模型前四個重要解釋變量總解釋率均超過80%,但不同模型對變量重要性的識別不同。決策樹模型前四重要的解釋變量為NDVI、GDP、高程以及距河流距離,而隨機森林模型中累積有效降雨量(CR)是最為重要的變量,單一變量解釋率達到0.51,距道路距離(DR)變量次之,重要性只有0.15。人口密度因素(PP)在兩個模型中得到的變量重要性均低于0.05。根據(jù)變量重要性結(jié)果的分析,不同模型對于變量的識別也存在不同的結(jié)果。決策樹算法采用的是單一的樹狀結(jié)構(gòu)對應特征要素進行回歸結(jié)果的輸出,而隨機森林模型是隨機選取同時訓練多棵決策樹的集成學習算法,相比決策樹算法來說對非平衡和內(nèi)部偏差比較大的數(shù)據(jù)有更好的效果,在特征采樣過程中也更為復雜。因此決策樹與隨機森林輸出的變量重要性也不同,相比較而言,隨機森林方法能夠更好地反應不同變量對于最終損失值的貢獻程度。

對于數(shù)據(jù)相對較為不平衡的災害損失數(shù)據(jù)來說,隨機森林方法往往具有更好的效果。因此在應用脆弱性評估模型對區(qū)域脆弱性評估時,考慮區(qū)域的自然環(huán)境和社會條件特征也較為重要,進行多模型的比較,更有助于選取最適合目標評估區(qū)域的模型。

3 結(jié)論與討論

3.1 結(jié)論

本文通過對貴州省畢節(jié)、六盤水兩市的降雨—滑坡災害鏈事件的分析,基于決策樹、隨機森林和XGBoost機器學習算法,建立了定量的直接經(jīng)濟損失脆弱性評估模型。結(jié)果表明:

(1)隨機森林和決策樹方法具有相對較高的精度,最優(yōu)模型的R2分別為0.284和0.342,RMSE分別為7.92和7.59;

(2)模型均顯示出對損失極大值和極小值預測的不精確;

(3)不同的模型對脆弱性貢獻變量的重要性識別結(jié)果也不同。決策樹模型中脆弱性貢獻變量最為重要的是NDVI、GDP和高程,而隨機森林模型中則為累計有效降雨量和距道路距離。

3.2 討論

機器學習方法已經(jīng)在災害脆弱性評估領(lǐng)域得到使用,包括滑坡和其它災種的研究[15,17-18],但已有的基于機器學習的脆弱性評估重點在區(qū)域特征的空間分布,采用基于網(wǎng)格單元的評估,更多表征的是區(qū)域脆弱性的相對大小;或是基于行政單元進行多要素的社會脆弱性評估。本文的創(chuàng)新點在于,通過災害事件點的社會經(jīng)濟屬性數(shù)據(jù)與損失數(shù)據(jù),建立了基于災害事件的機器學習的降雨—滑坡脆弱性評估模型,從而實現(xiàn)了損失絕對值的評估,同時提供了可能的災害直接經(jīng)濟損失預測,從而提供更為精確的脆弱性評估。同時本文對比了多種機器學習算法,更好反映了不同算法在模型構(gòu)建中的差異。與傳統(tǒng)的致災因子—災情范式的脆弱性評估相比,機器學習方法擴展了評估的范圍,納入了更多影響區(qū)域災害損失的因素,能夠更全面的反映區(qū)域特點;而與傳統(tǒng)的滑坡脆弱性評估相比,本文通過降水要素與滑坡導致的損失在模型中的結(jié)合,提出了能夠運用于降雨—滑坡災害鏈的脆弱性評估模型。

基于本文的研究,結(jié)合現(xiàn)有的災害風險管理工作現(xiàn)狀,本文認為以下內(nèi)容仍然需要在之后的研究中得到重視:

(1)目前滑坡?lián)p失數(shù)據(jù)的獲取較為困難。自然災害的社會經(jīng)濟影響或風險評估需要翔實的損失數(shù)據(jù)作為基礎。在未來的研究工作中,需要重點關(guān)注如何建立可靠的損失數(shù)據(jù)收集和篩選機制,有關(guān)災害管理部門也應推進拓寬數(shù)據(jù)獲取渠道,建立統(tǒng)一可獲取的滑坡災害損失編目數(shù)據(jù)庫。

(2)對降雨—滑坡災害鏈的研究現(xiàn)有的重點仍然在致災過程中,關(guān)注滑坡可能導致的社會經(jīng)濟影響相關(guān)工作較少。本文的研究為可能的降雨—滑坡災害鏈綜合災害風險評估框架的構(gòu)建提供了可行的方法思路,以適應在自然災害影響不斷變化的大背景下災害風險管理工作的需要。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數(shù)模型及應用
p150Glued在帕金森病模型中的表達及分布
函數(shù)模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 大陆精大陆国产国语精品1024| 亚洲欧美人成人让影院| 成年人国产视频| 91九色视频网| 国产精品刺激对白在线| 九色视频线上播放| 欧美日韩成人| 全裸无码专区| 一区二区日韩国产精久久| 毛片免费试看| 亚洲三级片在线看| 久久一级电影| 99精品视频在线观看免费播放| 四虎永久在线精品影院| 福利在线一区| 欧美成a人片在线观看| 亚洲综合在线最大成人| 国产国模一区二区三区四区| 精品国产成人三级在线观看| 国产福利观看| 欧美黑人欧美精品刺激| 亚洲天堂日本| 欧美精品亚洲精品日韩专区| 一本大道在线一本久道| 国产成人午夜福利免费无码r| 熟妇丰满人妻av无码区| 国产AV毛片| 高清码无在线看| 18禁黄无遮挡免费动漫网站| 91福利在线看| 国产h视频免费观看| 久久亚洲日本不卡一区二区| 制服丝袜一区| 综合色88| 久久这里只有精品23| 久久久久久午夜精品| 精品精品国产高清A毛片| 国产毛片高清一级国语| 日韩二区三区| 亚洲一区二区成人| 日韩天堂网| 乱人伦视频中文字幕在线| 99精品国产电影| 波多野结衣一级毛片| 亚洲精品在线影院| 国产黄色片在线看| 午夜一级做a爰片久久毛片| 日韩区欧美区| 欧洲熟妇精品视频| 国产精品一线天| 国产福利2021最新在线观看| 精品国产一二三区| 精品国产欧美精品v| 日本少妇又色又爽又高潮| 亚洲一区无码在线| 国产精品偷伦视频免费观看国产 | 精品人妻系列无码专区久久| 色妞www精品视频一级下载| 日本午夜精品一本在线观看 | 欧美另类第一页| 免费无遮挡AV| 亚洲精品国产综合99久久夜夜嗨| 一级毛片免费不卡在线视频| 99在线观看免费视频| 激情影院内射美女| 国产精品蜜芽在线观看| 五月婷婷精品| 国产亚洲精品91| 亚洲91精品视频| 熟女视频91| 国产在线麻豆波多野结衣| 国产成本人片免费a∨短片| 麻豆国产原创视频在线播放| 一级毛片免费不卡在线| 欧美劲爆第一页| 久久毛片免费基地| 日韩国产精品无码一区二区三区| 无码精油按摩潮喷在线播放| 妇女自拍偷自拍亚洲精品| 成人免费午间影院在线观看| 国产高清无码麻豆精品| 国产一区二区免费播放|