劉亞靜, 劉紅健
(1.華北理工大學(xué)礦業(yè)工程學(xué)院, 唐山 063210; 2.唐山市資源與環(huán)境遙感重點(diǎn)實(shí)驗(yàn)室, 唐山 063210;3.河北省礦山生態(tài)修復(fù)工業(yè)技術(shù)研究院, 唐山 063210; 4.河北省礦業(yè)開(kāi)發(fā)與安全技術(shù)重點(diǎn)實(shí)驗(yàn)室, 唐山 063210)
地震是由地球板塊運(yùn)動(dòng)引起的地表振動(dòng)或破壞,會(huì)加大海嘯、滑坡、崩塌、地裂縫等次生災(zāi)害的發(fā)生概率[1],地震高發(fā)地帶往往也成為地質(zhì)災(zāi)害頻發(fā)區(qū)[2]。中國(guó)幅員遼闊,東西部位于板塊交界地帶,地殼活動(dòng)頻繁劇烈,復(fù)雜的地質(zhì)構(gòu)造為地質(zhì)災(zāi)害發(fā)育提供了孕災(zāi)條件,導(dǎo)致地震及地質(zhì)災(zāi)害頻發(fā)[3]。據(jù)統(tǒng)計(jì),中國(guó)2021年共發(fā)生5級(jí)以上地震37次,地質(zhì)災(zāi)害4 772起。因此,對(duì)地震帶災(zāi)害多發(fā)區(qū)進(jìn)行地質(zhì)災(zāi)害風(fēng)險(xiǎn)監(jiān)測(cè)和評(píng)價(jià),了解其空間易發(fā)性和控制因素對(duì)于制訂應(yīng)對(duì)策略以降低風(fēng)險(xiǎn)至關(guān)重要。
地質(zhì)災(zāi)害易發(fā)性是指在一定地質(zhì)環(huán)境條件下區(qū)域發(fā)生地質(zhì)災(zāi)害的概率[4],據(jù)應(yīng)急管理部的數(shù)據(jù)顯示,中國(guó)69%的國(guó)土面積存在較高滑坡、泥石流、崩塌等地質(zhì)災(zāi)害風(fēng)險(xiǎn),近10年因?yàn)?zāi)害導(dǎo)致的直接經(jīng)濟(jì)損失達(dá)4 000多億元。雖然中國(guó)每年在防災(zāi)減災(zāi)領(lǐng)域投入大量人力物力,但受限于經(jīng)濟(jì)發(fā)展和技術(shù)水平制約,取得效果有限[5]。地質(zhì)災(zāi)害易發(fā)風(fēng)險(xiǎn)研究經(jīng)歷了從地球觀測(cè)數(shù)據(jù)進(jìn)行實(shí)地調(diào)查及制圖到基于包括全球定位系統(tǒng)(global positioning system,GPS)、地理信息系統(tǒng)(geographic information system,GIS)、遙感(remote sensing,RS)的3S技術(shù)構(gòu)建地質(zhì)災(zāi)害風(fēng)險(xiǎn)評(píng)價(jià)體系的發(fā)展過(guò)程,主要可分為定性研究和定量研究[6]。目前主要的研究模型可分為以層次分析法(analytic hierarchy process,AHP)[7]、證據(jù)權(quán)[8]、信息量[9]為代表的統(tǒng)計(jì)分析模型及以隨機(jī)森林(random forest,RF)、神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)[10]、支持向量機(jī)(support vector machine,SVM)[11]等機(jī)器學(xué)習(xí)算法為代表的數(shù)學(xué)分析模型,以地理空間分析技術(shù)為載體,應(yīng)用于地質(zhì)災(zāi)害評(píng)價(jià)與監(jiān)測(cè)領(lǐng)域[12]。如楊銳等[13]以加權(quán)信息量的方法對(duì)榆社縣的地質(zhì)災(zāi)害易發(fā)性進(jìn)行分析評(píng)價(jià);Pei等[14]基于隨機(jī)森林模型分析了橫斷山區(qū)風(fēng)險(xiǎn)災(zāi)害的空間格局及控制因素;Han等[15]基于貝葉斯神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)了地震災(zāi)害鏈的危險(xiǎn)性制圖;丁茜等[16]建立了基于徑向基函數(shù)(adical basis function,RBF)核的多分類SVM評(píng)價(jià)模型運(yùn)用到滑塌易發(fā)性分析領(lǐng)域。
由于地質(zhì)條件的復(fù)雜性,地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)的指標(biāo)因子難以統(tǒng)一量化,而且傳統(tǒng)經(jīng)驗(yàn)統(tǒng)計(jì)分析評(píng)價(jià)模型在因子定權(quán)時(shí)大多采取等權(quán)或主觀判斷因子權(quán)重的方式,往往導(dǎo)致與因子實(shí)際權(quán)重不符,無(wú)法體現(xiàn)因子與地質(zhì)災(zāi)害間的關(guān)聯(lián)程度,導(dǎo)致最終結(jié)果與實(shí)際有較大誤差[17]。為了修正傳統(tǒng)經(jīng)驗(yàn)?zāi)P偷木窒扌?目前大多采用統(tǒng)計(jì)分析模型和數(shù)學(xué)分析相結(jié)合的方法,建立綜合評(píng)價(jià)模型來(lái)分析災(zāi)害易發(fā)性,代表性的有隨機(jī)森林-頻率比(RF-FR)模型[18]、信息量-SVM模型[19]、邏輯回歸-隨機(jī)森林(LR-RF)模型[20]等,相比于傳統(tǒng)模型,優(yōu)化的綜合評(píng)價(jià)模型往往具有更高的預(yù)測(cè)精度[4]。
信息量模型在避免主觀判斷的基礎(chǔ)上能夠反映因子對(duì)因變量的貢獻(xiàn)程度[9],客觀地反映評(píng)級(jí)結(jié)果,但其未考慮評(píng)價(jià)指標(biāo)權(quán)重,無(wú)法解釋指標(biāo)對(duì)因變量的貢獻(xiàn)程度[21]。而隨機(jī)森林(RF)作為基于集成學(xué)習(xí)的算法,是目前應(yīng)用廣泛的機(jī)器學(xué)習(xí)算法之一,具有泛化能力強(qiáng)、平衡誤差、處理高維數(shù)據(jù)的優(yōu)點(diǎn)[22]。因此,在信息量模型基礎(chǔ)上,建立信息量耦合隨機(jī)森林的綜合評(píng)價(jià)模型,以彌補(bǔ)單一模型的局限性。現(xiàn)以四川松潘-較場(chǎng)地震帶的平武縣為例,選取地形地貌特征、地層地質(zhì)條件、氣象水文、地震帶發(fā)育特征、土壤植被、人類工程活動(dòng)影響6個(gè)方面的22個(gè)影響因子,以信息量模型、信息量-AHP模型、信息量-RF 3種評(píng)價(jià)模型對(duì)研究區(qū)地質(zhì)災(zāi)害易發(fā)性進(jìn)行分析,探索適用地震帶區(qū)域的地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)方法,從而為當(dāng)?shù)貫?zāi)害預(yù)測(cè)及防治工作提供有效參考。
平武縣位于四川省綿陽(yáng)市西北部,地理坐標(biāo)31°59′31″N~33°02′41″N,103°50′31″E~104°59′13″E;屬于四川盆地西北部的盆周山區(qū),位居涪江上游,其地勢(shì)西北高、東南低,處于中國(guó)三大構(gòu)造域接合部位,中、新生代構(gòu)造運(yùn)動(dòng)強(qiáng)烈,具有典型的山地地貌,主要由近南北走向的岷山山脈、近東西走向的摩天嶺山脈和近北東至南西走向的龍門山脈組成,海拔1 000 m以上的山地占轄區(qū)面積的90%以上,地勢(shì)起伏突出,高差懸殊,因地處中緯度地帶,地貌受控于地質(zhì)構(gòu)造,因此地形地貌多樣。氣候?qū)儆诒眮啛釒降貪駶?rùn)季風(fēng)氣候,降水充足,氣候溫和,年平均降水量約866 mm。全縣面積約5 950 km2,大部分地區(qū)處于松潘-較場(chǎng)地震帶,屬于地震及地質(zhì)災(zāi)害頻發(fā)區(qū),近期最嚴(yán)重的是3·16平武7.2級(jí)大地震,崩塌、滑坡、泥石流等因斜坡巖土體運(yùn)動(dòng)導(dǎo)致的約占地質(zhì)災(zāi)害總數(shù)的83%。平武縣地理位置及災(zāi)害點(diǎn)分布如圖1所示。

圖1 研究區(qū)地理位置及災(zāi)害點(diǎn)分布Fig.1 Geographical location of the study area and distribution of disaster sites
地質(zhì)災(zāi)害數(shù)據(jù)來(lái)源于中科院資源環(huán)境科學(xué)與數(shù)據(jù)中心的地質(zhì)災(zāi)害點(diǎn)空間分布數(shù)據(jù);數(shù)字高程模型(digital elevation model,DEM)數(shù)據(jù)來(lái)源于國(guó)家地理空間數(shù)據(jù)云的GDEMV3 30 m高程數(shù)據(jù)集,用以坡度、坡向、剖面曲率、地形粗糙度、地形起伏度、坡向變率、河網(wǎng)及地形濕度指數(shù)(topographic wetness index,TWI)等指標(biāo)因子的提取;降水量、斷層分布、地震點(diǎn)歷史數(shù)據(jù)來(lái)源于國(guó)家地球系統(tǒng)科學(xué)數(shù)據(jù)中心;地震動(dòng)峰值加速度數(shù)據(jù)是基于《中國(guó)地震動(dòng)參數(shù)區(qū)劃圖》(GB 18306—2015)矢量化制作;土壤侵蝕數(shù)據(jù)來(lái)源于中科院李佳蕾等[23]制作的中國(guó)水蝕區(qū)土壤侵蝕數(shù)據(jù)集;地貌類型來(lái)源Hartmann等[24]的30 m精度地貌類型柵格數(shù)據(jù)集;地層巖性數(shù)據(jù)是由Sayre等[25]的250 m精度柵格數(shù)據(jù)重采樣得到;土壤類型數(shù)據(jù)來(lái)源于中國(guó)土壤數(shù)據(jù)庫(kù);精細(xì)地表覆蓋數(shù)據(jù)來(lái)自劉良云、張肖制作的全球30 m精細(xì)地表覆蓋產(chǎn)品;路網(wǎng)、興趣點(diǎn)(point of interest,POI)矢量數(shù)據(jù)基于網(wǎng)絡(luò)爬蟲(chóng)獲取。
層次分析法(AHP)是一種基于多目標(biāo)決策問(wèn)題而提出的一種層次權(quán)重決策分析方法[26]。根據(jù)決策者的經(jīng)驗(yàn)判斷比較確定權(quán)重,從而為多目標(biāo)、多準(zhǔn)則或無(wú)結(jié)構(gòu)特性的復(fù)雜決策問(wèn)題提供簡(jiǎn)便的決策方法[27]。
層次分析法被廣泛應(yīng)用于復(fù)雜決策分析問(wèn)題。其核心過(guò)程為:根據(jù)1~9標(biāo)度法構(gòu)造出判斷矩陣對(duì)評(píng)價(jià)指標(biāo)兩兩進(jìn)行比較,最終確定各指標(biāo)因子的相對(duì)權(quán)重。用一致性比率(CR)來(lái)檢驗(yàn)判斷矩陣合理性,當(dāng)CR<0.1時(shí),認(rèn)為判斷矩陣一致性較好,即通過(guò)一致性檢驗(yàn)。其公式為

(2)
式中:λmax為最大特征值;N為唯一非0特征根,即判斷矩陣的維數(shù);CI為定義的一致性指標(biāo),當(dāng)CI=0,有完全的一致性,CI接近于0,有滿意的一致性;CI越大,不一致越嚴(yán)重;RI為引入的隨機(jī)一致性指標(biāo)。
信息量模型,又稱雙變量統(tǒng)計(jì)模型[17],是以信息論、概率論和數(shù)理統(tǒng)計(jì)方法為基礎(chǔ),以信息熵的概念通過(guò)信息量值表示地災(zāi)影響因子的各個(gè)指標(biāo)要素對(duì)地質(zhì)災(zāi)害的貢獻(xiàn)程度,基于信息值分析地質(zhì)災(zāi)害易發(fā)性的模型。通過(guò)指標(biāo)分級(jí),分析各指標(biāo)因素等級(jí)對(duì)地質(zhì)災(zāi)害發(fā)生的“貢獻(xiàn)率”,來(lái)判斷地質(zhì)災(zāi)害發(fā)生難易程度,即I值。當(dāng)信息量大于0時(shí),表示該地區(qū)發(fā)生地質(zhì)災(zāi)害的可能性較高;反之,當(dāng)信息量小于0時(shí),表示該地區(qū)發(fā)生地質(zhì)災(zāi)害的可能性較低;信息量為0,表示該地區(qū)未發(fā)生地質(zhì)災(zāi)害,可去除不作為預(yù)測(cè)要素。其表達(dá)式為

(3)
式(3)中:I為n種評(píng)價(jià)因子的總信息量值;Iij為第i個(gè)評(píng)價(jià)因子在第j分類下的信息量;Nij為第i個(gè)評(píng)價(jià)因子在第j分類下的地質(zhì)災(zāi)害點(diǎn)數(shù)量;Sij為第i個(gè)評(píng)價(jià)因子在第j分類下的評(píng)價(jià)單元數(shù)量;N為該地區(qū)地質(zhì)災(zāi)害點(diǎn)總數(shù)量;S為研究區(qū)內(nèi)評(píng)價(jià)單元總數(shù)。
隨機(jī)森林(RF)是由Leo Breiman和Adele Cutler提出的一種基于Bagging思想,根據(jù)多決策樹(shù)進(jìn)行分類和回歸的集成學(xué)習(xí)算法[28]。其由多棵決策樹(shù)構(gòu)成,每棵決策樹(shù)都取決于獨(dú)立采樣的隨機(jī)向量值,其原理模型在進(jìn)行分類預(yù)測(cè)時(shí)會(huì)根據(jù)N個(gè)樣本建立N個(gè)獨(dú)立的決策樹(shù)作為基分類器,并基于Bootstrap抽樣算法對(duì)初始訓(xùn)練集進(jìn)行多次抽樣,從訓(xùn)練集中有放回地隨機(jī)抽取,得到N種分類結(jié)果,通過(guò)每顆決策樹(shù)對(duì)每個(gè)記錄采用投票方式進(jìn)行判斷選擇最優(yōu)分類結(jié)果[29]。其模型公式為

(4)
式(4)中:F(X)為RF模型;fi(X)為某個(gè)單獨(dú)決策樹(shù)模型;Z為輸出變量(目標(biāo)變量);I為示性函數(shù)。
相比于單一決策樹(shù),隨機(jī)森林通過(guò)對(duì)樣本和特征隨機(jī)采樣的方法能夠明顯提高易發(fā)性評(píng)價(jià)模型的精度和穩(wěn)定性[30],且對(duì)大數(shù)據(jù)集、多維數(shù)據(jù)有強(qiáng)大的泛化能力,對(duì)異常值和噪聲等具有很強(qiáng)的容錯(cuò)率[31],并且每棵樹(shù)的訓(xùn)練樣本及節(jié)點(diǎn)的分裂屬性均為隨機(jī)選取,在其交互作用下避免了模型的過(guò)擬合效應(yīng)[32],成為應(yīng)用最為廣泛的機(jī)器學(xué)習(xí)算法之一。
為了保證評(píng)價(jià)單元內(nèi)部的統(tǒng)一性與單元之間的差異性,需要對(duì)評(píng)價(jià)單元繼續(xù)統(tǒng)一劃分,目前常用的方法主要有柵格單元、斜坡單元、子流域單元等[33]。其中,柵格和斜坡單元大多應(yīng)用于地質(zhì)災(zāi)害的易發(fā)性評(píng)價(jià)中。采用的基礎(chǔ)數(shù)據(jù)比例尺為1∶50 000,根據(jù)地質(zhì)災(zāi)害特征及危害范圍,在參考前人研究經(jīng)驗(yàn)的基礎(chǔ)上,采取30 m×30 m的柵格單元進(jìn)行平武縣地質(zhì)災(zāi)害易發(fā)評(píng)價(jià)模型,在ArcGIS軟件中共劃分6 613 214個(gè)基礎(chǔ)柵格單元,如圖2所示。

圖2 柵格單元?jiǎng)澐质疽鈭DFig.2 Grid cell division diagram
地質(zhì)災(zāi)害的誘發(fā)原因是多種影響因素共同作用的結(jié)果,基于平武縣孕災(zāi)地質(zhì)條件及人文環(huán)境,結(jié)合地質(zhì)災(zāi)害發(fā)育特征等,主要從地形地貌特征、地層地質(zhì)條件、氣象水文、地震帶發(fā)育特征、土壤植被、人類工程活動(dòng)影響等六大控制因素選取指標(biāo)因子,共計(jì)選取22項(xiàng)指標(biāo),如圖3所示。

圖3 評(píng)價(jià)指標(biāo)因子結(jié)構(gòu)圖Fig.3 Evaluation index factor structure chart
3.2.1 地形地貌
地形地貌是地質(zhì)災(zāi)害的基礎(chǔ)控制因素,主要分為兩類,一類以DEM高程數(shù)據(jù)為基礎(chǔ)、基于ArcGIS軟件空間分析功能提取坡度、坡向、剖面曲率、坡向變率、地形粗糙度、地形起伏度6類地形因子,用來(lái)說(shuō)明平武縣地表區(qū)域地形特征。其次為地貌類型分布特征。由圖4可知,平武縣地勢(shì)西高東低,最低點(diǎn)與最高點(diǎn)高差達(dá)4 752 m,山地溝壑縱橫,地表起伏度較大,地貌以中高海拔大起伏山地為主。
3.2.2 地層地質(zhì)條件
地層地質(zhì)條件主要包括地層巖性及斷裂帶分布,是地質(zhì)災(zāi)害發(fā)育的重要內(nèi)在因素,影響災(zāi)害的發(fā)育程度及規(guī)模特征。平武縣地層巖性以混合沉積巖和硅質(zhì)碎屑沉積巖為主,災(zāi)害點(diǎn)主要分布在東南部的混合沉積巖地層中。地質(zhì)構(gòu)造控制巖層的巖體結(jié)構(gòu)及其組合特征,對(duì)地質(zhì)災(zāi)害的發(fā)育起綜合控制作用,研究以距斷層距離來(lái)表達(dá)斷裂帶對(duì)地質(zhì)災(zāi)害的影響程度,平武縣的斷裂帶主要中部及東部地區(qū),以500 m為步長(zhǎng)建立多環(huán)緩沖區(qū)將距斷層距離分為5類,其中,東部地區(qū)位于平武-青川斷裂帶,這一地帶災(zāi)害點(diǎn)分布較為密集,且主要集中分布在距斷層2 000 m范圍內(nèi)。
3.2.3 氣象水文
氣象水文指標(biāo)包括地形濕度指數(shù)(TWI)、河網(wǎng)密度、年降水量,TWI是指區(qū)域地形對(duì)徑流流向和蓄積影響,能夠定量描述區(qū)域地表水分的空間分布情況。降水和河流侵蝕作為滑坡、泥石流的主要誘發(fā)因素之一,水力沖刷及侵蝕作用加大了災(zāi)害發(fā)生概率。使用ArcGIS基于DEM數(shù)據(jù)提取平武縣河網(wǎng)分布,并基于核密度分析計(jì)算河網(wǎng)密度,平武縣年降水量較高,導(dǎo)致其河網(wǎng)水系發(fā)達(dá),在起伏較大地區(qū)極易發(fā)生滑坡和泥石流危害。
3.2.4 地震帶發(fā)育特征
平武縣屬于亞歐板塊和印度洋板塊的分界地帶,屬于四川境內(nèi)的松潘-較場(chǎng)地震帶,地震及板塊運(yùn)動(dòng)活躍。選取地震點(diǎn)密度、地震烈度、地震動(dòng)峰值加速度3個(gè)指標(biāo)體現(xiàn)地震帶發(fā)育特征對(duì)災(zāi)害易發(fā)性的影響。通過(guò)地震點(diǎn)密度體現(xiàn)地殼活躍程度對(duì)地表微型變化的影響。地震烈度作為衡量地震強(qiáng)度的重要指標(biāo),用來(lái)說(shuō)明地震對(duì)地表及工程建筑物等的影響程度,而地震加速度值是指地震時(shí)地面運(yùn)動(dòng)的加速度,用作輔助確定烈度的依據(jù)。平武縣歷史地震點(diǎn)的震源中心大多集中在東南部,地震點(diǎn)密度和地震烈度也顯著高于西北部地區(qū),其分布特征與地質(zhì)災(zāi)害分布呈現(xiàn)相似性。
3.2.5 土壤植被
植被覆蓋能有效降低產(chǎn)流產(chǎn)沙量,減少?gòu)搅髁?改善土壤理化性質(zhì),提高土壤抗侵蝕能力,與土壤協(xié)同提高地表水土保持能力,降低滑坡、泥石流災(zāi)害等發(fā)生概率。土壤植被指標(biāo)主要包括歸一化植被指數(shù)(normalized difference vegetation index,NDVI)、精細(xì)地表覆蓋類型、土壤類型、土壤侵蝕率。根據(jù)圖4、圖5的分布特征可知,平武縣NDVI平均值為0.84,整體植被覆蓋水平較高。境內(nèi)土壤類型主要有黃棕壤、暗棕壤、黑氈土等,以黃棕壤為代表的壤土約占總面積的87.15%。不同植被對(duì)水土的保持能力不同,其地表覆蓋類型以常綠闊葉林、落葉闊葉林為主,地質(zhì)災(zāi)害主要集中在以森林為主體的不透水表面、水體附近。土壤侵蝕是指土壤在水力、風(fēng)力等外力作用下,被破壞、剝蝕和搬運(yùn)的過(guò)程,土壤侵蝕速率體現(xiàn)出單位面積時(shí)間內(nèi)的土壤侵蝕程度,平武縣土壤侵蝕率較高的地區(qū)集中在西北至東南的走廊地帶以及東南地帶的龍門山脈地帶。
3.2.6 人類工程活動(dòng)
人類工程活動(dòng)包括興趣點(diǎn)(POI)密度和距道路距離,頻繁的工程建設(shè)活動(dòng)會(huì)改變斜坡應(yīng)力狀態(tài)及降低邊坡穩(wěn)定性,平武縣以山地為主,頻發(fā)的崩滑流災(zāi)害對(duì)道路安全性具有重大威脅,伴隨其多雨氣候極易產(chǎn)生不穩(wěn)定斜坡增加危險(xiǎn)性。以平武縣路網(wǎng)分布為基礎(chǔ),根據(jù)災(zāi)害體影響程度,與斷裂帶采取相同的分類方法以500 m步長(zhǎng)為分類標(biāo)準(zhǔn)建立緩沖區(qū),研究區(qū)POI高密度區(qū)集中在中部及東南部,其中,東南部為災(zāi)害集中區(qū)。
為了避免因子間多重共線性對(duì)評(píng)價(jià)模型的復(fù)合影響,從而降級(jí)預(yù)測(cè)精度,對(duì)選取的22個(gè)評(píng)價(jià)指標(biāo)進(jìn)行相關(guān)性分析,以剔除相關(guān)性較高的因子。當(dāng)因子相關(guān)性絕對(duì)值系數(shù)大于0.5時(shí),相關(guān)性較強(qiáng),即認(rèn)為因子間存在多種共線性,應(yīng)剔除該因子;反之,因子相關(guān)性絕對(duì)值系數(shù)小于0.5,即相關(guān)性較低,因子間基本不會(huì)相互影響,可用于模型的預(yù)測(cè)分析。根據(jù)相關(guān)性分析結(jié)果可知,地形粗糙度、地形起伏度與坡度,距道路距離、地貌類型與DEM,年降水量、精細(xì)地表覆蓋類型與地震動(dòng)峰值加速度的相關(guān)性均大于0.5,因此,將DEM、地形粗糙度、地形起伏度與地震動(dòng)峰值加速度4項(xiàng)指標(biāo)剔除,最終得到18項(xiàng)指標(biāo)進(jìn)行地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)分析。
利用信息量模型將各評(píng)價(jià)因子狀態(tài)劃分,將數(shù)值連續(xù)狀態(tài)因子分為十級(jí),其余因子根據(jù)各分級(jí)統(tǒng)計(jì)計(jì)算各評(píng)價(jià)因子各分級(jí)狀態(tài)的信息量,信息量數(shù)值越大表示對(duì)地質(zhì)災(zāi)害發(fā)生的影響程度越高,計(jì)算得到各指標(biāo)因子各等級(jí)的信息量值,疊加得到柵格對(duì)于地質(zhì)災(zāi)害的總信息量值,將結(jié)果歸一化后根據(jù)概率比值按照自然間斷分級(jí)劃分為極高、高、中、低和極低5個(gè)易發(fā)區(qū)等級(jí),如圖6所示。

圖6 基于信息量模型的災(zāi)害易發(fā)性分區(qū)圖Fig.6 Disaster susceptibility partition map based on information volume model
在信息量模型的基礎(chǔ)上,采用層次分析法(AHP)根據(jù)專家打分對(duì)18個(gè)因子進(jìn)行重要性排序, 根據(jù)構(gòu)造的判斷矩陣計(jì)算各指標(biāo)因子權(quán)重,一致性檢驗(yàn)結(jié)果CR=0.033<0.1,一致性檢驗(yàn)通過(guò),對(duì)信息量進(jìn)行加權(quán)疊加。同上將結(jié)果歸一化后采用自然間斷法將AHP-信息量模型結(jié)果分為5類等級(jí),如圖7所示。

圖7 基于信息量-AHP模型的災(zāi)害易發(fā)性分區(qū)圖Fig.7 Disaster susceptibility partition map based on information-AHP model
平武縣共395處地質(zhì)災(zāi)害點(diǎn),在此基礎(chǔ)上,隨機(jī)選取3倍于地質(zhì)災(zāi)害點(diǎn)的1 185個(gè)非地質(zhì)災(zāi)害點(diǎn)作為反向訓(xùn)練樣本,根據(jù)隨機(jī)森林模型的分類要求,將發(fā)生過(guò)地質(zhì)災(zāi)害的其余劃分為一類,記為“1”,未發(fā)生過(guò)地質(zhì)災(zāi)害的其余劃分為另外一類,記為“0”,以此將地質(zhì)災(zāi)害易發(fā)性研究問(wèn)題轉(zhuǎn)變?yōu)槎诸悊?wèn)題。共計(jì)1 580個(gè)訓(xùn)練樣本,在劃分基礎(chǔ)數(shù)據(jù)集為訓(xùn)練集與測(cè)試集的過(guò)程中,訓(xùn)練集與測(cè)試集的比率劃分不恰當(dāng)會(huì)影響模型的預(yù)測(cè)精度,因此參考相關(guān)文獻(xiàn)研究,將樣本集按照7∶3的比例劃分,即選取70%的樣本點(diǎn)作為訓(xùn)練數(shù)據(jù),30%的樣本點(diǎn)作為測(cè)試數(shù)據(jù)。經(jīng)過(guò)模型訓(xùn)練并獲取各指標(biāo)因子的客觀權(quán)重,經(jīng)預(yù)測(cè)得到信息量-RF模型的易發(fā)性預(yù)測(cè)結(jié)果,同上分為5類,如圖8所示。

圖8 基于信息量-RF模型的災(zāi)害易發(fā)性分區(qū)圖Fig.8 Disaster susceptibility zoning map based on information volume-RF model
AHP與RF都對(duì)指標(biāo)因子的重要性進(jìn)行分析,兩種模型的因子重要性對(duì)比如圖9所示。由圖9可知,AHP分析的因子重要性前三位為距道路距離、地震烈度、地震點(diǎn)密度,RF對(duì)訓(xùn)練樣本分析的因子重要性前三位為地震點(diǎn)密度、土壤類型、距道路距離,地震點(diǎn)密度和據(jù)道路距離作為兩種方法公認(rèn)的高貢獻(xiàn)指標(biāo),能更好地描述平武縣典型山地區(qū)地形因素對(duì)崩滑流等災(zāi)害的誘發(fā)條件,RF模型分析的因子貢獻(xiàn)率兩極分化較為明顯,前五項(xiàng)指標(biāo)的客觀權(quán)重達(dá)71.37%,AHP分析的因子權(quán)重呈現(xiàn)梯度下降的趨勢(shì),并未出現(xiàn)斷崖式差距。

圖9 AHP與RF指標(biāo)因子重要性比對(duì)Fig.9 Comparison of importance of AHP and RF index factors
從3種模型的結(jié)果可知,其地質(zhì)災(zāi)害易發(fā)性分區(qū)呈現(xiàn)出相似的空間分布,極高易發(fā)區(qū)主要分布在東南部的水觀鄉(xiāng)、南壩鎮(zhèn)、響巖鎮(zhèn)等地,以及在中部以龍安和古城鎮(zhèn)為中心向周圍分散的條帶分布,大部分極高易發(fā)區(qū)屬于高山河谷地帶,涪江的支流水系貫穿此地,暴雨和洪水災(zāi)害較多,其引發(fā)的泥石流、滑坡也較為集中,其次,龍門山斷裂帶貫穿此地,地震頻發(fā)導(dǎo)致的地表運(yùn)動(dòng)劇烈也是重要的誘發(fā)原因,應(yīng)對(duì)此地重點(diǎn)防治及監(jiān)測(cè)。高易發(fā)區(qū)重要集中在極高易發(fā)區(qū)的邊緣地帶,以壩子鄉(xiāng)、豆叩鎮(zhèn)、大印鎮(zhèn)分布最廣,大多位于斷裂帶邊緣,地質(zhì)災(zāi)害較為集中,可作為次防治區(qū)觀察。總體上平武縣的地質(zhì)災(zāi)害易發(fā)特征表現(xiàn)為西北低風(fēng)險(xiǎn)、東南高風(fēng)險(xiǎn)及中部條帶性的聚集性分布,但相較于另外兩種評(píng)價(jià)模型,信息量-RF模型的極高和高易發(fā)區(qū)范圍較小,地質(zhì)災(zāi)害點(diǎn)分布密度也更為聚集。為更直觀進(jìn)行對(duì)比分析,對(duì)3種模型的分類結(jié)果進(jìn)行分區(qū)統(tǒng)計(jì),結(jié)果如表1所示。

表1 分區(qū)統(tǒng)計(jì)結(jié)果
從對(duì)比結(jié)果來(lái)看,信息量-RF模型預(yù)測(cè)的高易發(fā)區(qū)和極高易發(fā)區(qū)面積分別為506.40 km2和194.84 km2,面積綜合占比為11.84%,低于信息量模型的30.70%和信息量-AHP模型的29.54%;信息量-RF模型的高易發(fā)區(qū)含有88個(gè)災(zāi)害點(diǎn),占比22.28%,災(zāi)害點(diǎn)密度為0.174 個(gè)/km2,極高易發(fā)區(qū)含有283個(gè)災(zāi)害點(diǎn),占比71.65%,災(zāi)害點(diǎn)密度為1.452 個(gè)/km2,高和極高易發(fā)區(qū)共包含了總災(zāi)害點(diǎn)的93.92%,災(zāi)害點(diǎn)占比與其余兩種模型接近,但從災(zāi)害點(diǎn)密度對(duì)比結(jié)果分析來(lái)看,信息量-RF模型要顯著優(yōu)于另外兩種模型,尤其在極高易發(fā)區(qū),這種差異更為明顯。災(zāi)害發(fā)生率體現(xiàn)了模型預(yù)測(cè)的相對(duì)準(zhǔn)確性,發(fā)生率越高,說(shuō)明地區(qū)災(zāi)害點(diǎn)更為集中,發(fā)生地質(zhì)災(zāi)害的相對(duì)概率也更大,對(duì)防治區(qū)劃等級(jí)劃分具有重大作用。信息量-RF模型預(yù)測(cè)的高易發(fā)區(qū)和極高易發(fā)區(qū)的發(fā)生率分別為2.032和44.146,要明顯高于信息量模型(0.497,3.490)和信息量-AHP模型(0.514,4.104),信息量-AHP模型經(jīng)過(guò)加權(quán)優(yōu)化后,相比于等權(quán)評(píng)價(jià)的信息量模型,其災(zāi)害點(diǎn)密度、災(zāi)害發(fā)生率要優(yōu)于信息量模型,但這種提升是有限的。從整體結(jié)果來(lái)看,3種模型分區(qū)結(jié)果符合災(zāi)害點(diǎn)分布特征,高和極高易發(fā)區(qū)都解釋了約90%的地質(zhì)災(zāi)害分布,而相比于等權(quán)信息量評(píng)定,經(jīng)專家打分修正權(quán)重的信息量-AHP模型對(duì)比分析結(jié)果要略優(yōu)于信息量模型,但相比于信息量-RF,其無(wú)論在災(zāi)害集中程度,分區(qū)的精確程度均優(yōu)于其余兩種模型,但其在極低易發(fā)區(qū)存在極少的災(zāi)害點(diǎn)數(shù)量,可能是對(duì)指標(biāo)進(jìn)行了過(guò)度擬合,導(dǎo)致與實(shí)際結(jié)果不符,在劃分防治區(qū)劃,應(yīng)合理地進(jìn)行人為規(guī)避,整體來(lái)看,信息量-RF模型的評(píng)價(jià)結(jié)果精準(zhǔn)度較高,滿足預(yù)期。
為了進(jìn)一步檢驗(yàn)易發(fā)性評(píng)價(jià)模型的準(zhǔn)確度和預(yù)測(cè)能力,采用受試者工作特征曲線(receiver operating characteristics,ROC)對(duì)3種模型的預(yù)測(cè)性能進(jìn)行檢驗(yàn),以曲線下的面積(area under curve,AUC)對(duì)模型進(jìn)行評(píng)價(jià)。AUC表示曲線下方與坐標(biāo)軸圍成的面積,其中,X軸為假陽(yáng)性率,即1-特異性,表示非災(zāi)害點(diǎn)被錯(cuò)誤預(yù)測(cè)的概率;Y軸為真陽(yáng)性率,即敏感性,表示災(zāi)害點(diǎn)被正確預(yù)測(cè)的概率,曲線越靠近左上角,面積越接近于1,說(shuō)明模型分類的準(zhǔn)確率越高,預(yù)測(cè)結(jié)果越正確。如圖10所示,信息量模型、信息量-AHP模型、信息量-RF模型的的AUC值分別為0.920、0.931和0.991,信息量-RF模型的預(yù)測(cè)精度高于其余兩個(gè)模型,說(shuō)明基于信息量耦合隨機(jī)森林的綜合易發(fā)性評(píng)價(jià)模型比單一信息量模型、信息量-AHP模型更適用于預(yù)測(cè)類平武縣的地質(zhì)災(zāi)害易發(fā)性。

圖10 ROC曲線評(píng)價(jià)模型對(duì)比Fig.10 Comparison of ROC curve evaluation models
以松潘-較場(chǎng)典型地震帶的平武縣為例,充分考慮孕災(zāi)地質(zhì)環(huán)境因素,從地形地貌特征、地層地質(zhì)條件、氣象水文、地震帶發(fā)育特征、土壤植被、人類工程活動(dòng)影響6個(gè)方面選取了22項(xiàng)地質(zhì)災(zāi)害的誘發(fā)因子,采用信息量模型、信息量-AHP模型、信息量-RF模型對(duì)平武縣地質(zhì)災(zāi)害進(jìn)行易發(fā)性評(píng)價(jià),得出結(jié)論如下。
(1)從分區(qū)統(tǒng)計(jì)對(duì)比結(jié)果來(lái)看,信息量-RF模型的高和極高易發(fā)區(qū)的災(zāi)害點(diǎn)密度和災(zāi)害發(fā)生率最高,信息量-AHP模型次之,信息量模型最差,說(shuō)明采用信息量-RF的分類結(jié)果更具有針對(duì)性,能夠增加災(zāi)害防治效率,有針對(duì)性地作出預(yù)測(cè),防治成本較小。
(2)ROC精度分析結(jié)果顯示,信息量-RF模型的AUC值為0.991,高于信息量模型(0.920)和信息量-AHP模型(0.931),說(shuō)明基于信息量耦合隨機(jī)森林的綜合易發(fā)性評(píng)價(jià)模型比單一信息量模型、信息量-AHP模型更適用于預(yù)測(cè)類平武縣的地質(zhì)災(zāi)害易發(fā)性,具有較高的準(zhǔn)確性、穩(wěn)定性以及良好的預(yù)測(cè)功能。