999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于LR-RF模型的滑坡易發(fā)性評(píng)價(jià)*
——以銅川市耀州區(qū)為例

2022-09-19 07:38:38謝婉麗劉琦琦李嘉昊朱榮森
災(zāi)害學(xué) 2022年3期
關(guān)鍵詞:評(píng)價(jià)模型研究

穆 柯,謝婉麗,劉琦琦,嚴(yán) 明,楊 惠,李嘉昊,黃 煜,朱榮森

(1.西北大學(xué) 地質(zhì)學(xué)系,陜西 西安 710069;2.西北大學(xué) 大陸動(dòng)力學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710069)

我國(guó)疆域幅員遼闊,山地眾多,地形地貌復(fù)雜,長(zhǎng)期受到滑坡災(zāi)害的威脅。據(jù)統(tǒng)計(jì),2021年全國(guó)共發(fā)生滑坡2 335起,占全年發(fā)生地質(zhì)災(zāi)害總數(shù)的48.93%,為所有地災(zāi)種類之最。

耀州區(qū)是陜西省中部連接關(guān)中與陜北的交通節(jié)點(diǎn),也是重要的礦業(yè)基地,長(zhǎng)期以來(lái)對(duì)資源的不合理開(kāi)發(fā)導(dǎo)致滑坡災(zāi)害頻發(fā),阻礙著當(dāng)?shù)厣a(chǎn)建設(shè)與城市發(fā)展。針對(duì)滑坡的突發(fā)性與高危害性,科學(xué)的風(fēng)險(xiǎn)評(píng)價(jià)與防災(zāi)管理是減輕其損失的最佳方案,而對(duì)滑坡的易發(fā)性進(jìn)行精準(zhǔn)的劃分是滑坡防治與管理工作的重要一環(huán)。

經(jīng)過(guò)國(guó)內(nèi)外學(xué)者數(shù)十年來(lái)的研究,關(guān)于滑坡易發(fā)性研究的理論與技術(shù)日新月異,目前廣泛使用的方法主要為三種類型:層次分析(AHP)法[1]、加權(quán)線性組合法[2]等定性分析方法;信息量[3]、確定性系數(shù)(CF)[4]、模糊信息[5]等統(tǒng)計(jì)預(yù)測(cè)模型方法,BP神經(jīng)網(wǎng)絡(luò)[6]、邏輯回歸(LR)[7]、支持向量機(jī)(SVM)[8-9]、隨機(jī)森林(RF)[10]等機(jī)器學(xué)習(xí)模型。實(shí)例如許沖等基于層次分析法對(duì)汶川震區(qū)的滑坡進(jìn)行了易發(fā)性評(píng)價(jià)[11];謝婉麗等引入模糊信息法在大西安地區(qū)進(jìn)行了地質(zhì)災(zāi)害易發(fā)性區(qū)劃[12-13];NHU等人采用邏輯模型樹(shù)等五種機(jī)器學(xué)習(xí)方法對(duì)伊朗庫(kù)爾德斯坦省的滑坡進(jìn)行易發(fā)性預(yù)測(cè),并對(duì)結(jié)果進(jìn)行分析比較,最終認(rèn)為邏輯模型樹(shù)的評(píng)價(jià)精度最高[14];BEHNIA等人開(kāi)發(fā)了數(shù)據(jù)驅(qū)動(dòng)的隨機(jī)森林模型對(duì)育空地區(qū)的滑坡進(jìn)行了易發(fā)性評(píng)價(jià),認(rèn)為隨機(jī)森林在滑坡易發(fā)性評(píng)價(jià)中表現(xiàn)出色[15]。

近年來(lái),隨著滑坡易發(fā)性研究的深入與實(shí)際工作的展開(kāi),傳統(tǒng)評(píng)價(jià)方法的精度愈發(fā)難以滿足實(shí)際需求,越來(lái)越多的學(xué)者將目光轉(zhuǎn)向耦合模型,選擇合理的預(yù)測(cè)模型以提升預(yù)測(cè)精度是近幾年滑坡易發(fā)性研究的熱點(diǎn)領(lǐng)域。如BINH等人提出了一種徑向基函數(shù)與旋轉(zhuǎn)森林集成的耦合模型(RFRBF),并在實(shí)際案例中與其他五種機(jī)器學(xué)習(xí)模型進(jìn)行對(duì)比,認(rèn)為RFRBF的預(yù)測(cè)精度最高[16]。ZHENG等人在對(duì)日本山區(qū)的滑坡易發(fā)性評(píng)估中對(duì)比了四種集成學(xué)習(xí)算法(ML),其中SVM-boosting表現(xiàn)最佳,SVM-stacking的性能最低,表明耦合模型不一定會(huì)提升預(yù)測(cè)性能[17]。白志剛等人基于熵指數(shù)與隨機(jī)森林耦合模型對(duì)渝東北地區(qū)地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià),認(rèn)為耦合模型的加入明顯提升了預(yù)測(cè)精度[18]。上述案例表明不同預(yù)測(cè)模型的耦合不一定會(huì)提升滑坡易發(fā)性評(píng)價(jià)的精度,在實(shí)際應(yīng)用中的效果仍然存在爭(zhēng)議,尚未形成完整的理論體系。基于上述研究現(xiàn)狀,本文嘗試將LR-RF耦合模型應(yīng)用于耀州區(qū)的滑坡易發(fā)性評(píng)價(jià),用于檢驗(yàn)與傳統(tǒng)LR模型相比,耦合模型在實(shí)際評(píng)價(jià)中的預(yù)測(cè)精度是否有所提升。

邏輯回歸(LR)模型是廣泛應(yīng)用于地質(zhì)災(zāi)害領(lǐng)域的回歸分析模型,具有假設(shè)簡(jiǎn)單、數(shù)據(jù)要求低、輸出結(jié)果便捷等優(yōu)點(diǎn),廣泛應(yīng)用于統(tǒng)計(jì)建模領(lǐng)域[19],但是需要大量而準(zhǔn)確的數(shù)據(jù)對(duì)數(shù)學(xué)模型的構(gòu)建進(jìn)行支撐,當(dāng)數(shù)據(jù)較少時(shí),評(píng)價(jià)結(jié)果不準(zhǔn)確[20]。隨機(jī)森林(RF)模型是一種基于集成學(xué)習(xí)的算法,它通過(guò)隨機(jī)抽樣對(duì)多個(gè)決策樹(shù)進(jìn)行集成,使用投票機(jī)制進(jìn)行預(yù)測(cè)[21]。因此為了在較少量數(shù)據(jù)的前提下提高模型的預(yù)測(cè)精度,本研究將LR模型的空間屬性引入隨機(jī)森林模型中,以耀州區(qū)為研究區(qū),選取坡度等八個(gè)環(huán)境因子,建立二者的耦合模型(LR-RF)對(duì)研究區(qū)進(jìn)行滑坡易發(fā)性評(píng)價(jià),并與傳統(tǒng)LR模型評(píng)價(jià)結(jié)果進(jìn)行對(duì)比,以探討LR-RF耦合模型的預(yù)測(cè)性能及適用性,研究成果可以為當(dāng)?shù)氐幕路乐闻c風(fēng)險(xiǎn)管理工作提供理論支撐。

1 研究區(qū)概況

耀州區(qū)位于陜西省中部黃土高原與汾渭地塹的過(guò)渡地帶,處于108.579 0°~109.092 2°E,34.805 7°~35.220 8°N之間,面積1 617 km2,海拔236~1 732 m,氣候類型屬溫帶季風(fēng)氣候,年均降水量554.5 mm。區(qū)內(nèi)發(fā)育漆水河等五條主要河流,強(qiáng)烈的切割侵蝕作用塑造了區(qū)內(nèi)殘塬溝壑密布的地貌特征,全區(qū)大部分斜坡表面均為第四系黃土。

區(qū)內(nèi)共有滑坡災(zāi)點(diǎn)71處,其分布現(xiàn)狀見(jiàn)圖1。由圖1不難看出,研究區(qū)災(zāi)點(diǎn)多分布于河谷階地區(qū)與殘塬溝壑區(qū);按行政區(qū)劃則在天寶路街道最多。區(qū)內(nèi)復(fù)雜多變的地貌特征為滑坡發(fā)生提供了地形基礎(chǔ),遍布全區(qū)的濕陷性黃土等脆弱巖土體提供了物源條件,人類工程活動(dòng)是重要的誘發(fā)因素[22-24]。

圖1 滑坡點(diǎn)分布圖(審圖號(hào):陜S(2021)023號(hào),底圖無(wú)修改,下同)

2 評(píng)價(jià)因子選取與獨(dú)立性檢驗(yàn)

2.1 數(shù)據(jù)來(lái)源及評(píng)價(jià)單元?jiǎng)澐?/h3>

耀州區(qū)滑坡點(diǎn)數(shù)據(jù)來(lái)源于實(shí)地調(diào)查,地理環(huán)境等數(shù)據(jù)來(lái)源見(jiàn)表1。

表1 評(píng)價(jià)指標(biāo)數(shù)據(jù)來(lái)源

根據(jù)研究區(qū)滑坡分布特征與前人經(jīng)驗(yàn),本次易發(fā)性評(píng)價(jià)選擇30 m×30 m的柵格單元作為基本評(píng)價(jià)單元,在ArcGIS中將研究區(qū)劃分為大約181萬(wàn)個(gè)柵格單元。

2.2 評(píng)價(jià)因子選取

評(píng)價(jià)因子的選擇對(duì)評(píng)價(jià)分析至關(guān)重要,綜合分析研究區(qū)滑坡發(fā)育近況和影響要素,這里主要從地理環(huán)境、地質(zhì)環(huán)境、人類活動(dòng)三個(gè)方面出發(fā):

2.2.1 地理環(huán)境因子

(1)高程。研究區(qū)高程范圍為536 m~1 732 m,高差較大,不同高程區(qū)間對(duì)滑坡的作用程度有所不同,在ArcGIS中將其分為7級(jí)(圖2a)。

(2)坡度。研究區(qū)坡度分布范圍為0°~73°,坡度跨度區(qū)間較大,在ArcGIS中將其分為7級(jí)(圖2b)。

(3)坡向。研究區(qū)的坡向?yàn)?1°~360°,以45°為間隔對(duì)其進(jìn)行等距分級(jí)(圖2c)。

(4)距河流距離。距河流距離的大小對(duì)滑坡的發(fā)生影響較大,區(qū)內(nèi)五條河流及其支流均為渭河水系,多為NW-SE向。使用ArcGIS的歐式距離分析,以500 m為間隔將其劃分為5級(jí)(圖2d)。

(5)植被指數(shù)(NDVI)。植被指數(shù)由landsat8遙感影像通過(guò)軟件進(jìn)行地理校正、大氣輻射校正后計(jì)算獲取,其取值在[-1,1],NDVI與植被發(fā)育程度呈正相關(guān)。在ArcGIS中將其分為5級(jí)(圖2e)。

2.2.2 地質(zhì)環(huán)境因子

(1)工程地質(zhì)巖組。不同地層巖性的物理力學(xué)性質(zhì)對(duì)滑坡的誘發(fā)程度有顯著差異,強(qiáng)度較小的巖層對(duì)滑坡的誘發(fā)程度較高。根據(jù)研究區(qū)的地質(zhì)資料,研究區(qū)的地層巖性可分為五類巖組(圖2f)。

(2)距構(gòu)造距離。研究區(qū)地質(zhì)構(gòu)造主要為北部山區(qū)的三條背斜。使用ArcGIS的歐氏距離分析,以500 m為間隔將其劃分為5級(jí)(圖2g)。

2.2.3 人類活動(dòng)因子

(1)距道路距離。距道路距離的遠(yuǎn)近會(huì)對(duì)滑坡產(chǎn)生不同的影響,利用ArcGIS的歐氏距離算法,以200 m為間距對(duì)其進(jìn)行分級(jí)(圖2h)。

圖2 評(píng)價(jià)因子分級(jí)圖

表2 因子間相關(guān)系數(shù)表

2.3 評(píng)價(jià)因子的獨(dú)立性檢驗(yàn)

進(jìn)行評(píng)價(jià)前需要評(píng)估選取的評(píng)價(jià)因子的相關(guān)性,以保證因子間相互獨(dú)立不互相干涉。借助皮爾森系數(shù)(PCC)對(duì)各個(gè)因子進(jìn)行獨(dú)立性檢驗(yàn)[25]。假設(shè)樣本數(shù)據(jù)集(Ai,Bj)=(a1,b1),(a2,b2),…,(an,bn),則PCC計(jì)算公式如下:

(1)

當(dāng)0≤|PCC|<0.3時(shí),表明因子間線性不相關(guān);當(dāng)|PCC|≥0.3時(shí),表明因子間線性相關(guān)。計(jì)算結(jié)果顯示評(píng)價(jià)因子間的|PCC|均比0.3小,證明各因子之間線性不相關(guān)。

3 滑坡易發(fā)性評(píng)價(jià)方法

3.1 邏輯回歸(LR)模型

邏輯回歸(LR)模型可以在多組數(shù)據(jù)中構(gòu)建目標(biāo)數(shù)據(jù)的回歸關(guān)系,從而對(duì)目標(biāo)數(shù)據(jù)發(fā)生的概率進(jìn)行預(yù)測(cè)[26]。在滑坡易發(fā)性評(píng)價(jià)中,對(duì)滑坡發(fā)生賦值為1,滑坡未發(fā)生賦值為0,并將其作為邏輯回歸模型的目標(biāo)變量。記滑坡發(fā)生的概率為P,其計(jì)算公式為:

(2)

式中:β0,β1,β2,…,βn為邏輯回歸系數(shù);X1,X2,…,Xn為自變量;P為評(píng)估結(jié)果,即發(fā)生滑坡的概率。

3.2 隨機(jī)森林模型

隨機(jī)森林(RF)模型是一種最早由LEO Breiman提出的集成學(xué)習(xí)算法。其工作原理為:首先從建模數(shù)據(jù)中隨機(jī)抽取部分樣本,并生成對(duì)應(yīng)的樣本集和決策樹(shù);接著借助決策樹(shù)對(duì)抽取樣本集進(jìn)行訓(xùn)練,每棵決策樹(shù)都能獨(dú)立地得出預(yù)測(cè)結(jié)論;隨后匯總?cè)繘Q策樹(shù),組成RF算法,對(duì)新數(shù)據(jù)進(jìn)行分類和預(yù)測(cè)。模型輸出結(jié)果由全部決策樹(shù)的獨(dú)立結(jié)果投票產(chǎn)生,獲得票數(shù)最多的即為預(yù)測(cè)結(jié)果[27],其運(yùn)行結(jié)構(gòu)見(jiàn)圖3。

4 滑坡易發(fā)性評(píng)價(jià)

4.1 基于LR模型易發(fā)性評(píng)價(jià)

在進(jìn)行LR模型構(gòu)建之前,首先需要選取樣本數(shù)據(jù)構(gòu)建正負(fù)樣本集,正樣本為研究區(qū)的滑坡點(diǎn),即滑坡發(fā)生的樣本點(diǎn);負(fù)樣本為非滑坡點(diǎn),即滑坡不發(fā)生的樣本點(diǎn)。

采樣方法為:以研究區(qū)的71個(gè)滑坡點(diǎn)為建模正樣本,在其周圍建立1 000 m的緩沖區(qū),在緩沖區(qū)外以1:3的比例隨機(jī)生成213個(gè)點(diǎn)作為非滑坡點(diǎn)(負(fù)樣本)。71個(gè)正樣本與213個(gè)負(fù)樣本共同組成訓(xùn)練樣本,標(biāo)記滑坡點(diǎn)為1,非滑坡點(diǎn)為0。使用各因子的歸一化值作為模型指標(biāo):

(3)

(4)

式中:Sij為i因子j分級(jí)下的滑坡災(zāi)害影響面積,Sij′為該分級(jí)的總面積,Rij為求取歸一化指數(shù)Xn的中間變量,Rn為Rij的合集,Xn為歸一化指數(shù)。

將數(shù)據(jù)樣本導(dǎo)入R語(yǔ)言軟件中,使用glm函數(shù)構(gòu)建LR模型,運(yùn)算結(jié)果見(jiàn)表3。

表3 LR模型詳情表

由表3可知,各因子的顯著系數(shù)值均小于0.05,滿足獨(dú)立性條件,其預(yù)測(cè)發(fā)生滑坡的概率P為:

(5)

式中:X1j,X2j,X3j,…,X8j為單元格對(duì)應(yīng)的高程、坡度等8個(gè)評(píng)價(jià)因子通過(guò)式(3)和式(4)計(jì)算的歸一化值。在ArcGIS中完成式(5)的計(jì)算,得到研究區(qū)的滑坡發(fā)生概率,將其劃分為五級(jí),得到基于LR模型的滑坡易發(fā)性分區(qū)圖(圖4)。

圖4 基于LR模型的滑坡易發(fā)性分區(qū)圖

4.2 基于LR-RF耦合模型易發(fā)性評(píng)價(jià)

(1)樣本選取。與LR模型構(gòu)建類似,建立正負(fù)樣本集是RF模型構(gòu)建之前的首要步驟。因?yàn)閷?duì)研究區(qū)進(jìn)行預(yù)測(cè)之前不能確定滑坡易發(fā)區(qū)的空間位置,為了避免影響模型預(yù)測(cè)精度,非滑坡點(diǎn)的選取需要避開(kāi)滑坡易發(fā)區(qū)。在傳統(tǒng)的建模過(guò)程中,大多是通過(guò)在滑坡周圍建立緩沖區(qū),在緩沖區(qū)外選取非滑坡點(diǎn)作為負(fù)樣本[28]。鑒于滑坡發(fā)育的隨機(jī)性與地質(zhì)環(huán)境的復(fù)雜性,極大增加了負(fù)樣本的獲取難度。此處結(jié)合前文中獲得的LR模型易發(fā)性分區(qū),在其去除高易發(fā)區(qū)的剩余區(qū)域內(nèi)作為非滑坡點(diǎn)選取區(qū),以提升其為非滑坡點(diǎn)的概率,從而提升模型的預(yù)測(cè)精度。

根據(jù)前人經(jīng)驗(yàn),在構(gòu)建模型之前,采用1∶3的比例選取負(fù)樣本點(diǎn)[29]。在LR模型去除高易發(fā)區(qū)的區(qū)域選取非滑坡點(diǎn)213個(gè),與滑坡點(diǎn)71個(gè)共同組合為模型的正負(fù)樣本集,隨后以7∶3的比例將284個(gè)正負(fù)樣本劃分為201個(gè)訓(xùn)練樣本數(shù)據(jù)與83個(gè)測(cè)試樣本數(shù)據(jù)。

(2)參數(shù)選取。隨機(jī)森林模型只有在最優(yōu)參數(shù)組合下,才能發(fā)揮最理想的性能,預(yù)測(cè)效果才能達(dá)到最佳。在模型建立過(guò)程中,對(duì)預(yù)測(cè)精度影響最大的參數(shù)有兩個(gè):最大特征數(shù)(簡(jiǎn)稱mtry),其含義為組成隨機(jī)森林的每棵決策樹(shù)建立過(guò)程中可以使用的最大特征數(shù)量,其取值與參與模型構(gòu)建的因子數(shù)量有關(guān),本文選取了8種因子參與模型構(gòu)建,故最大特征數(shù)取值范圍為1~8的自然數(shù);決策樹(shù)數(shù)量(簡(jiǎn)稱ntree),即隨機(jī)森林算法中的決策樹(shù)數(shù)量[27],決策樹(shù)數(shù)量越多,模型誤差會(huì)趨于穩(wěn)定,計(jì)算量也會(huì)增加。因此,對(duì)選取最大特征數(shù)與決策樹(shù)數(shù)量的取值是建模的關(guān)鍵所在。

通過(guò)在R語(yǔ)言中進(jìn)行循環(huán)迭代,可得不同最大特征數(shù)下的OOB袋外誤差(圖5)。圖中OOB袋外誤差含義為隨機(jī)森林模型分類錯(cuò)誤的樣本占總樣本的比例,其值越小,即表明模型預(yù)測(cè)效果越好。由圖5可知,當(dāng)最大特征數(shù)取值為4時(shí),誤差最小,因此本次建模mtry取值為4。

圖5 特征數(shù)與袋外誤差關(guān)系圖

取最大特征數(shù)為4,在R語(yǔ)言中進(jìn)行迭代,獲得不同決策樹(shù)下的袋外誤差(圖6)。圖中1線是指在循環(huán)迭代中,樣本1(滑坡點(diǎn))被誤分類為0(非滑坡點(diǎn))的誤差,同理0線是指樣本0(非滑坡點(diǎn))被誤分類為1(滑坡點(diǎn))的誤差。由圖6可知,模型中三條曲線的預(yù)測(cè)誤差在決策樹(shù)數(shù)量取值為200時(shí)趨于穩(wěn)定,故在本此建模中ntree取值為200。

最終確定ntree取值為200,mtry取值為4進(jìn)行LR-RF模型的構(gòu)建。

圖6 OOB誤差迭代圖

(3)模型建立。使用上一步獲得的201個(gè)訓(xùn)練樣本數(shù)據(jù),在R語(yǔ)言中基于randomforest函數(shù)構(gòu)建RF模型,并將83個(gè)測(cè)試數(shù)據(jù)集代入以進(jìn)行精度測(cè)試。測(cè)試結(jié)果顯示,模型的預(yù)測(cè)準(zhǔn)確率為91.24%,kappa值為0.838 1,誤差為5.53%,表明模型預(yù)測(cè)精度較高[24]。混淆矩陣通過(guò)統(tǒng)計(jì)實(shí)際與模型預(yù)測(cè)結(jié)果的不一致性來(lái)評(píng)估模型精度,LR-RF模型的測(cè)試混淆矩陣如表4所示,在測(cè)試樣本中,62個(gè)非滑坡點(diǎn)預(yù)測(cè)成功60個(gè),預(yù)測(cè)失敗2個(gè),錯(cuò)誤率為3.2%;21個(gè)滑坡點(diǎn)預(yù)測(cè)成功18個(gè),預(yù)測(cè)失敗3個(gè),成功率為85.71%。

表4 混淆矩陣

(4)模型預(yù)測(cè)。經(jīng)過(guò)上述模型參數(shù)優(yōu)化,選取mtry為4,ntree為200,建立LR-RF模型,并將研究區(qū)全部181萬(wàn)個(gè)評(píng)價(jià)柵格數(shù)據(jù)導(dǎo)入訓(xùn)練好的模型中,輸出結(jié)果為模型預(yù)測(cè)研究區(qū)發(fā)生滑坡的概率。在ArcGIS中將其分為5級(jí),繪制基于LR-RF模型的滑坡易發(fā)性分區(qū)圖(圖7)。

圖7 基于LR-RF模型的滑坡易發(fā)性分區(qū)圖

5 滑坡易發(fā)性評(píng)價(jià)結(jié)果驗(yàn)證

將耀州區(qū)的滑坡點(diǎn)與兩種模型的滑坡易發(fā)性評(píng)價(jià)結(jié)果進(jìn)行疊加,從災(zāi)點(diǎn)密度和ROC曲線兩個(gè)方面對(duì)LR-RF模型與LR模型的滑坡易發(fā)性評(píng)價(jià)結(jié)果進(jìn)行驗(yàn)證。

5.1 易發(fā)性分區(qū)結(jié)果對(duì)比與分析

滑坡密度是各滑坡易發(fā)等級(jí)滑坡數(shù)量與該等級(jí)面積的比值,可以直觀地反應(yīng)不同的滑坡密度的差異[25]。在上文中已經(jīng)獲得LR模型與LR-RF模型的易發(fā)性分區(qū)結(jié)果,將已發(fā)生的地質(zhì)災(zāi)害點(diǎn)與獲得的易發(fā)性分區(qū)進(jìn)行統(tǒng)計(jì),統(tǒng)計(jì)結(jié)果見(jiàn)表5。從表5中可以清晰的看出,LR-RF模型的高易發(fā)區(qū)包含了42.35%的滑坡點(diǎn),高于LR模型的35.21%;在滑坡密度方面,LR-RF模型的滑坡密度為0.57處/ km2,也高于LR模型的0.34處/km2。由此可以說(shuō)明LR-RF模型的預(yù)測(cè)結(jié)果中易發(fā)性較高的地方滑坡點(diǎn)更密集,與實(shí)際災(zāi)點(diǎn)分布更貼合,有更高的預(yù)測(cè)成功率。

表5 滑坡易發(fā)性分區(qū)統(tǒng)計(jì)表

5.2 精度驗(yàn)證

在研究區(qū)已發(fā)生的滑坡中隨機(jī)選擇30%作為精度測(cè)試樣本,并建立500 m的緩沖區(qū),隨后在緩沖區(qū)外隨機(jī)生成相同數(shù)量的非滑坡點(diǎn),二者共同組成測(cè)試正負(fù)樣本,用于對(duì)上述兩種模型獲得的易發(fā)性評(píng)價(jià)結(jié)果精度的進(jìn)行對(duì)比分析。

ROC曲線是一種反映模型預(yù)測(cè)精度的經(jīng)典方法,其橫軸為特異性,縱軸為靈敏度,AUC值(ROC曲線下面積)的大小用于評(píng)判模型的預(yù)測(cè)精度,其值越接近1,表明測(cè)試模型預(yù)測(cè)精度越高[26]。LR-RF和LR模型的ROC曲線見(jiàn)圖8,LR-RF模型的AUC值為0.912 3,與LR模型的0.889 5有較大提升。這是因?yàn)長(zhǎng)R模型在樣本數(shù)據(jù)較少時(shí)缺少有力的數(shù)據(jù)支撐,在局部預(yù)測(cè)不精確。LR-RF模型在選取非滑坡樣本時(shí)吸收了LR模型的空間屬性,同時(shí)RF模型在分類預(yù)測(cè)中可以很好地反應(yīng)樣本數(shù)據(jù)間的非線性關(guān)系,因而表現(xiàn)出較強(qiáng)的預(yù)測(cè)精度。而且LR-RF模型在滑坡密度方面也有很好地適配性,說(shuō)明該模型從適應(yīng)性和準(zhǔn)確度上都很適合對(duì)研究區(qū)進(jìn)行滑坡易發(fā)性評(píng)價(jià)。

圖8 不同模型預(yù)測(cè)結(jié)果的ROC曲線

5.3 討論

精確而及時(shí)的滑坡易發(fā)性評(píng)價(jià)在滑坡防治工作中有著至關(guān)重要的作用,也是經(jīng)久不衰的研究熱點(diǎn)。近年來(lái)集成學(xué)習(xí)算法在滑坡易發(fā)性評(píng)價(jià)研究中展示了豐富的發(fā)展?jié)摿Γ梢苑从郴屡c評(píng)價(jià)因子間的非線性關(guān)系。本項(xiàng)研究為了解決LR模型在數(shù)據(jù)源較少時(shí)的精度下降問(wèn)題,在LR模型的評(píng)價(jià)基礎(chǔ)上引入集成學(xué)習(xí)算法中的RF模型進(jìn)行耦合來(lái)對(duì)研究區(qū)展開(kāi)滑坡易發(fā)性評(píng)價(jià)。借助滑坡密度與ROC曲線可以看出,與傳統(tǒng)的LR模型相比,LR-RF模型可以有效減少偏差和錯(cuò)誤分類,有效提升了預(yù)測(cè)準(zhǔn)確率與精度。

6 結(jié)論

本文以耀州區(qū)為研究區(qū),分別建立了傳統(tǒng)邏輯回歸(LR)模型與邏輯回歸-隨機(jī)森林(LR-RF)的耦合模型對(duì)研究區(qū)進(jìn)行滑坡易發(fā)性評(píng)價(jià),并與傳統(tǒng)LR模型評(píng)價(jià)結(jié)果進(jìn)行對(duì)比,對(duì)LR-RF耦合模型與LR模型在研究區(qū)滑坡易發(fā)性評(píng)價(jià)中的預(yù)測(cè)性能及適用性進(jìn)行了探討,主要結(jié)論如下:

(1)基于耀州區(qū)的地質(zhì)環(huán)境條件與滑坡分布特征,選取高程、坡度、坡向等八個(gè)地質(zhì)環(huán)境因子,采用皮爾森相關(guān)性系數(shù)驗(yàn)證了各個(gè)評(píng)價(jià)因子間的獨(dú)立性,確立了八個(gè)評(píng)價(jià)因子構(gòu)成的研究區(qū)滑坡易發(fā)性評(píng)價(jià)體系。

(2)使用在邏輯回歸(LR)模型分區(qū)基礎(chǔ)上選取非滑坡點(diǎn)作為負(fù)樣本的采樣方法,在R語(yǔ)言中構(gòu)建耀州區(qū)LR-RF滑坡易發(fā)性評(píng)價(jià)模型,對(duì)該區(qū)進(jìn)行了滑坡易發(fā)性評(píng)價(jià)和區(qū)劃。評(píng)價(jià)結(jié)果表明,高、較高及中易發(fā)區(qū)覆蓋了研究區(qū)東南部的漆水河等河谷和中部殘塬邊緣區(qū)域,包含了73.23%的滑坡點(diǎn),預(yù)測(cè)效果較好。

(3)分別從滑坡密度和ROC曲線兩項(xiàng)指標(biāo)對(duì)兩種模型結(jié)果精度進(jìn)行驗(yàn)證:從滑坡密度來(lái)看,LR-RF模型高易發(fā)區(qū)的滑坡密度為0.57處/ km2,高于LR模型的0.34處/ km2;從ROC曲線來(lái)看,LR-RF模型的AUC值為0.912 3,也大于LR模型的0.889 5。LR-RF模型的兩項(xiàng)精度驗(yàn)證指標(biāo)均優(yōu)于LR模型,表明耦合模型的預(yù)測(cè)結(jié)果優(yōu)于傳統(tǒng)模型。在研究區(qū)采用LR-RF模型進(jìn)行滑坡易發(fā)性評(píng)價(jià)擁有更好的評(píng)價(jià)精度和預(yù)測(cè)能力,可為研究區(qū)的防災(zāi)減災(zāi)工作提供一定理論參考和技術(shù)指導(dǎo)。

猜你喜歡
評(píng)價(jià)模型研究
一半模型
FMS與YBT相關(guān)性的實(shí)證研究
SBR改性瀝青的穩(wěn)定性評(píng)價(jià)
石油瀝青(2021年4期)2021-10-14 08:50:44
遼代千人邑研究述論
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
視錯(cuò)覺(jué)在平面設(shè)計(jì)中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統(tǒng)研究
3D打印中的模型分割與打包
基于Moodle的學(xué)習(xí)評(píng)價(jià)
主站蜘蛛池模板: 97视频在线观看免费视频| 亚洲综合婷婷激情| 毛片在线播放a| 91小视频在线观看免费版高清| 一级成人a做片免费| 成人91在线| 久久婷婷五月综合色一区二区| 中文字幕av无码不卡免费| 无码AV高清毛片中国一级毛片| 99视频精品在线观看| 日本午夜影院| 精品国产www| 国产色图在线观看| aaa国产一级毛片| 99久久精品免费看国产免费软件| 国产欧美日韩资源在线观看| 欧美日韩国产精品综合| 99热这里只有精品久久免费 | 成人中文在线| 玖玖精品在线| 欧美国产菊爆免费观看| 亚洲美女久久| 无码乱人伦一区二区亚洲一| 伊人中文网| 毛片网站在线看| 精品久久高清| 亚洲AⅤ波多系列中文字幕| 亚洲人成日本在线观看| 日韩精品毛片| 国产亚洲欧美在线人成aaaa| 夜夜拍夜夜爽| 国产欧美精品一区二区| 国产在线拍偷自揄拍精品| 欧美性色综合网| 国产成人综合亚洲欧美在| 香蕉视频在线精品| 久久综合五月婷婷| 91久久精品国产| 国产日本一区二区三区| 欧美色图第一页| 精品国产一区91在线| 国产00高中生在线播放| 欧美影院久久| 国产午夜一级毛片| 91丝袜乱伦| 中文字幕在线欧美| 亚洲av日韩av制服丝袜| 精品欧美日韩国产日漫一区不卡| 毛片卡一卡二| 亚洲第一中文字幕| 午夜国产小视频| 亚洲精品无码高潮喷水A| 国产黄在线免费观看| 欧美国产菊爆免费观看 | 亚洲无码免费黄色网址| 九九免费观看全部免费视频| 亚洲区第一页| 农村乱人伦一区二区| 波多野结衣二区| 亚洲中文字幕在线观看| 亚洲视频a| 亚洲成人精品在线| 欧美专区日韩专区| 国产成人无码AV在线播放动漫| 国产成人精品日本亚洲77美色| 一级毛片在线播放| 天堂网国产| 亚洲精品老司机| 亚洲一区二区约美女探花| 欧美一级在线| 欧美a网站| 国产91视频免费| 五月婷婷丁香色| 国产成人久久777777| 国产高颜值露脸在线观看| 热伊人99re久久精品最新地| 色欲色欲久久综合网| 午夜性刺激在线观看免费| 日本亚洲欧美在线| 日韩无码黄色| 成人毛片在线播放| 亚洲男人的天堂久久香蕉网|