吳 明 堂,薛 正 海,崔 振 華,韓 靖 楠,馮 文 凱
(1.浙江華東建設工程有限公司,浙江 杭州 310014; 2.成都理工大學 地質災害防治與地質環境保護國家重點實驗室,四川 成都 610059)
滑坡是世界上最具破壞性的地質災害之一,常常給工農業生產以及人民生命財產造成巨大損失[1-2]。滑坡的高發生率和廣泛分布引起了許多科學家的研究興趣,其中一些科學家致力于繪制滑坡易發性圖[3]。通過分析滑坡易發性圖,可以評估和定位極易受這些事件影響的區域來降低滑坡災害損失,并在世界各地取得了良好的效果[4-5]。
制圖單元的選擇是滑坡易發性評價的關鍵步驟。雖然柵格單元的劃分非常精細,但它已經失去了與地質、地貌和其他工程地質條件的所有聯系。然而滑坡多發生在山區,與山谷線、山脊線的分布有關。因此,許多學者開始采用斜坡單位作為制圖單位[6],并發現基于斜坡單元的易發性制圖結果要優于基于柵格單元的易發性制圖結果[7-10]。
評價模型是滑坡易發性評價中不可或缺的,它直接決定了評價的結果。早些年多數滑坡易發性都采用單一模型進行評價,例如,頻率比模型[11]、證據權模型[12-15]、Logistic回歸模型[16-18]和隨機森林模型[19]。這些模型中,頻率比模型概念簡單、操作方便,計算結果通俗易懂,能夠客觀地處理評價因子狀態分級。證據權模型具有形式直觀、建模簡單等優點[20],能夠較好地消除評價因子選取和權重分配受主觀影響的問題,可以用于實現評價因子狀態分級處理[21]。Logistic 回歸模型能夠從不同評價因子以及滑坡的關系中獲得不同評價因子的權重,并可以利用簡單的線性回歸方程來描述復雜的非線性關系[22]。隨機森林模型可處理高維度、大數據量的數據集,且對噪聲及異常值的敏感度較低,能以概率模型直觀地反應滑坡易發程度,且具有較高的預測精度和穩定性。但是在評價過程中發現單一模型在分級與量化的過程中出現同一評價因子易受主觀因素影響的問題。為了解決上述問題,學者們選擇采用多種模型耦合進行滑坡易發性評價。Yang等使用基于卷積神經網絡的混合模型進行滑坡易發性制圖,發現混合模型充分利用了神經網絡的特征提取能力,預測精度達89.6%,分別比兩種純卷積神經網絡模型提高了6.2%和3.7%[23]。Peng等采用基于粗糙集-支持向量機的混合模型進行易發性制圖,并且將其與一般支持向量機模型進行綜合比較,發現該模型具有較好的預測能力和較高的可靠性[24]。多數研究都發現耦合模型得到的滑坡易發性結果精度明顯優于單一模型。因此,采用多種模型耦合進行滑坡易發性評價是目前區域滑坡易發性研究的熱點,但這些耦合模型研究都只基于柵格單元進行,較少的采用斜坡單元模型進行分析。
因此本文以斜坡單元為制圖單元,采用證據權模型、Logistic 回歸模型和證據權-Logistic 回歸耦合模型,對白鶴灘水電站野豬塘至象鼻嶺庫岸段進行滑坡易發性研究,以分析耦合模型對基于斜坡單元的滑坡易發性評價結果的影響。
研究區位于云南省巧家縣上游50 km象鼻嶺至下游10 km野豬塘,地處東經102°53′27.87″~102°59′37.44″、北緯26°29′14.27″~26°58′12.65″之間,距白鶴灘壩址32.4~94.0 km,河谷形態為寬緩的“U”字形,兩側岸坡不對稱。研究區位于青藏高原東南緣,冬半年(11月至次年4月)受青藏高原南支西風環流影響,天氣晴朗干燥,降雨稀少;夏半年(5月~次年10月)受副熱帶西風和西南季風影響,降水較為頻繁。區內地層發育較全,主要有元古界前震旦系會理群安通組,元古界震旦系上統燈影組和下統澄江組,古生界寒武紀下統、中統西王廟組和上統二道水組,古生界奧陶系中統巧家組和大箐組,古生界志留系中統石門坎組和志留系上統,古生界泥盆系下統、中統幺棚子組,古生界石炭系下統,古生界二疊系下統梁山組、下統棲霞-茅口組和上統峨眉山組以及新生界第四系地層區內除了通過2條大的斷裂帶之外還發育許多小的斷裂帶(見圖1)。
為了完成此次研究,收集了以下數據:
(1) 1 m分辨率的DEM。該數據通過無人機航攝得到,用于提取坡度、坡向等地形地貌因子。
(2) 1∶25 000的地質圖。該數據從全國地質資料館(http:∥www.ngac.cn/)獲取,用于提取巖性、斷層等構造因子。
(3) 1∶250 000的水系數據。該數據從國家地球系統科學數據中心(http:∥www.geodata.cn/)獲取,用于提取水系評價因子。
(4) 110個滑坡災害點數據。該數據主要來源于2個方面:① InSAR技術解譯并現場復核識別的滑坡災害點;② 無人機遙感航攝解譯并通過復核確定的滑坡災害點。
斜坡單元代表評估滑坡、崩塌和其他地質災害的基本單位。在所有的影響因素中,河谷和河流的發育階段對滑坡的形成起著重要的作用。通過勾勒山脊線與山谷線的劃分,斜坡單元可以與地質環境條件密切相關。考慮到各種因素的影響,斜坡單元能確保評估結果更符合事實[25]。
從地形地貌上看,斜坡單元可以看作是一個流域的左或右邊部分,流域的邊界線即為山脊線,如果能夠找出山谷線,用山谷線去分割流域,則可以得到兩個斜坡單元(見圖2)。
ArcGIS的水文分析功能能夠利用數字高程模型(DEM)提取山脊線和山谷線,進而劃分斜坡單元,操作流程見圖3。研究區按上述步驟共劃分出458個斜坡單元,如圖4所示。
證據權模型是一種基于貝葉斯統計的定量評價方法,它綜合了各種證據層因素來預測某一時刻的滑坡發生概率[26]。該方法的計算過程如下:將歷史滑坡災害與各證據層因子進行空間相關分析,得出各滑坡在不同證據層中的發育情況,計算評價因子中各狀態分類對滑坡災害發生的貢獻[22]。公式如下:
(1)
(2)
(3)

Logistic回歸模型是一種多元統計分析方法,用于研究二項分類結果與多個不相關影響因素之間的關系[22,27]。該模型通過研究滑坡易發性與影響因素之間的關系,以因子指標值為自變量,以是否發生滑坡(“1”和 “0”)為因變量,預測滑坡發生的概率[28]。
該模型的計算過程如式(4) 所示,對P作Logit函數轉換,結果如式(5) 所示:
(4)
式中:Ij1,Ij2,Ij3,…,Ijn表示各評價因子,如坡度、坡向或證據權值等;P為滑坡發生概率;a0為常數,表示在所有評價因子影響的前提下滑坡發生與不發生概率之比的對數值;ai為邏輯回歸系數即各評價因子權重[5]。
為更好了解耦合模型對基于斜坡單元滑坡易發性結果的影響,本文選用兩種單一模型與其進行對比分析。
在分析各因素對研究區滑坡發生影響的基礎上,選取坡度、坡向、坡型、地形起伏、斷層密度、距河流距離、工程巖組等7個評價因子作為滑坡易發性評價的指標體系。每個因素在ArcGIS中通過自然間斷法進行分級(見圖5)。

在ArGIS中將不同評價因子的證據權值進行疊加得到易發性圖層,最后使用自然間斷點分級工具將易發性圖層劃分為4個等級:極高、高、中、低(見圖6)。
提取110個發生過滑坡的斜坡單元,并隨機選擇相同數量未發生滑坡的斜坡單元,共計220個具有獨立屬性的統計樣本[28-29]。其中,因變量“1”表示發生過滑坡的斜坡單元,“0”表示未發生過滑坡的斜坡單元。自變量為坡度、坡向、坡型、地形起伏、斷層密度、距河流距離和工程巖組的指標值。將提取的樣本值導入SPSS軟件中進行Logistic回歸計算,得到各評價因子的權值(見表2)。

表1 各評價因子證據權重Tab.1 Evidence weight of each evaluation factor

表2 Logistic回歸結果Tab.2 Results of logistic regression
基于Logistic回歸結果中的各因子權值可得模型的公式如下:
-0.001Ij4-0.268Ij5+1.295Ij6-0.039Ij7
(5)
式中:P為滑坡易發概率;Ij1~Ij7分別為坡度、坡向、斷層密度、河流距離、起伏度、坡型和工程巖組各因子的指標值[29]。
在ArGIS中將各評價因子的權值與其指標值使用柵格計算器進行計算得到相應的滑坡易發性圖層,最后使用自然間斷點分級工具將易發性圖層劃分為4個等級:極高、高、中、低(見圖7)。
基于證據權評價模型和上述Logistic回歸方法,將Logistic回歸中的自變量轉化為各因素的證據權值,因變量為斜坡單元上是否發生滑坡。用SPSS軟件計算得到回歸結果如表3所列。

表3 基于證據權的Logistic回歸分析結果Tab.3 Logistic regression analysis results based on evidence weight
通過結果中的各因子權重可得回歸模型的公式如下:
+1.846Ij4+2.649Ij5+2.392Ij6+0.854Ij7
(6)
式中:P為滑坡易發性概率值;Ij1~Ij7分別為坡度、坡向、斷層密度、河流距離、起伏度、坡形、工程巖組各因子不同分區的證據權值[29]。
在ArGIS中將各評價因子的權值與其證據權值使用柵格計算器進行計算得到相應的滑坡易發性圖層,最后使用自然間斷點分級工具將易發性圖層劃分為4個等級:極高、高、中、低(見圖8)。
上述3種模型的結果分析表明:
(1) 極高易發區主要集中在陡坡區和斷層密集區,并且軟弱巖組對滑坡的易發結果也有很大影響。原因在于:隨著坡度的增加,剪應力在坡腳匯集也較大,發生滑坡的概率也越大;斷裂帶附近巖體較為破碎,極易發生滑坡災害;軟弱巖組自身的巖體力學參數較差,如其承載力在該研究區巖組中最低、抗風化能力較弱,使其在降雨、地震等外界因素的作用下,極易發生滑坡災害。這說明各模型評價結果與基礎地質認知相符,合理性較強。
(2) 將易發性區劃圖與證據權值結合分析表明,極高易發區和高易發區多位于坡型為凸型坡、坡向朝NW、起伏度為42~61 m的區域,且距離河流距離較近,與現實的地質事實相符。
(3) 通過對各模型的頻率比(滑坡比例/面積比例)分析發現耦合模型更為合理。耦合模型中極高易發區只占研究區面積的25.5%,但總共發育了64%的滑坡災害,滑坡災害頻率比達2.51;低易發區占研究區面積的38.8%,只發育了5%的滑坡災害,滑坡災害頻率比只有0.13(見表4)。

表4 各模型易發性分區結果及滑坡分布Tab.4 Results of susceptibility of each models and landslide distribution
為分析不同模型對易發性評價精度的影響,采用ROC曲線法檢驗證據權重模型、Logistic回歸模型和證據權-Logistic回歸耦合模型的準確性。AUC越大,實驗精度越高,模型預測效果越好[28]。3種評價模型的ROC曲線如圖9所示,證據權模型、Logistic回歸模型和證據權-Logistic回歸耦合模型的AUC值分別為0.880,0.891和0.901,其中耦合模型的AUC值分別比證據權模型和Logistic回歸模型的AUC值高1.9%和1%。研究結果表明,在以斜坡單元為評價單元的基礎上使用證據權-Logistic回歸耦合模型作為評價模型相比與單一評價模型具有較高的精度,可以更有效地用于區域滑坡易發性評價。
研究在斜坡單元的基礎上采用證據權模型、Logistic和證據權-Logistic回歸耦合模型對研究區滑坡災害進行易發性評價。通過頻率比和ROC曲線等方法對結果進行分析研究發現:3種模型的易發性結果都與現實事實認知相符,合理性較好且耦合模型具有更好的合理性;ROC曲線結果顯示耦合模型評價結果精度明顯優于單一模型結果。說明在以斜坡單元為制圖單元的基礎上,采用證據權-Logistic回歸耦合模型的評價結果精度更高、效果更好。