屈新星, 李道安, 何云玲, 余 嵐, 閆文波
(云南大學 地球科學學院, 昆明 650201)
滑坡是巖土體沿滑坡面迅速發生位移的一種過程,在巖土體變形中規模大、數量多、危害嚴重、性質比較復雜[1]。滑坡易發性,即滑坡基于當地環境條件在一個地區發生滑坡的概率;易發性不考慮滑坡發生的時間或頻率,也不考慮預期滑坡發生的破壞程度[2]。構建科學的預測模型,即依據滑坡災害潛在區域內各種環境要素的空間分布,預測滑坡的易發程度,可為滑坡防災減災提供科學的參考依據[3]。
目前國內應用最為廣泛的滑坡易發性評價方法主要有兩類[4]:一類是定性分析方法,主要依靠主觀經驗打分確定因子權重;一類是定量分析方法,通過數理統計建立模型。定量分析方法中的信息量模型是通過計算各個影響因素對地質災害發生破壞所提供的信息量貢獻值,作為定量分區的指標,以信息量的大小來表示各個影響因素與地質災害的密切程度,災害發生的概率隨信息量值的增大而變大[5-6];這種方法逐漸成為區域地質災害預測評估的常用方法之一[7]。
國外學者主要是通過概率、二元統計模型、模糊邏輯、AHP(Analytic Hierarchy Process)模型、熵指數模型等進行滑坡易發性研究。如:Mokarram等[8]使用了ROC(Receiver Operating Characteristic Curve)和AUC(Area Under Curve)方法對fuzzy logic(模糊邏輯)和AHP模型產生的滑坡易發性進行驗證,最終fuzzy logic模型(89.7%)在研究區域(伊朗)的表現優于AHP(81.1%)模型。Akgun等[9-10]利用Logistic回歸方法建立了磁化率模型對土耳其西部滑坡易發性進行評估;并通過似然—頻率比和加權線性組合模型評估土耳其東北部滑坡易發性。Pradhan等[11-12]采用了人工神經網絡法、GIS和頻率比模型、多元回歸模型和模糊邏輯法對馬來西亞多地進行了滑坡易發性評估。Lee等[13]對韓國龍仁山體滑坡采用了概率和邏輯回歸模型進行研究。Pourghasemi等[14]利用GIS中的熵指數和條件概率模型進行滑坡易發性評估,并在結果中表示熵指數(AUC=86.08%)表現略好于條件概率(AUC=82.75%)模型。
maxEnt(maximum Entropy)模型是一個基于最大熵原理的概率模型,即在滿足已知約束的條件下,利用目標的存在分布點和環境變量,推算目標的生態需求[15];其表現出較好的分辨變量相互作用能力及抽樣偏差處理能力,操作運行簡單快捷,對樣本量要求較低(>5),建立了一個反映多個影響因子對目標綜合影響的評價指標,即存在概率[16]。maxEnt模型和上述以往滑坡易發性研究中常用的信息量模型、熵指數模型、概率模型在理論上有一致的共同性,但是基于maxEnt模型對滑坡易發性的研究鮮有報道。因此,本研究以攀枝花市為研究區域,基于maxEnt模型原理,結合ArcGIS空間分析模塊對其滑坡易發性進行定量預測和分析研究,以期為攀枝花市土地利用規劃和滑坡防災減災工作提供科學參考。
攀枝花市地處四川省西南部,地理位置為26°05′—27°21′N,101°08′—102°15′E;是川西南和滇西北區域的中心城市和交通樞紐,也是全國著名的重要礦區;市轄東區、西區和仁和區、米易縣和鹽邊縣,總面積7 440 km2。全市屬南亞熱帶季風氣候,年降雨量800~1 100 mm,夏季受高溫高濕的西南季風影響,92%以上雨量集中于6—10月的雨季;日最低氣溫為4~8℃,日最高氣溫為19~23℃[17]。攀枝花市屬侵蝕、剝蝕中山丘陵、山原峽谷地貌,地形陡峻,強烈的地質構造活動使巖體破碎;加之特殊的干熱河谷及旱、雨季分明的氣候環境,使巖體物理、化學風化劇烈,由此形成崩塌堆積物和松散的坡積、殘積層穩定性差,易形成滑坡[18-19];其滑坡數量相對較多,而且發生的頻率和成災概率都很大[20],給該區的工農業生產、交通運輸和人民生命財產造成了很大的危害。
按照前文滑坡易發性的定義,結合滑坡發生主要受河流沖刷、地下水活動、雨水浸泡、地震等自然要素,以及人工切坡等人類活動要素的影響。經過篩選比對,最終確定高程、坡度、坡向、土地利用類型、歸一化植被指數(Normalized Difference Vegetation Index,NDVI)和人口密度6項因子作為攀枝花市滑坡易發性的評價指標。
滑坡點數據來源于2016年、2017年的全國礦山環境遙感監測,是中國地質調查局航空物探遙感中心項目下發的土地利用多源遙感數據,分辨率最低為5 m×5 m、最高為1 m×1 m。圖1中的滑坡分布點是前期項目組通過室內的遙感影像解譯,再經過野外逐一實地調查驗證后得到的37個點。高程、坡度、坡向來自于美國國防部國家測繪局公布的SRTM-DEM數據。NDVI數據來自于美國國家航空航天局NASA(National Aeronautics and Space Admini-stration)的Terra遙感衛星的MOD13Q1數據產品。同時通過中國科學院資源環境科學數據中心獲取土地利用類型遙感監測數據和人口分布數據。
將所獲取的全部數據先進行地理坐標系統和像元大小(30 m×30 m)的統一;然后通過ArcGIS的3D分析模塊進行高程、坡度、坡向提取,通過ENVI 5.1軟件對NDVI進行MVC(maximum Value Composite)最大值合成平均值[21]。最后將高程、坡度、坡向、土地利用類型、人口密度和NDVI這6個影響因子數據轉化成maxEnt 3.4.1軟件所要求的ASCII格式文件,將滑坡點的地理位置轉成.csv格式文件。

圖1 攀枝花市的地理位置及主要滑坡點分布
將滑坡地理位置和各環境特征變量數據導入maxEnt 3.4.1中,隨機選取65%,70%,75%,80%,85%,90%的滑坡點數據作為訓練數據集用于建立模型,將剩余的滑坡點用于模型驗證。為了避免偶然誤差,在模型運行中選擇logistic為輸出形式,表示某個滑坡在整個模擬區域(攀枝花市)每個柵格上的存在概率(P),取值范圍為0~1,勾選隨機種子,其他參數不變,在預試驗中運行10次,目的是使模擬得到的AUC值較為穩定(±0.001),AUC為模型自帶的受試者工作特征曲線ROC下的面積,不同的值代表模型準確度級別。通過運行模型將環境因子中貢獻率為0的因子剔除后,再重新輸入模型運行10次直至沒有貢獻率為0的影響因子出現。在正式試驗中將篩選后的影響因子再運行10次以得到一個穩定的預測數值。
在建立模型和運行過程中,均采用交叉驗證的方式進行模型驗證。首先,通過模型Jackknife中的AUC評價指標對模型模擬的滑坡潛在分布點預測效果,這種AUC值的驗證是以樣本點的形式對模型進行驗證。其次,通過Kappa值從整體上檢驗模擬的準確度,即通過模型模擬完成后的研究區滑坡易發性預測圖與已發生的滑坡現狀點圖進行Kappa一致性檢驗。AUC值和Kappa值的評估標準見表1[22]。

表1 AUC值和Kappa值及其與模型準確性的關系
本文采用AUC標準差來判斷模型模擬值是否穩定,在利用maxEnt處理數據過程中,每個測試百分比數據的運行處理都有很多次重復,計算出的多個AUC值的方差計算公式為:
(1)

圖2為應用maxEnt模型進行攀枝花市滑坡點潛在地理分布模擬的特征曲線,可以看出,訓練集AUC值為0.960,驗證集AUC值為0.966,適用等級均達到優秀,表明maxEnt模型能夠準確地對滑坡點的地理分布與環境影響因子的關系進行模擬。

圖2 攀枝花市滑坡地理分布模擬結果的ROC曲線
為了研究maxEnt模型在運行中選取不同現狀分布點做樣本隨機訓練比率對maxEnt模型預測擬合準確度的影響,按照上文描述步驟將不同比率的AUC值采用GraphPad Prism軟件進行均方差處理得到圖3。可以發現AUC值雖然在隨機訓練比例80%達到最大值,但是AUC的方差值顯示當模型隨機訓練比例75%的時候方差是最小的,表明這個時候的AUC值最穩定,模型模擬所得到的數據最精確。因此,下文的研究結果均基于隨機選取75%訓練數據比例作為模型運行的基礎。
將模型模擬結果導入到ArcGIS 10.2中,轉換成浮點型柵格數據。根據統計學上小概率事件不可能發生的原理,當p<0.1時,認為該柵格內滑坡災害不可能發生;當p≥0.1時,認為該柵格內滑坡災害可能在此柵格發生;將滑坡概率0.1~1依次按照自然斷點法進行劃分0~0.100,0.100~0.156,0.156~0.321,0.321~0.556,0.556~0.980共5段,對應易發性中極低易發生、低易發生、中易發生、高易發生和極高易發生5個等級,空間分布格局見圖4。

圖3 不同訓練比例的AUC值及AUC方差

圖4 攀枝花市滑坡易發性等級空間分布
Kappa值為整體上檢驗模擬的準確度,將模型模擬完成后的研究區滑坡易發性預測圖4中滑坡點的潛在地理空間分布,與已發生的滑坡現狀點圖進行Kappa一致性檢驗,結果顯示Kappa系數為0.86,基于maxEnt模型的模型結果顯示與實際滑坡災害點在空間上的分布十分吻合。從整個市域范圍來看,攀枝花市滑坡極低易發生、低易發生和中易發生的面積分別為6 381.96,311.36,380.00 km2,分別占研究區總面積的87.18%,4.25%,5.19%,高易發生和極易發生分別占總面積的2.57%,0.80%;其中高易發生和極易發生區域主要分布在人口比較密集的東區和西區,部分沿著金沙江、雅礱江、巴關河、安寧河和攀枝花市主要道路兩邊而發育。此研究結果和攀枝花市人民政府在網上公布的部分結論和王喜娜等[20]的研究結果一致。
表2為滑坡的各影響因子的百分貢獻率和置換重要性,其中百分貢獻率是maxEnt模型在訓練過程中給出的各影響因子對滑坡地理分布的貢獻程度;置換重要性是將訓練樣點的影響因子隨機替換后進行模擬得到的maxEnt模型模擬結果的AUC值減少程度,減少值越大表明模型高度依賴于該變量。由表2可知,NDVI的貢獻百分比和置換重要性都占絕對優勢。

表2 不同環境影響因子的貢獻百分比和置換重要性 %
為進一步分析滑坡地理分布的各個環境特征變量影響的閾值,根據maxEnt模型模擬結果得到的攀枝花市滑坡存在概率與各影響因子的關系(圖5),可以得到不同的滑坡易發性等級對應的各影響因子的閾值(表3)。從圖5,表3可知,攀枝花市滑坡易發性在高程約1 700 m以下隨著高程增加滑坡發生概率增大,而在高程1 700 m以上則表現為隨著高程增加滑坡發生概率減小的變化趨勢。隨著坡度增大滑坡越易發生,坡度大于12.5°表現為滑坡高易發生和極高易發生區。坡向和人口密度兩個因子均表現為隨著環境變量的增大,滑坡存在概率先增加后減少的變化趨勢;其中人口密度在110人/m2及其以上,滑坡災害等級為高易發生,主要原因為人口密度越大,周邊環境越受人類活動的影響。陽坡比陰坡更易發生滑坡,其可能原因為陽坡接受的陽光和降水相對較為充沛,巖體更易風化,形成的松散堆積物比陰坡多。滑坡易發性隨著NDVI值的增大而減小,NDVI小于0.5表現為滑坡高易發生區;NDVI主要反映植被覆蓋狀態,其值越大表明植被覆蓋度越好,表明植被覆蓋度越好,滑坡越不易發生。不同的土地利用類型對滑坡存在概率的影響表現不同,旱地、疏林地、其他林地、其他建設用地的易發性等級為高易發區,其余為中易發區域。

注:縱坐標存在概率取值范圍為0~1,地類代碼同表3。

表3 攀枝花市滑坡地理分布不同易發等級的影響因子閾值
maxEnt模型本質上是生物氣候包絡模型(Bioclimatic Envelope Models,BEMs)的一種,BEMs利用具有地理參考的環境變量和物種分布信息之間的相關性推斷物種的生態需求,模擬物種的地理分布,目前已被廣泛應用于解決保護生物學、生物地理學、生態學和分類學中的問題。本研究嘗試通過maxEnt模型建立環境影響因子與滑坡易發性的關系模型,模擬攀枝花市滑坡地理分布對影響因子的響應,同樣取得了較好的模擬效果,這種研究擴展了BEMs的應用范圍。
maxEnt模型的一個優勢是可以對環境變量的重要性進行評價。NDVI和坡度貢獻率最高,表明植被覆蓋和坡度是決定攀枝花市滑坡易發性分布格局最重要的因素。坡向和高程的貢獻率最低,表明攀枝花市滑坡對坡向和高程的波動并不敏感。當然,滑坡的發生還受地震、降雨等因素的影響。在大量前期已有的文獻使用maxEnt模型時,均采用默認參數[23],在默認參數里隨機種子不參與模型的構建,這樣會導致在不同的隨機測試比例,運行10次的情況下,每次運行后結果都會一致,故在構建maxEent模型時應盡量避免選擇所有均為默認參數。最后,因數據獲取原因,只能解譯并實地驗證現狀37個滑坡點,雖已滿足maxEnt模型樣本量的最低需求,但在未來的研究可進一步獲取更多的樣本點以更精確地模擬滑坡易發點。
在研究中發現攀枝花市的滑坡沿河谷集中分布;市內的金沙江、安寧河河谷兩岸滑坡集中分布,形成滑坡分布密集帶。除地層構造原因之外還發育著第四紀形成的沖、洪積層組成的各級階地,松散的沖、洪積層力學強度低,穩定性差,易形成滑坡。另外,滑坡與人類工程活動關系密切,易形成滑坡分布密集帶。其余零星散落的滑坡主要是因一些自然原因,如攀枝花市為特殊的干熱河谷及旱、雨分明的氣候環境,且雨季大多暴雨;老滑坡蠕動的影響;巖體中的破碎帶或組合結構面等原因。
(1) maxEnt模型在研究區滑坡易發性方面適用性等級為優秀(AUC=0.96),Kappa系數為0.86,以37個滑坡點為樣本數據,隨機選取75%(28個)用于訓練模型,其余25%(9個)用于驗證模型,得到的AUC值最穩定且精度最高,模型預測可信度最高。
(2) 高易發生和極易發生區分別占研究區總面積的2.57%,0.80%,主要分布在人口比較密集的東部和西部地區,部分沿著金沙江、雅礱江、巴關河、安寧河和攀枝花市主要道路兩側而發育。
(3) 滑坡易發性的影響因素中,植被覆蓋和坡度是決定研究區滑坡易發性空間分布格局最重要的地理環境因子;NDVI小于0.5,坡度大于12.5°的地區表現為滑坡高易發生區和極高易發生區。