鐘畝鋒
(廣西地礦建設集團有限公司,廣西 南寧 530023)
中國是世界上地質災害發育最齊全的國家之一,發生的地質災害以崩塌、滑坡和泥石流為主。據不完全統計,全國共發育較大型崩塌3000多處、滑坡2000多處,中小規模的崩塌、滑坡、泥石流多達數十萬處。根據自然資源部最新統計數據,2018年全國共發生地質災害2966起,造成105人死亡、7人失蹤、73人受傷,直接經濟損失14.7億元。地質災害已經成為造成人民生命財產損失的最重要因素,開展地質災害易發性評價研究愈發迫切和重要。
地質災害易發性評價是根據區域的地形地貌、地質背景、水文條件、人類活動、土地覆蓋/利用等因素進行分析,對區域地質災害發生的可能性進行評估和劃分,為地質災害預測、防治提供技術支持。目前,國內外學者常用的地質災害易發性評價模型主要有:模糊綜合評判法、層次分析法、信息量法、確定性系數法、人工神經網絡等[1-5]。Schicker等[6]采用多元統計分析方法對區域災害進行易發性分析并制圖;Lee等[7]利用RS技術、GIS平臺及其空間分析工具對韓國龍仁地區進行滑坡易發性評價研究;Floris M等[8]利用IFSAR數據進行滑坡易發性研究。國內學者彭珂等[9]利用信息量模型對贛州市地質災害進行易發性分析;劉艷芳等[10]采用確定性系數方法研究秭歸縣滑坡易發情況;許沖等[11]利用GIS與確定性系數分析方法對汶川地震滑坡進行易發性評價。單一的評價模型不能客觀確定評價因子權重,難以定量、準確地進行區域地質災害易發性評價。
本文以廣西馬山縣為例,選擇統計學方法來進行地質災害易發性評價,主要有三個步驟:①選取評價因子并分級,通過已知災害點計算地質災害評價因子分級指標對應的確定性系數值。②利用Logistic回歸模型分析災害點和非災害點樣本,計算各因子回歸系數。③將各評價因子的確定性系數值和相關系數帶入到Logistic回歸模型,計算研究區所有單元格地質災害發生的概率,以此來進行地質災害易發性評價。
馬山縣位于廣西壯族自治區中部,居紅水河中段南岸、大明山西北麓。地理范圍在東經107°41′~108°29′,北緯23°24′~24°2′之間,東接忻城、上林縣,西接大化瑤族自治縣、平果縣,南與武鳴縣為鄰,北隔紅水河與都安瑤族自治縣相望,總面積2345 km2,如圖1所示。馬山縣屬于南亞熱帶濕潤氣候,夏季降雨量充沛,冬季較少。境內的河流主要屬于紅河水系與武鳴河水系。馬山縣地貌包括巖溶地貌和非巖溶地貌二大類,巖溶地貌分布面積占全區的72.1%,非巖溶地貌分布面積占全區的27.9%。馬山縣境內出露巖性以沉積巖為主,地層巖性由下到上依次為寒武系、泥盆系、石炭系、二疊系、三疊系和第四系。地質構造屬于廣西山字型構造前弧西翼的一部分,主要構造線呈西北——東南方向。境內已查明的地質災害有崩塌、滑坡、危巖、地面塌陷和地裂縫,主要以崩塌和危巖為主,地質災害規模多為小型、中型。

圖1 馬山縣位置圖
本研究所用到的樣本分為地質災害點數據和非地質災害點數據。地質災害點數據包括崩塌81處、滑坡3處、危巖28處、地面塌陷2處、地裂縫1處,共計115個地質災害點。非地質災害點數據是根據研究需求,利用ArcGIS隨機生成的非地質災害樣本115個。除了樣本數據以外,還包括地質災害易發性評價因子的基礎數據:數字高程模型(30m分辨率)、Landsat-8 OLI影像、馬山縣1:5萬地質災害詳細調查工作部署圖、馬山縣1:10萬水文地質圖、土地覆蓋/利用和路網數據。其中,土地覆蓋/利用是利用ArcGIS支持向量機監督分類得到的分類數據;路網數據是在BIGEMAP地圖下載器下載獲取的。
Logistic回歸模型(Logistic Regression Model)是一種因變量滿足二項分布的多元回歸模型,通過建立多個自變量與一個因變量之間的多元回歸關系,預測某一事件發生的概率。在對地質災害進行易發性評價時,選取評價因子作為自變量,將災害是否發生作為因變量,因變量取值為1和0,分別代表災害發生與不發生。設為災害發生的概率,為災害不發生的概率。若用來擬合,的取值可能不在[0,1]范圍內,因此采用odds函數對進行約束,odds函數為事件發生與事件不發生的比值,即,并取其自然對數作為因變量,建立線性回歸方程:


利用公式(1)和(2)便可對災害發生概率進行預測[12]。
確定性系數(Certainty Factor,CF)本質上是一個概率函數,由Shortliffe[13]提出,Heckrman[14]進行改進,為了把評價因子量化到以0為中心,變化區間在[-1,1]范圍內,采用確定性系數對各評價災因子進行量化。其計算公式如下:

式中:Pa為地質災害在評價因子分類a中發生的條件概率,此處表示為評價因子分類a中發生的地質災害個數(或面積)與評價因子分類a面積的比值;Ps為地質災害在整個數據中發生的先驗概率,此處表示為整個研究區內已發生的地質災害個數(面積)與研究區域總面積的比值[15]。
公式(3)中CF的取值在[-1,1]之間,當CF取正值時,表示區域容易發生地質災害;當CF取值為負值時,表示區域不易發生地質災害。

圖2 評價方法流程圖
用災害點樣本計算出每一個評價因子指標的確定性系數值,提取災害點樣本與非災害點樣本對應的每一個評價因子的確定性系數值,建立回歸方程,計算邏輯回歸常量α和每個評價因子的回歸系數,計算出區域所有單元格的概率值,以此為依據進行地質災害易發性評價。具體流程如圖2所示。
馬山縣的地貌條件主要為巖溶地貌,致使馬山縣容易發生崩塌和形成崩塌隱患點。因此,馬山縣的地質災害更多的是側重研究崩塌,本文在進行馬山縣地質災害易發性評價時,將不同的地質災害類型合并統計分析。
根據收集的區域統計資料和實地現場踏勘,初步確定的馬山縣地質災害評價因子有:地形地貌、地質背景、水文條件、人類活動、土地覆蓋/利用等五類。具體細分,地形地貌分為高程、坡度、坡向,地質背景分為地層巖性、距斷層距離,水文條件為地下水類型,人類活動用距道路距離來表示,以及土地覆蓋/利用共8個因子,每個因子的分級指標如表1所示。

表1 地質災害易發性評價因子分級指標和CF值

距道路距離(m) 4 0~300 0.17528 300~600 0.31997 600~900 -0.33452>900 -0.44896土地覆蓋/利用 5水域 -1裸地 -1建設用地 -0.53957耕地 0.13601林地 0.01893
高程與地質災害的發育無直接關系,但高程與人類活動和土地覆蓋/利用密切相關,不同高程植被的發育類型不同,人類活動的強度也不一樣,形成的土地覆蓋/利用類型也完全不一樣。坡度與產生崩塌、滑坡的勢能、下滑力有關,也會確定災害的影響范圍。坡向不同,山坡受到的光照條件也不一樣,南面朝向的為陽坡,北面朝向的為陰坡。光照條件會影響到植被發育、坡面水分蒸發量、風化程度等。斜坡巖土體的巖性影響著巖石強度、風化程度、節理裂隙發育、地下水類型等,是地質災害發育的內在控制因素。地質構造活動會造成區域巖體破碎,節理裂隙發育,為加速巖體風化、降低巖土體強度提供了內地質營力。地下水沿裂隙面滲流,使巖土體粘合力降低,巖土體強度下降。地表河流對坡腳沖刷、侵蝕易使邊坡失穩,水位上升會浸濕坡腳,坡岸巖土體穩定性降低。道路的分布反映人類活動頻繁程度,道路密集說明該區域人類活動強烈。人類活動:修筑道路、人工切坡、工程爆破等都會增加區域發生地質災害的可能性。土地覆蓋/土地利用在一定程度可以反映區域植被類型、人類活動的情況。
通過收集準備的資料,將所有的因子圖層矢量用統一的矢量范圍進行裁剪,然后全部轉化為柵格數據。同時,設置每個因子圖層的柵格大小為30m×30m。根據115個災害點在各個評價因子分級指標中的分布,結合公式(3)計算出每一個評價因子分級指標的確定性系數值,確定性系數值如表1所示。利用ArcGIS的多值提取到點,就可以得到每一個災害點對應的評價因子分級指標的確定性系數值。
為了確保地質災害易發性分析的合理性,要使因子之間保持相互獨立。本文利用相關分析對8個因子進行獨立性檢驗,各因子之間的相關系數如表2所示。從表2可以看出,高程與坡度、地層巖性、土地覆蓋/利用的相關系數大于0.3,其余因子之間的相關性基本都小于0.3或只與某個因子相關性略偏高,綜合考慮后去除高程因子,保留其余7個因子。
利用ArcGIS在研究區范圍內隨機生成115個非災害點,與已知的115個災害點一起作為地質災害易發性評價的統計樣本。將各個影響因子的確定性系數值作為自變量,是否發生地質災害作為因變量(取0代表地質災害不發生,1代表地質災害發生)。把330個樣本點導入到SPSS中進行二項邏輯回歸分析,邏輯回歸分析的分類表如表3所示,觀測值與預測值一致的可能性為64.8%,說明了方程回歸的可靠性為64.8%。回歸系數(B)是在回歸方程中表示自變量對因變量影響大小的參數,自變量回歸系數的絕對值越大,自變量對因變量的影響也越大,回歸分析結果如表4所示。因此,可以用評價因子回歸系數(B)的絕對值來分析評價因子的易發性,從表4分析可以得出,斷層、地下水、地層巖性、降雨對區域地質災害發生的作用較大,其中斷層的控制作用最顯著。

表2 評價因子相關系數表

表3 分類表
5.2.1 合理性分析

式中:x1為坡度分區的CF值;x2為坡向分區的CF值;x3為地層巖性分區的CF值;x4為距斷層距離分區的CF值;x5為地下水分區的CF值;x6為距道路距離分區的CF值;x7為土地覆蓋/利用分區的CF值。由公式(2)計算出所有單元格發生地質災害的概率P,利用自然斷點法將研究區分為了5級:極高易發區、高易發區、中易發區、低易發區和穩定區。結果如圖3所示,圖中顏色由綠到紅易發程度逐漸增加。

表4 邏輯回歸分析結果表

表5 地質災害易發性分區統計表
經過計算得出:極高易發區占比10.48%,高易發區占比24.26%,中易發區占比27.84%,低易發區占比17.46%,穩定區占比19.96%。從地質災害易發區空間分布上看,馬山縣易發生災害的地區主要集中在東部和西部,不易發生災害的地區主要集中在中部。將災害點與易發性結果圖疊加分析,獲得不同程度的易發區災害點分布情況,如表5所示。穩定區的災害點占比最小,災害點密度也遠小于其他易發性分區。極高易發區災害點雖然占比不大,但災害點密度較大,災害點密度最大的為高易發區。研究區易發性評價的結果基本符合災害點分布的實際情況。

圖3 地質災害易發性分區
5.2.2 精度分析
易發性評價結果的有效性可以用受試者工作特征曲線(ROC)進行定性分析,AUC是曲線下方的面積,可以用來度量分類模型的好壞,AUC越接近1,模型的模擬值越接近于樣本值。本文用ROC曲線和AUC值對耦合模型進行檢驗,ROC曲線的橫軸表示易發性面積百分比累積量,縱軸表示災害點面積百分比累積量,結果如圖4所示。AUC的值為0.688,表明該方法能較為有效地對馬山縣地質災害進行評價。

圖4 ROC曲線和AUC值
本文以廣西壯族自治區南寧市馬山縣為例,計算高程、坡度、坡向、地層巖性等地質災害影響因子的確定性系數,并結合邏輯回歸模型計算單元格地質災害發生的概率,在此基礎上進行馬山縣地質災害易發性評價,主要結論有:
(1)從計算得到的回歸系數可以確定,馬山縣地質災害受地下水、坡度、斷層和巖性的影響比較顯著。研究區地質災害易發性評價結果表明,馬山縣地質災害主要分布在碳酸鹽巖裂隙溶洞水區域,離斷層距離小于400m區域,二疊系、泥盆系碳酸鹽巖區域。馬山縣地質災害防治工作應該重點關注有斷層經過的碳酸鹽巖區域,這些區域是地質災害詳查的重點調查對象。
(2)基于耦合模型的易發性評價方法可以準確客觀地計算出評價因子與發生地質災害之間的確定性關系和各個因子的權重。利用GIS平臺可以很好的解決不同數據轉換、疊加分析的問題。精度分析中ROC曲線和AUC值用來檢驗耦合模型易發性評價的有效性,檢驗結果表明該方法可以較為準確的對馬山縣地質災害進行評價。
本文選取的評價因子主要為一些符合區域災害特點且容易獲取的因子,還有一些其它方面重要的影響因子未被納入其中分析,如降雨、地震烈度等。對研究區進行單元格劃分時,還需要結合區域地質災害的特點,確定更加合適的單元格大小。上述兩個問題還需收集更多的數據,進行更加深入的研究。