









關鍵詞:地質環境承載力;隨機森林算法;組合賦權法;黃河中下游;鞏義市
鞏義市地處秦嶺東段、黃河流域中下游,地質構造復雜,以黃土高原為主的第四系黃土廣泛分布,礦產資源豐富,部分地區濕陷性強,切坡建房、窯洞建設普遍存在,地質環境脆弱。近年來,隨著社會經濟快速發展及礦產資源開發,鞏義市生態環境受了嚴重破壞,使本來脆弱的地質環境進一步惡化,崩塌、滑坡、泥石流、地面塌陷等地質災害頻繁發生,引發水土流失、自然景觀破壞等環境問題,嚴重威脅人民生產生活及生命財產安全。
地質環境承載力評價是查清地質環境現狀、推進經濟社會可持續發展的基礎工作。地質環境承載力評價研究經歷了反映承載等級劃分和服務國土空間規劃兩個階段,其研究方法以層次分析法、主成分分析法、變異系數法和模糊綜合評價法為主。隨著人工智能算法的發展,部分學者采用機器學習算法開展地質環境承載力評價,并取得了較好的效果,如李宇新等引人數據挖掘半監督學習模型,完成了府谷縣地質環境承載力評價。隨機森林算法在處理數據間非線性關系問題方面具有明顯優勢,支澤民等采用隨機森林回歸模型完成了川藏鐵路沿線縣域地質環境承載力評價。
以往的研究主要基于靜態的地質環境數據開展地質環境評價,未考慮地質災害的動態變化,缺少地表動態移動變形數據,且評價單元尺度較大,評價結果具有一定局限性。利用機器學習算法開展地質環境承載力評價時,目標向量選取具有主觀性且未對評價精度和評價結果進行定量檢驗及優化。鑒于此,本文以黃河中下游典型地質環境脆弱區河南省鞏義市為例,綜合運用遙感地表形變監測技術、隨機森林算法(RF)、GIS技術等,選取InSAR地面形變數據、地質災害風險區劃、植被覆蓋指數、年均降水量、距河流距離、黃土濕陷性等涵蓋地貌環境、地質環境、生態環境和社會環境4個方面的共20個評價指標,建立鞏義市地質環境承載力評價指標體系,分別采用層次分析一變異系數(AHP-CV)組合賦權法和隨機森林算法(RF)確定各評價指標權重,對鞏義市地質環境承載力進行評價,同時利用地質災害點對評價結果進行驗證,并基于地質災害及隱患點風險等級對評價結果進行優化,以提高評價結果的準確性,為地質環境承載力評價研究提供新的思路。
1研究區概況及數據來源
1.1研究區概況
鞏義市屬于河南省鄭州市,總面積1041km2,東西長43km,南北寬39.5km,屬黃河、淮河兩大流域,多年平均氣濕14.6℃、年降水量587.3mm、年蒸發能力1950mm、無霜期234d。鞏義市位于秦嶺東段,地勢東南高、西北低,海拔104~1440m,區域上位于華北地臺嵩箕臺隆北部邊緣滎密背斜北翼,地質構造復雜。研究區土體廣泛分布于北部、西部,面積總計682km2,占全市面積的65.51%,巖體主要分布在東南部。
研究區地質災害及隱患點共182處,滑坡、崩塌、泥石流、地面塌陷均發育,數量分別為25、133、3、21處。崩塌和滑坡主要分布在黃土丘陵地貌,主要集中分布于研究區西北部和南部,黃土水敏性、濕陷性特征以及礦山開采等人類活動是影響崩塌和滑坡地質災害產生的重要因素。鞏義市礦產資源豐富,礦產開發形成大面積采空區,地面塌陷多發生在采空區。采空區不但易發生地面塌陷、滑坡、崩塌等地質災害,而且大量礦渣壓覆耕地、堵塞溝谷,易形成泥石流等地質災害。鞏義市泥石流均出現在礦山開采影響范圍內,主要集中分布于研究區南部,均為暴雨型泥石流,物源補給主要為人工棄渣和坡面侵蝕。
1.2數據來源
地質環境承載力評價主要與坡度、地貌、斷層、災害點、降水量、人口密度等因素有關。研究區高程、道路與河流數據來源于河南省測繪局2021年9月最新測制的鞏義市1:1萬地形圖。坡度、地形起伏度、地表切割深度基于研究區高程數據通過ArcGIS空間分析功能得到。地貌數據通過綜合分析研究區高程、坡度、地形起伏度和地表切割深度等地形因子得到。根據鞏義市2021年1:5萬地質災害風險調查評價成果資料和鞏義市基礎地質、工程地質資料,結合2021年7-9月國產高分二號(GF-2)和北京二號(BJ-2)衛星影像(1m全色+4m多光譜)得到研究區斷裂構造和工程地質巖組數據。歷史地質災害點數據、地質災害風險區劃數據、人口密度、財產密度、黃土濕陷性分布圖(數據)來源于鞏義市2021年1:5萬地質災害風險調查評價成果資料。根據鞏義市2021年6月Landsat 8遙感影像計算得到歸一化建筑指數(NDBI)、歸一化植被指數(NDVI)數據,分辨率為30m。根據鞏義市各雨量站2011-2021年逐月降水量,通過ArcGIS插值分析得到鞏義市逐年平均降水量。礦區數據來源于2018年河南省鞏義市1:5萬礦山地質環境調查成果資料。選取2020年4月至2021年6月的Sentinel-1A數據,通過短基線干涉測量(SBAS)方法生成鞏義市地表形變圖,結合地質災害特點圈定地面形變區。耕地數據來源于第三次全國土地調查成果。
為統一多種數據的空間分辨率,根據經驗公式計算評價單元大?。?/p>
計算得到G約為30m.因此將30mx30m柵格單元作為鞏義市地質環境承載力評價單元,將所有數據重采樣至30m空間分辨率。
2研究方法
2.1層次分析法
層次分析法(AHP)是構建一個層次結構,對各層次元素建立兩兩比較矩陣,用數字表示各元素的優先級,對各層次元素的相對重要性進行量化,運用特征向量法和最大特征值法計算得出各層次元素的權重,進而得到最終的決策結果,并利用一致性比率CR來判斷所建立判斷矩陣的一致性,計算公式為
2.2變異系數法
通過計算指標的變異系數,可以求得指標權重,變異系數法(CV)屬于一種客觀賦權方法。變異系數是指標的標準差和平均值的比值。將變異系數歸一化可以得到指標權重,計算公式為
2.3隨機森林算法
隨機森林算法是一種集成學習方法,通過Bagging思想生成多個互不影響的決策樹,采用多棵決策樹聯合進行預測以提高模型精度。一個樣本會被送到每個決策樹進行預測,通過對預測結果進行投票,將得票最多的類別作為最終預測結果。相較于其他傳統機器學習方法,隨機森林算法具有抗過擬合能力強、性能穩定、可接受高維數據等優點,其原理見圖1。
3指標體系構建
3.1評價指標選擇
結合研究區地質環境背景,從地貌環境、地質環境、生態環境和社會環境4個方面分別選取高程、坡度、地形起伏度、斷層密度、工程地質巖組、地質災害點密度、地面形變區、植被覆蓋指數、年降水量、黃土濕陷性、人口密度、耕地面積占比和歸一化建筑指數等共20個評價指標,構成評價指標體系(見圖2)。
3.2評價指標分級
根據已有研究,將各評價指標劃分為差、較差、中等、較好和好5個等級,分別賦值為1~5。不同等級對應評價指標標準見表1、表2。定量指標采用自然斷點法進行分級,定性指標包括地貌、工程地質巖組、地質災害風險區劃、地面形變區和黃土濕陷性等。地貌共分為5類:易發生地質災害的黃土丘陵地貌等級為差,人類活動頻繁、地形切割破碎、地質災害較為發育的構造剝蝕丘陵區等級為較差;侵蝕構造低山和侵蝕構造中山區域基巖出露且地質災害不發育,等級分別為中等和較好;地勢平坦、地質災害不發育的沖洪積傾斜平原等級為好。研究區內工程地質巖組共分為6類,其中黃土單層土體和黃土類單層土體等級為差,其余4類則根據巖體的硬度進行等級劃分。地質災害風險區劃的高、中、低風險區分別對應差、中等、好等級。對于地面形變區,形變區等級為差,其他區域等級為好。黃土濕陷性共有4個等級,強、中等和輕微濕陷性的等級分別為差、較差、中等,無濕陷性區域等級為好。鞏義市礦產資源豐富,類型多樣,為了定量化研究礦區破壞程度,從礦區生產規模、開采方式和開采礦種3個方面對礦區的破壞程度進行評價,并依據層次分析法對其進行權重賦值,具體的分類標準和權重見表3,將生產規模、開采方式和開采礦種加權求和得到礦區破壞程度指數,采用自然斷點法將礦區破壞程度指數劃分為3類,分別對應強、中等和弱破壞區,研究區中無礦區域為無破壞區,最終將礦區破壞程度劃分為無、強、中等和弱破壞區。
在對定量指標和定性指標賦值后,需要對評價指標進行多重共線性檢驗,以確保指標間不存在共線性問題。在這個過程中,方差膨脹因子(VIF)和容差(TOL)是重要指標,當VIF≥10或TOL≤0.1時,指標間存在嚴重共線性。評價指標共線性檢驗結果見表4,VIF、TOL滿足要求,表明不存在多重共線性問題,評價指標可以用于模型構建。
3.3評價指標權重確定
本文采用AHP-CV組合賦權法和隨機森林算法計算指標權重,并對比分析兩種方法的計算結果。層次分析法用于計算主觀權重,變異系數法可以計算客觀權重,但層次分析法計算主觀權重時受主觀因素和認知片面性影響,變異系數法計算客觀權重時忽略了決策者的主觀性,因此將層次分析法和變異系數法相結合即AHP-CV組合賦權法計算組合權重,以彌補單一計算方法的缺陷。隨機森林算法在處理數據間非線性關系問題和發現內在規律方面具有明顯優勢,對于多要素問題可計算特征重要度,定量提供解釋變量對于被解釋變量的貢獻率與重要程度。隨機森林算法計算權重時,將數據集按6:4分為訓練集和測試集,兩種集合由主客觀賦權結果各占50%組成,同時隨機選擇樣本,消除訓練樣本人為選擇的主觀隨意性。本次研究中,決策樹最大深度為13、最小葉子節點樣本數為1是模型最優參數組合,模型準確率最高,將隨機森林特征重要性作為地質環境承載力權重。
4評價結果分析
4.1評價指標權重
采用AHP-CV組合賦權法計算指標權重,結果見表4。組合賦權值排名前5的指標為黃土濕陷性、地質災害風險區劃、地貌、礦區破壞程度和坡度。與AHP-CV組合賦權法相比,隨機森林算法權重計算結果存在顯著差異,地質災害風險區劃的權重最大,為性0.425,地質災害風險反映了人類生產活動是否在地質環境可承載范圍內,可表征地質環境承載狀態,即表明地質的重要性在組合賦權模型訓練過程中被準確捕捉,隨機森林算法對地質災害具有更強的敏感性,權重計算結果更符合實際、科學性更強。隨機森林算法權重計算結果顯示,對研究區地質環境承載力影響最大的5個評價指標為地質災害風險區劃、工程地質巖組、黃土濕陷性、礦區破壞程度和坡度,地貌環境、地質環境、生態環境和社會環境子系統權重分別為0.118、0.641、0.153、0.088,地質環境對地質環境承載力影響最大,其次是生態環境,社會環境對地質環境承載力影響最小。
4.2地質環境承載力評價結果分析
確定評價指標權重后,基于GIS空間分析功能,將各評價指標加權求和,得到研究區地貌環境、地質環境、生態環境、社會環境評價結果,并利用自然斷點法,將評價結果劃分為好、較好、中等、較差、差5個等級,結果見圖3。研究區地貌環境質量較好,等級為較差和差的區域分布與坡度大、地形起伏度大、地表切割深度大、構造剝蝕地貌分布區域大體一致;等級為差的區域零星分布在研究區南部、西北部和東北部,這些區域坡度大、地形起伏度大、地表切割深度大、構造剝蝕程度高。研究區地質環境與地貌環境空間分布差異較大,地質環境等級為好的區域呈塊狀分布在研究區東南部,該區域出露堅硬厚層狀中等巖溶化石灰巖巖組,巖體致密堅硬,抗風化能力強,受人類活動擾動小,地質環境穩定。地質環境等級為較差、差的區域呈片狀分布在研究區東部、南部和東北部,與地質災害風險高、礦區破壞程度高的區域分布大體一致。其中,研究區東部和南部受采礦活動影響,礦區破壞程度高、地質災害風險高、InSAR地表形變速率大,這是影響該區域地質環境承載力提升的主要障礙因子:研究區東北部緊鄰黃河,地質災害風險高。研究區生態環境與地貌環境、地質環境差異均較大,整體生態環境質量呈現從西北向東南方向變好的趨勢。生態環境等級為較差、差的面積占34.40%,分布在研究區西北部和東北部近黃河和伊洛河附近,該區域植被覆蓋度低,黃土濕陷性強,年降水量小,生態環境較差。生態環境等級較好區域主要分布在研究區東南部巖體區,該區域植被覆蓋度高、年降水量大且河流密集,生態環境優良。研究區社會環境等級分布與生態環境的分布趨勢大致相同,都呈現從西北向東南方向變好的趨勢。社會環境等級為差、較差的區域主要分布在研究區西北部,該區域人口密度、道路密度和財產密度大,耕地面積占比和歸一化建筑指數較大,開發程度高,可利用空間少。社會環境等級為中等、較好、好的區域主要分布在研究區東南部,該區域人跡稀少,人口密度、道路密度、財產密度小,建筑物和耕地面積小。
將地貌環境、地質環境、生態環境和社會環境進行加權求和,得到基于隨機森林算法的鞏義市地質環境承載力空間分布,見圖4。研究區地質環境承載力等級分布與地質環境分布狀況大體相同,整體地質環境承載力等級為中等、較好、好的區域面積占49.75%,主要分布在研究區東南部和西部,可適度開發。地質環境承載力等級為差、較差的區域主要分布在研究區東部、南部、東北部和西北部,其中,研究區東部和南部受采礦活動影響,地質災害風險高、地表形變速率大,且斷層較發育,地質環境承載力差,礦山開采和地質災害頻發是影響該區域地質環境承載力提升的主要障礙因子,建議加強對礦山開采的管控,及時開展礦山生態環境修復治理,并做好地質災害防控;研究區東北部、西北部緊鄰黃河,地質災害風險高、黃土濕陷性強、地質災害點密度大,地質環境承載力較差,主要受地質災害和黃土濕陷性制約,建議針對黃土區采取水土流失防治措施,汛期做好地質災害監測與預警,提高民眾的防災、減災意識,開展地質災害治理。對比AHP-CV組合賦權法與隨機森林算法計算的地質環境承載力評價結果,兩種方法評價結果基本吻合,但基于隨機森林算法的評價結果地質環境承載力等級分布更為集中,成片狀分布,與研究區地質災害風險區劃吻合度更高,與研究區實際情況更為相符。
4.3評價結果驗證
將地質災害點、隱患點與地質環境承載力評價結果疊加,統計不同等級地質環境承載力等級面積、災害點數量和密度,基于地質災害點數量和密度對評價結果進行驗證,統計及計算結果見表5。相較于AHP-CV組合賦權法,基于隨機森林算法的評價結果表現更優,災害點數量和密度在承載力差和較差區域顯著增大,地質災害集中分布于地質環境承載力較差和差區域,與實際情況相符。災害點密度在差和較差區域分別提高了0.09、0.03個/km2,且地質環境承載力等級中等、較好、好的區域,地質災害點數量僅占總數的15.38%.與實際情況更為相符,進一步表明隨機森林算法預測結果科學性、準確性更強。
4.4評價結果優化
地質災害風險區劃為影響地質環境承載力評價結果的關鍵因子,因此依據地質災害隱患點和地質災害風險等級,對評價結果進行優化。研究區地質災害實體勾繪區與地質環境承載力評價結果疊加見圖5.根據《地質災害風險調查評價編圖技術要求(試行)》,災害實體勾繪精度要滿足災害體面積大于10000m2或災害體實際長度大于100m,研究區滿足災害實體勾繪精度要求的災害點共145個,總面積8.51km2,地質災害風險等級為低、中、高對應的災害點數量分別為88、48、9。從災害實體勾繪區分布來看,研究區南部大面積的地質災害實體勾繪區的地質環境承載力等級為好,表明該區域地質環境承載力評價結果可靠性低,這種情況是由于傳統地質環境承載力和1:5萬地質災害風險區劃是基于地質災害點密度進行評價及劃分,均未考慮地質災害面積對其評價及劃分結果的影響,因此對隨機森林算法評價結果進行優化很有必要。
對地質災害實體勾繪區內的評價單元的地質環境承載力分級結果進行優化,優化矩陣見表6,優化后地質環境承載力評價結果見圖6.這種優化方法提供了一種有效的地質環境承載力評價優化策略,提高了評價結果的精確性。
5結論
本文在系統分析研究區地質生態環境狀況的基礎上,選擇地形起伏度、地質災害風險區劃、礦區破壞程度及黃土濕陷性等20個評價指標,構建了河南省鞏義市地質環境承載力評價指標體系,分別采用AHP-CV組合賦權法和隨機森林算法確定各評價指標權重,利用ArcGIS空間分析工具對鞏義市地質環境承載力進行了評價。
AHP-CV組合賦權法與隨機森林算法計算的研究區地質環境承載力評價結果基本吻合,隨機森林算法提高了地質環境承載力評價結果的可靠性,評價結果科學性更強、準確性更高,更適應于研究區地質環境承載力評價。地質災害風險區劃、工程地質巖組、黃土濕陷性和礦區破壞程度是影響研究區地質環境承載力提升的主要障礙因子。研究區東部和南部受采礦活動影響,地質災害頻發,地質環境承載力差,建議及時開展礦山生態修復和地質災害防控:研究區東北部及西北部地質環境承載力較差,主要受地質災害和黃土濕陷性制約,建議采取水土流失防治措施。