周玉祥,趙玉,聶仁東,丁丁,郭立華,周佳崢
1. 遼寧工程技術大學礦業學院,遼寧 阜新 123000;2. 華碩智慧科技(北京)有限公司技術部,北京 102200
土地沙漠化是當今全球最嚴重的環境與社會經濟問題之一(Xue et al.,2019;Sterk et al.,2020)。中國是世界上沙漠化危害嚴重的國家之一,尤其是中國北方的土地沙漠化以其面積廣大和發展迅速而引人關注(Sa et al.,2016)。近年來,中國北方春季沙塵暴頻繁發生,自然生態環境進一步惡化,土地沙漠化地質災害問題日趨嚴重,已對當地的經濟發展和人民生命財產的安全構成威脅,直接影響了社會穩定(楊秀春等,2008)。
導致土地沙漠化的原因有內因和外因兩種,內因包括地形和土壤性質,土壤性質又分為土壤物理因素和土壤化學因素,其中以土壤物理因素為主(Kisic et al.,2002;D’Odorico et al.,2013)。外因指大風、植被覆蓋等(Aldrich,2020;Nguyen et al.,2021)。
國內外學者針對土地沙漠化的研究也一直在發展,目前關于土地沙漠化預警的方法也在不斷地改進。Akbari et al.(2020)利用土地退化的有效關鍵指標,以預警地圖的形式提供土地沙漠化風險的早期預警信息,確定了物理和人為過程及其相互關系。Gong et al.(2021)針對風沙荒漠化地區地下水動態在線監測現狀,有效利用網絡簡化數據處理,增加預報預警功能,優化供電系統。Kim et al.(2021)基于土壤退化對大片地區造成重大的社會經濟威脅,利用遙感數據監測沙漠地區風沙侵蝕也得到了很好的應用。
隨著土地沙漠化范圍的不斷擴大,耕地數量減少,嚴重地影響和危害農業生產的發展(Kawanabe et al.,2001)。同時對中部城市群的經濟發展也構成了威脅,尤其是近些年來每年春季沙塵暴頻繁發生,沙漠化預警及其治理迫在眉睫(Sui et al.,2006)。目前,針對某一區域的土地沙漠化程度的評價研究及成因分析的文獻資料較多,缺少比較完整的在不同尺度和不同區域都可利用的沙漠化過程動態評估方法或模型(Bergkamp,1995)。本文通過建立層次分析法與支持向量機模型(AHP-SVM)和層次分析法與隨機森林模型(AHP-RF),結合項目報告《遼寧省下遼河平原沿河及沿海地區土地沙漠化研究》中提取的數據對下遼河平原沙漠化進行了評價監督預警,不僅對研究區的土地沙漠化情況進行了精準評價,還對研究區土地沙漠化發展趨勢進行了預測,對區域土地沙漠化防治工作具有一定的指導借鑒意義。
研究區位于中國遼寧省中部的下遼河平原(圖1),東西雁列遼東、遼西山地,北倚康法丘陵,南臨渤海,縱長240 km,寬120-140 km。地理坐標為121°-123°50′E,40°30′-42°20′N,總面積16 550 km2,范圍包括新民、遼中、臺安、盤山和黑山5 個縣。研究區沙漠化土地面積為816.56 km2,基于遙感圖像解譯,其中重度沙漠化類型約占總面積的4.86%。研究區年平均氣溫8 ℃;年平均降水量650 mm,多集中于6-8 月,占全年降水量的72%-77%(方靜濤,2020)。研究區水系為遼河-雙臺子河水系,遼河-雙臺子河水系下游,坡降很小,河曲發育,泥砂淤積,河床升高,為補給地下水創造了有利的條件,構成區域地下水的主要補給方式。

圖1 位置圖Figure 1 Drawing of site
目前,關于土地沙漠化成因、土地沙漠化程度評判及預測的文獻資料較多,本文重點關注某一地區土地沙漠化程度的評判及發展趨勢預測模型研究。土地沙漠化的成因可歸結自然因素和人為因素兩個方面(馬永歡等,2003)。自然地理條件和氣候變異為沙漠化形成、發展創造了條件,人類活動則激發和加速了沙漠化的進程,成為土地沙漠化的主要原因。本文結合數學模型研究土地沙漠化程度及發展趨勢預測。下遼河平原地處遼寧省中部,多為均勻下降的沖積平原,地貌類型包括遼河、渾河、太子河間地塊沖積平原、柳河沖積波狀平原、河床漫灘、海沖積三角洲平原和海積漫灘。結合相關文獻資料選取了適合研究區域的“土壤質地(C1)”、“植被狀況(C2)”、和“沙丘類型(C3)”和“裸沙占地百分比(C4)”作為土地沙漠化程度的評價指標,其分布特征如圖2 所示。C2 與C4 特征分布相似,說明二者之間存在著一定的影響關系。

圖2 評價指標特征小提琴圖Figure 2 Violin diagram of evaluation index features
本文利用傳統方法層次分析法(AHP)的多準則決策分析與支持向量機(SVM)將多維度非線性問題進行線性模型化、隨機森林(RF)的擇優選取等機器學習方法相結合并對比,分析出最佳的結合方法的同時,也提升了預警的精準度。
層次分析法(Analytic Hierarchy Process)以多準則決策方式把定性分析和定量分析結合了起來(Imamoglu et al.,2019)。因而在信息系統的分析中被廣泛采用(Chen et al.,1994;Jin et al.,2017)。其主要步驟為構造判斷矩陣、求解特征根和一致性檢驗。
本文針對下遼河平原土地沙漠化情況,構建了“土壤質地(C1)”、“植被狀況(C2)”、和“沙丘類型(C3)”和“裸沙占地百分比(C4)”4 個評價指標,利用層次分析法確定他們的權重。之后再通過與RF 和與SVM 的結合,分析潛在沙漠化、輕度沙漠化、中度沙漠化以及重度沙漠化4 個指標在研究區的權重,從而得出沙漠化程度。
隨機森林分類(RF)在給定自變量X下,每個決策樹分類模型都通過一票投票來選擇最優的分類結果(方匡南等,2011)。RF 算法流程如下:
(1)樣本的隨機:從樣本集中用bagging 的方式,隨機選擇n個樣本。
(2)特征的隨機:從所有屬性d中隨機選擇k個屬性(k (3)重復以上兩個步驟m次,建立m棵CART決策樹。 (4)這m棵CART 決策樹形成隨機森林,通過投票表決結果,決定數據屬于哪一類。 RF 能在訓練過程中能夠通過多棵決策樹對任意一個指標計算出多個貢獻率指數,對該數取平均即為該指標的貢獻率(Xu et al.,2012)。與基尼變量貢獻率相比,尤其是在變量之間存在潛在相關性的情況下,使用RF 對指標貢獻率評估更加穩定(Aldrich,2020)。在本文中,主要是利用此方法的擇優功能,與AHP 結合之后,進一步分析出最緊密的影響因素,提高監測預警的精準度。 支持向量機(SVM)是一種有監督的二元分類方法,在統計分類和回歸分析中大范圍的被應用。它是從結構風險最小化的概念發展而來的一種相對較新并且很有前途的分類模型(Xu et al.,2015;Abdelaziz et al.,2017)。 在非線性分類問題中,徑向基核函數通常比其他核函數能獲得更好的結果(Musavi et al.,1992;Robnik-Sikonja et al.,2013)。研究區中,沙漠化程度是一個復雜的系統,所包含的維度信息是多而不易統計的。為了能夠把這些信息通過線性的方法表達出來,利用與AHP 相結合來分析監測預警的精準度。 為了能有效地對比RF和SVM模型對于土地沙漠化的預測能力,本文采用受試者工作特征曲線(Receiver-Operating Characteristic,ROC)以及曲線下面積(Area Under Curve,AUC)和準確度(Accuracy,ACC)對模型的性能進行評價。ROC曲線越靠近左上方越好,越往右下方越糟糕,曲線如果在虛線的下方,證明模型完全無法使用;AUC可用于判斷模型的優劣,AUC 值介于0-1,值越高表明模型的精度越好。當AUC=0.5 時,說明模型不符合真實情況或不具備參考價值,反之AUC越接近1,說明該模型越準確(Chen et al.,2019)。其計算公式如下: 式中: B——曲線下面積,符號進行了修改,代指AUC; P——災害點的總數; N——非災害點的總數; TP——正確分類的災害發生次數; TN——錯誤分類的災害發生次數。 綜上所述,在下遼河平原沙漠化土地程度評價的指標體系中,本文建立了C1-C4 等4 個評價指標結構。根據研究區下遼河平原的特點,對指標進行兩兩比較,構造沙漠化土地程度評價的指標的判斷矩陣,從而確定各個指標的權重。采用層次分析法對土地沙漠化的評價指標層構造出判斷矩陣A并按照上述確定土地沙漠化評價指標權重的步驟求出決策指標因素U1,U2,U3,U4 所對應的權重為ωi(i=1, 2, 3, 4)。其結果如表1 所示。 表1 判斷矩陣ATable 1 Judgment Matrix A 在確定了不同指標的權重后,利用區域內不同土地沙化程度評價的指標進行加權和運算,可以得到土地沙化程度評價的指標對土地沙漠化的總體影響狀況。在土地沙漠化指標的值與權重的設置中,其值與權重越大則它表示土地沙化的程度也就越大。本文以SI 指數代表土地沙漠化程度,其公式為: 式中: M——土地沙漠化程度,符號進行了修改,代指SI; i——第i類土地沙漠化類型,值越大則說明沙化程度越大; ωi——第i類土地沙漠化權重; Ai——第i類土地沙漠化評價指標; 經AHP 初步評價后,得到了研究區沙漠化的綜合加權得分,如表2 所示。 表2 樣本綜合得分Table 2 Comprehensive scores of samples 本文共解譯出研究區38 處沙漠化區域,根據SVM 和RF 模型的分類要求,將AHP 模型下的數據按照按沙漠化程度分級指標將樣本劃分為輕度(<50)、中度(50-70)和重度(>70)。將劃分好的數據輸入SVM和RF模型中,并基于上述方法,將數據集以0.7 和0.3 的比例隨機化分訓練集和測試集,完成AHP-SVM 和AHP-RF 模型的構建。其預測結果如表3 所示,AHP-RF 的預測結果相對較好,只出現了1 個樣本的錯誤。 表3 樣本綜合得分Table 3 Comprehensive scores of samples 本研究構建的兩個模型性能評價不一,準確度有所差別,選擇合適的、最優的模型更有利于對研究區進行評價(范澤孟等,2020)。ROC 曲線和AUC 值可簡單直觀地體現模型地分類預測能力,不同模型的ROC 曲線如圖3 所示。AHP-SVM 和AHP-RF 模型的AUC 值分別為0.73 和0.89。AHP-RF 模型顯示了較高的準確率,RF 模型本身對異常值與噪聲的敏感較低,可針對性處理大量的數據樣本,能夠有效避免分類結果的過擬合(Yang et al.,2021)。 圖3 ROC 曲線圖Figure 3 ROC curve 影響指標在各種評價預測中都十分重要,其合理選擇是預測成功與否的關鍵(Yu et al.,2020)。本研究利用評價模型對研究區土地沙漠化進行了分類預測,其AUC 值顯示了AHP-RF 模型的良好性能。因此,本研究基于AHP-RF 模型對研究區沙漠化影響指標進行了分析(圖4)。在4 項影響指標中,C2 和C4 的影響最大,表明在土地沙漠化程度評價中“植被狀況(C2)”和“裸沙占地百分比(C4)”兩項指標起著決定作用,深入研究植被和裸沙的空間分布及其動態特征,為解釋土地沙漠化變化的規律及其機制提供依據。植被稀少,巖土裸露面積增大,日照蒸發,風吹干燥作用隨之增加,巖土內水分大量缺失,為土地沙漠化的形成提供了沙源。因此,沙漠化地區應重視植被的建設與管理,防止盲目開荒種地,致使一些固定沙丘被風蝕逐漸演化為半固定沙丘,導致土地沙漠化加劇。 圖4 指標重要性圖Figure 4 Indicator importance map 由于自然土地沙漠化過程和人為加速土地沙漠化過程兩方面的共同作用,現階段下遼河平原土地沙漠化程度仍在加劇,與1985 年調查資料進行對比分析,85 年下遼河平原土地沙漠化面積為232.46 km2,2007 年土地沙漠化面積增加到816.56 km2,22 年翻了近2 倍。本文基于AHP-RF 對研究區土地沙漠化的分類預測結果也表明,各種活動造成的植被稀少,水土流失嚴重,均說明土地沙漠化發展態勢仍十分嚴峻。因此可以預見,下遼河平原沙漠化土地在今后相當長的時間內有進一步擴展的趨勢,應采取積極的措施加以研究和整治沙漠化土地。 隨著人口的持續增長、對糧食、副食燃料等各種需求的與日劇增,加上落后的生產方式不可能在近幾年內有較大的改變,以及各種工程活動,導致研究區域植被狀況惡化、裸沙占地百分比增加,進一步加劇了下遼河平原沙漠化的進程,在今后防治過程中應重點加強植被建設。 (1)采用流域單元作為評價單元,本文構建AHP-RF 和AHP-SVM 模型對下遼河平原沙漠化進行了分類預測。經對模型進行參數調優和對數據集優化,最終RF 模型的AUC 值達到了0.89,優于SVM 模型的AUC 值(0.73),表明隨機森林模型更適用于研究區沙漠化的分類預測。 (2)本文采用7:3 的比例對數據集進行劃分,以38 組數據為基礎數據結合“土壤質地”、“植被狀況”、“沙丘類型”和“裸沙占地百分比”4個指標構建的AHP-RF 模型,結果表明,植被狀況、裸沙占地百分比為沙漠化的主控指標,其余兩項因素也起到了重要作用。 (3)分析統計模型的預測結果發現,植被作為最重要的影響因素,受到了氣候以及各種人類活動的多重影響,土地沙漠化惡化,針對改善植被狀況的治理措施是首選。 本文在指標選取和處理過程中仍存在些許不足之處。機器耦合也有一定的局限性,在AHP-RF模型中,若影響因素增加,擇優的難度就會增加,會出現權重數據接近的問題;在AHP-SVM 模型中,對于核函數的使用仍需擴展。在指標選取過程中具有一定的主觀性,今后需要更進一步地分析誘發土地沙漠化的指標,將可能存在的指標納入初選指標中。2.3 支持向量機模型
2.4 模型驗證
3 結果與討論
3.1 AHP 模型應用


3.2 AHP-SVM 與AHP-RF 模型應用

3.3 模型驗證

3.4 影響指標分析

3.5 土地沙漠化的趨勢預測
4 結論