周海濤, 寧小莉, 張雪峰, 魏光慧
(內蒙古科技大學 包頭師范學院, 內蒙古 包頭 014030)
農村居民點作為人類生產生活的重要載體[1-3],伴隨著中國改革開放社會經濟的飛速發展,在快速城鎮化和工業化的擾動下[4],以及城鄉二元結構的長期束縛和“重城輕鄉”發展戰略導向驅使下[5-6],農村居民點用地粗放、功能單一、缺乏規劃、空心化、貧困化、環境污染化等一系列“鄉村病”日益凸顯、越發嚴重[7]。黨的“十九大”審時度勢,鮮明指出中國特色社會主義進入新時代,并首次提出“實施鄉村振興戰略”,致力于建設“產業興旺、生態宜居、鄉村文明、治理有效、生活富裕”的現代化新農村[6]。鄉村振興,生態宜居是關鍵,居民點適宜性評價是進行鄉村整治、優化重構,改善人居環境的前提基礎[8-10]。因此,在新時代實施鄉村振興戰略背景下,基于科學、客觀的居民點適宜性評價結果,立足區域發展實際、根據資源稟賦因地制宜的探索開展人居環境整治,已成為亟待解決的重點前沿課題。
國際學者針對農村居民點適宜性評價開展了大量研究,取得豐碩成果。總結已有研究,主要呈現以下幾方面特點:(1) 研究地域多樣化。涵蓋平原、山地、農區、盆地、少數民族區域和生態經濟區,主要有陜西關中平原腹地西安楊陵區[11]、寶雞市隴縣[12]、黑龍江省五常市[13]、山西忻定盆地忻府區[14]、江西省潘陽湖生態經濟區潘陽縣[15]、西南典型低山丘陵區[16]以及四川盆地震后重建北川羌族自治縣[17]、川中丘陵隆昌市[18]、成都平原都江堰市[19];(2) 評價指標完善化。在傳統的土地適宜性評價指標,例如高程、坡度、坡向等自然因素[19]以及距道路、距城鎮等區位因素[16]的基礎上,根據評價目標的導向性以及區域的差異性,反映社會經濟發展狀況的人居可支配收入、人口城鎮化率、土地經濟密度等因子,以及土地利用類型、生態保護區、人文景觀、地質災害、植被覆蓋度等生態環境因素逐漸納入到評價指標體系中[13-15,20];(3) 研究數據多源化。涵蓋了中國資源3號衛星、全球MODIS NDVI,Landsat OLI,DEM等遙感影像數據,土地利用現狀、國土資源調查及年度變更等土地利用數據,地形圖、土壤圖、交通道路、河流水系、植被、地質災害、城鄉規劃等輔助數據以及統計年鑒等社會經濟統計數據[11,13,21-22];(4) 評價模型、理論豐富化。在傳統的土地資源學土地適宜性評價理論基礎上逐漸引入景觀生態學、生態位理論[23-24]、AVC三力[20]、“源、匯”景觀理論等[25]新理論,評價模型在傳統的AHP層次分析法基礎上,利用RS遙感影像,基于GIS空間分析,最小積累阻力模型[19]、灰靶模型[26]、生態位適宜度模型[27]、物元模型等[28]模型方法已廣泛應用到居民點適宜性評價中。已有研究成果豐富了農村居民點適宜性評價前沿研究,為農村居民點規劃、整治、重構,人居環境改善及鄉村振興戰略實施提供科學依據。但尚且存在部分問題沒有很好的解決,例如評價因子權重賦值人為主觀臆斷現象。截至目前,評價指標因子選取和因子權重賦值尚無統一規范或標準,主要依靠參與人員或專家經驗進行權重賦值,因而由于人員的專業背景、學術經驗差異化以及研究區域的獨特性,導致因子權重賦值存在較為嚴重的人為主觀臆斷現象,進而引發評價結果準確性存在偏差。
基于數據驅動的機器學習方法可以杜絕人為主觀臆斷影響。近年來,隨著信息科學技術的興起,使得基于數據驅動的機器學習方法在土地科學領域的土地類型分類[8]、城市擴張[29]、資源生態安全評價[30]、棲息地適宜性評價等[31]方面得到了廣泛運用。探討基于數據驅動的機器學習方法在居民點適宜性評價領域應用的案例成果雖為罕見,但已成為學術前沿研究趨勢[8]。因此,本文以生態環境脆弱、少數民族邊疆地區的內蒙古包頭市達爾罕茂明安聯合旗(簡稱達茂旗)為例,基于數據驅動的機器學習maxEnt模型方法,選取DEM、坡度、坡向自然環境因素,距道路距離、距城鎮距離區位條件因素,距耕地距離、距林地距離、距水域距離生產條件因素以及植被覆蓋度、距草地距離生態環境因素,對達茂旗居民點空間分布適宜性進行評價研究,進而厘清各因子要素對居民點適宜性影響的重要程度,明晰適宜區居民點與各因子要素的最佳配置關系,以期為該區域居民點優化整治、人居環境改善提供新思路。
達茂旗全稱達爾罕茂明安聯合旗,地理位置處于109°16′—111°25′E,41°20′—42°40′N,位于陰山山脈北麓,北與蒙古國接壤,東鄰烏蘭察布市四子王旗,西接巴彥淖爾市烏拉特中旗,南連呼和浩特市武川縣、包頭市固陽縣,國境線長88.6 km。達茂旗是包頭市唯一以蒙古族為主體、漢族占多數、多民族聚居的邊境少數民族地區,旗內總人口12萬人,其中少數民族1.83萬人(蒙古族1.73萬人),有蒙、漢、回、滿等15個民族。全旗管轄7個鎮、2個鄉、3個蘇木、77個村(嘎查)委員會,總面積1.82萬km2,其中天然草場面積1.66萬km2,是內蒙古自治區十大天然牧場之一。達茂旗地處大青山西北內蒙古高原地帶,地勢南高北低,緩緩向北傾斜,南部屬丘陵區,中、西有低山陡坡,北部屬高平原臺地,間有開闊原野,最高海拔1 846 m,平均海拔1 367 m。達茂旗地處中溫帶,又深居內陸腹地,大陸性氣候特征顯著,屬中溫帶半干旱大陸性氣候。達茂旗地廣人稀,資源豐富,民族文化底蘊深厚,居民點建設功能單一,缺少規劃,呈“滿天星”的高度離散特征[32]。
研究所用數據主要包括達茂旗2016年1∶5萬土地利用類型及道路數據、Landsat8 OLI(時相為7—8月)和DEM遙感影像數據,研究區行政邊界等矢量數據。基于ArcGIS 10.0軟件平臺,利用DEM數據提取研究區坡度、坡向因子。以土地利用類型數據為基礎,提取研究區河流水域、林地、草地、耕地、居民地及城鎮圖層。利用ENVI 5.1軟件對Landsat8 OLI數據進行輻射定標、大氣校正、鑲嵌等處理。所有因子圖層統一投影坐標系,進行掩膜裁剪等預處理。
2.2.1 maxEnt模型 生態位被認為是一個生物單元(個體、種群或物種)生存條件的總集合體,其主要反映生物個體或種群在生態系統中,在時間空間上所占據的環境、位置及其與相關種群之間的功能關系與作用[23-24,33-34]。農村居民點是生產生活等綜合功能的重要載體,受區域自然、社會、經濟等多重因素的影響與制約,是一種自然—社會—經濟綜合一體的復合生態位[23-24]。因此,生態位理論已廣泛應用到居民點適宜性研究領域中。maxEnt模型由Philips團隊于2004年利用JAVA語言編寫開發,利用物種“出現點”樣本數據及周邊環境特征信息,計算最大熵概率的可能分布進而預測物種潛在的最佳空間分布位置及釋義與周邊環境關系的一種基于數據驅動的機器學習生態位理論經典模型[35-36]。maxEnt模型自發布以來在物種潛在分布預測[37]、棲息地適宜性評價[31,36]、疾病空間傳播[38]、人口與社會環境關系評價[39]、古文化遺址保護等[40]研究領域備受國內外學者的青睞,部分學者已將maxEnt模型引入到居民點適宜性評價[41]、聚落格局優化等[42]人居環境研究領域中。
2.2.2 因子選取 農村居民點作為人類活動的重要空間場所,其空間分布受自然因素、社會經濟條件等多重因素影響與制約[32]。綜合已有研究成果[43-45],本文選取DEM、坡度、坡向自然環境因素,距道路距離、距城鎮距離的區位因素,距耕地距離、距林地距離、距水域距離生產條件因素以及植被覆蓋度、距草地距離生態環境因素對達茂旗居民點空間分布適宜性進行評價研究。
(1) 自然環境因素。基于ArcGIS 10.0軟件平臺,利用空間分析功能,從研究區30 m×30 m分辨率的DEM數據中計算出研究區坡度、坡向因子。
(2) 區位條件因素。基于研究區2016年1∶5萬土地利用數據,利用屬性提取功能提取出研究區城鎮圖層,采用距離制圖功能計算出距城鎮距離因子。對研究區1∶5萬道路數據距離制圖得到距道路距離因子。
(3) 生產條件因素。基于研究區2016年1∶5萬土地利用數據,利用屬性提取功能提取出研究區耕地、林地、水域圖層,采取距離制圖功能得出距耕地距離、距林地距離和距水域距離因子。
(4) 生態環境因素。利用研究區時相為7—8月的Landsat8 OLI影像數據,采用ENVI 5.1軟件,結合像元二分法[46-47]提取研究區植被覆蓋度因子。利用ArcGIS 10.0屬性提取功能從土地利用數據中提取草地圖層,采用距離制圖功能獲得距離草地距離因子。
2.2.3 模型構建 將2016年居民點數據按照maxEnt模型要求,以名字和經度、緯度編輯保存為.asv格式文件。所有圖層統一投影坐標系,統一邊界及分辨率,轉換為.asc格式。隨機選取70%居民點數據用于模型驅動,30%數據用于精度驗證,選擇刀切法(Jackknife)判讀環境因子重要性。利用ROC曲線下的AUC值檢測模型精確度,AUC值在0.5~0.7表示模型精度較低;0.7~0.9表示模型精度較好;0.9~1代表模型效果最優精度較高[41,48]。為提高評價精度,模型重復迭代運行10次,結果以Logistic形式輸出。
陽光餐飲示范街(區)的審核是與中國烹飪協會北京市餐飲行業協會聯手,從基礎條件、明廚亮灶、管理水平、誠信管理、社會責任、清潔衛生等維度進行的綜合評判。今年首次開展的陽光餐飲示范村遴選工作,中國烹飪協會結合北京美麗鄉村建設,挖掘出了6個各具特色的示范村,即:門頭溝清水鎮黃塔村、昌平十三陵鎮仙人洞村、延慶大莊科鄉鐵爐村、懷柔喇叭溝門滿族鄉中榆樹店村、懷柔湯河口鎮后安嶺村、平谷黃松峪鄉刁窩村。
適宜性評價指標體系因子量化結果見圖1。研究區高程值為1 000~1 861 m(圖1A),其坡度(圖1B)最大值為53.947°,坡向值范圍為0°~359.665°(圖1C);區位條件因素中居民點距道路距離(圖1D)及距城鎮距離(圖1E)其最大值分別為68 503,112 281 m;生產條件因素中居民點距林地距離最遠,其峰值為112 295 m(圖1G),距耕地(圖1F)及水域距離(圖1H)最大值依次為87 957, 69 385 m;生態環境因素其植被覆蓋度(圖1I)值在0~1區間,達茂旗東南部地區植被覆蓋度值較高;居民點距草地距離最大值為66 628 m(圖1J)。

圖1 評價因子量化結果
ROC曲線分析表明,模型10次迭代運行結果AUC平均值為0.753,遠高于模型隨機AUC值(0.5),表明maxEnt模型評價精度較好,具有一定適用性。
利用ArcGIS 10.0空間分析的重分類Natural Breaks(Jenks)方法對maxEnt模型適宜性評價結果進行適宜性等級劃分,依次劃分為4個等級(圖2),分別為非適宜區、次適宜區、較適宜區和最適宜區。根據適宜區空間分布圖,計算出各適宜等級區所占研究區的面積及百分比(表1)。達茂旗居民點最適宜區面積為3 274.498 km2,僅占研究區總面積的18.738%,研究區內較適宜區所占面積最大,占比為27.656%,略高于次適宜區等級面積。

圖2 達茂旗居民點空間分布適宜性等級
由圖2可見,達茂旗居民點空間分布最適宜區主要分布在百靈廟鎮東北部、石寶鎮東南部的石寶村、腮烏素村、幸福村,希拉穆仁鎮的哈拉烏素、白彥淖爾,烏克忽洞鎮的烏克忽洞村、大西灘村、烏蘭忽洞村和東河村,西河鄉的西河村、前河村及德令溝村,達爾罕蘇木鄉的查干敖包嘎查南部、哈沙圖嘎查等區域。非適宜區主要分布在達茂旗北部的滿都拉鎮、巴音花鎮及查干哈達蘇木區域內,達茂旗西南部的明安鎮也存在大面積非適宜區。

表1 2016年居民點空間分布適宜性等級劃分
3.4.1 因子重要性分析 maxEnt模型使用刀切法判斷環境因子的重要性。如圖3所示,距道路距離、距耕地距離及距林地距離因子對居民點空間分布適宜性影響較大,其次為距草地距離、距城鎮距離及植被覆蓋度值,而距水域距離、坡度、DEM及坡向因子對居民點適宜性影響作用較弱。
3.4.2 評價因子與居民點空間分布適宜性關系分析根據maxEnt模型模擬各因子對居民點空間分布適宜性影響的反映曲線(圖4),可以直觀分析出達茂旗居民點空間分布適宜性隨各因子數值的改變而變化的趨勢。圖4A顯示達茂旗居民點隨著DEM值的增加其適宜性逐漸增大,大約DEM值在1 350~1 400 m區間時適宜性達到峰值,DEM值在1 400~1 650 m時居民點適宜性趨于平穩變化不大。坡度因子(圖4B)反映出隨著坡度值從0°增大其適宜性增加,在坡度值達到約2.5°時最適宜,隨后坡度值增加其適宜性迅速降低。坡向值大約在126°~234°區間時最適宜居民點分布(圖4C),該區間為東南坡、南坡和西南坡。圖4D為達茂旗居民點適宜性與距道路距離的關系,隨著距道路距離的增加其適宜性逐漸降低,大約在距離道路1 500 m時適宜性不再隨距離的增加而發生變化。達茂旗居民點空間分布適宜性距城鎮距離的變化趨勢整體與距道路距離因子呈現出一致性,但距城鎮距離因子變化趨勢緩慢(圖4E)。隨著距耕地距離的增加達茂旗居民點適宜性下降,在距耕地距離約為4~15 km時,適宜性無變化,超過15 km時適宜性呈斷崖式下降,超過臨界值約20 km之后適宜性趨于平緩(圖4F)。距林地距離對達茂旗居民點適宜性的影響表現出隨著距離的增加其適宜性逐漸降低的趨勢(圖4G)。圖4H表明距水域距離與距耕地距離因子影響趨勢相似,距水域距離值約在1.5~12.5 km區間時適宜性無明顯變化,在此臨界值后,適宜性斷崖式迅速降低,斷崖式現象較明顯。達茂旗居民點空間分布適宜性隨著植被覆蓋度值的增加而表現出明顯的增加趨勢,表明植被覆蓋度值越大適宜性越高(圖4I)。草地對達茂旗居民點空間分布適宜性的影響表現出距草地距離增加其適宜性增加,大約在300~800 m距離時最適宜居民點空間分布(圖4J)。

圖3 因子重要性刀切圖
評價因子響應曲線顯示出,達茂旗居民點空間分布適宜性分區在高程值選擇上并未呈現出低地取向性,高程值約在1 350~1400 m時適宜性最高,在1 400~1800 m時也呈現出較好的適宜性,該結果與已有研究結論一致[32,49]。達茂旗地處陰山北麓,區內地勢南高北低,呈現出向北逐漸傾斜趨勢,居民點空間分布上也具有南部聚集北部較離散的特征。坡度值在0°~2.5°區間內隨著坡度值增加其適宜性增高,而在15°臨界值之內,隨著坡度增加其適宜性降低,該結果與一般研究結論相同。達茂旗居民點空間分布適宜區多集中在坡向值126°~234°,即東南坡、南坡和西南坡上。李飛等[50]對同屬于農牧交錯區的科爾沁左翼中旗農村居民點研究中同樣證實農牧交錯區的居民點在坡向選擇中部分居民點坐落于東南坡等陰坡,同樣現象在張鑫等[49]對達茂旗居民點空間分異特征研究中也得到佐證。
maxEnt模型與傳統模型對比在對達茂旗居民點空間分布適宜性評價中表現出一定的優越性,為基于數據驅動的機器學習模型與方法對鄉村地理學研究中居民點適宜性評價、人居環境優化重構等研究提供參考案例。但在maxEnt模型評價結果進行適宜區等級劃分中尚無統一標準,進而導致各類適宜區空間分布位置及面積大小等受到一定影響。農村居民點作為人類生產生活的重要載體,已然成為一種自然—社會—經濟的復合生態位,深受自然環境、社會經濟發展、民族文化、民族信仰,政府調控政策等多重因素的影響,由于數據獲取等原因,本文僅局限于單一時間點分析,而未能夠對其進行長時間序列的綜合全面研究。maxEnt模型雖然備受國內外學者青睞,近年來得到了較為廣泛的認可和較高的使用率,但該模型其普適性等問題還需慎重考慮,通過廣泛的應用及逐漸的改進優化,該模型將會給居民點適宜性研究帶來新的憧憬,基于數據驅動的機器學習模型與方法也終將開拓鄉村地理學研究的新境界。

圖4 因子響應曲線
(1) 達茂旗居民點空間分布最適宜區面積最小,主要分布在達茂旗百靈廟鎮東北部、石寶鎮東南部、希拉穆仁鎮南部、達爾罕蘇木鄉西北部及達茂旗南部的烏克忽洞鎮及西河鄉范圍內,非適宜區多集中在達茂旗北部的滿都拉鎮、巴音花鎮和查干哈達蘇木區域內,所占面積高于最適宜區占比。
(2) 距道路距離因子對達茂旗居民點空間分布適宜性影響最為重要,距草地距離、距城鎮距離及植被覆蓋度因子影響重要性低于距耕地距離和距林地距離因子。相比較上述因子而言,距水域距離、坡度、DEM及坡向因子對達茂旗居民點空間分布適宜性影響作用最弱。
(3) 高程值在1 350~1 400 m時最適宜,無低地取向性,但有較明顯的低平緩坡度指向性,0°~2.5°適宜性最高。坡向方面適宜區青睞于南坡和西南坡,東南坡陰坡上也具有一定適宜性。隨著距道路、城鎮的距離值增加適宜性降低。距耕地距離因子與距水域距離因子影響趨勢相似,起初適宜性隨著距離增加而降低,接著出現適宜性平緩區域,超過某個臨界值后適宜性呈斷崖式下降,最后趨于無變化。距草地距離約300~800 m時適宜性最好,植被覆蓋度值越高其居民點空間分布適宜性越高。