鐘克強,李愛迪,武 偉,劉洪斌
(1.西南大學資源環境學院,重慶 400716;2.西南大學計算機與信息科學學院,重慶 400716)
西南山區地形因子對農村零散居民點分布的影響
鐘克強1,李愛迪1,武 偉2,劉洪斌1
(1.西南大學資源環境學院,重慶 400716;2.西南大學計算機與信息科學學院,重慶 400716)
為探究西南山地地形因子對農村零散居民點分布的影響,以巫溪縣(中山區域)和酉陽縣(中低山區域)的農村零散居民點分布為研究對象,結合GIS軟件和隨機森林模型,探討了不同地形因子下農村零散居民點的分布特征以及高程、坡度、坡向、地形粗糙度、平面曲率、剖面曲率、地形特征指數、地形部位指數等8個地形因子對農村零散居民點分布影響的重要程度。結果表明:山地農村零散居民點多分布于海拔600~1 200 m的緩地與斜坡以及位于半陽坡與陽坡、中坡位、地形特征指數小于-0.010、平面曲率和剖面曲率接近于0的區域,說明山地區域農村零散居民點多分布于垂直方向上的中高地形位、水平方向上以低變化率地形位為主的區域;影響中低山地農村零散居民點分布的主要地形因子為地形粗糙度、平面曲率和坡度;其中,影響中山區域的農村零散居民點分布的最重要的地形因子是地形粗糙度,而中低山區域則是平面曲率。
農村零散居民點;山地;地形因子;分布特征;重要性
我國地形復雜多樣,地形因子與土地利用空間分布有著密切的關系。農村居民點作為土地利用的一種主要類型,其布局是自然因素與社會因素共同作用的綜合響應[1-3],也是自然條件在地形形態上的反映[4]。在海拔較高的山地區域,農村居民點以散戶和獨院為主,分布不均勻、布局凌亂[5-7],且大多在遠離城鎮、交通不便、水源不足的區域[8],因此地形地貌等自然環境因素是決定山區農村居民點空間選址的關鍵約束力,而后期形成的社會經濟及生產環境因素則是決定其規模擴張的驅動力[9-10]。近年來,隨著數字高程模型(Digital Elevation Model,DEM)數據的廣泛應用,地貌形態要素被越來越多的學者引用來分析地形與居民點布局之間的關系[11-12]。焦貝貝等[13]、張霞等[14]通過地形因子分析了山地丘陵區農村居民點的空間格局,結果表明地形因子對區位、交通水源條件處于劣勢的農村居民點的分布起到關鍵作用。
隨機森林算法通過bootsrap重抽樣方法能夠有效的辨別出變量的重要性,具有很好的分類性能和較高的分類準確性,是一種可靠的機器學習算法[15-16]。唐建榮等[17]運用隨機森林算法對影響碳足跡的13個指標做出了重要性排序,其模型的相關性系數達到了0.997 1。Martin等[18]運用隨機森林模型確定了影響土壤中有機質含量的重要因素,包括土地利用類型、高程等。Grimm等[19]采用隨機森林模型分析影響土壤有機碳的因素,結果表明土層厚度對有機碳含量的影響較大。Guo等[20]在對土壤有機質的數字制圖研究中綜合比較了隨機森林模型和克里格回歸模型的優缺點,結果表明隨機森林模型的變量重要性結果更加可靠。前人的研究表明,變量的重要性可以通過機器學習算法確定,但目前在特定區域內研究地形因子對農村居民點零散分布的重要程度貢獻率的報道仍較少見。因此,筆者采用隨機森林算法,探討了研究區域內不同地貌形態要素對農村居民點分布影響的重要性,以期找出影響農村零散居民點分布的關鍵因子。
1.1 研究區概況
重慶市地貌特征復雜,其中山地占總面積的76%,主要集中于東北部和東南部。筆者選取了東北部的中山區域和東南部的中低山區域來開展山地農村零散居民點與地形因子關系研究。其中,中山區域以巫溪縣為例,中低山區域以酉陽縣為例。巫溪縣位于重慶東北部,縣境幅員面積 4 030 km2,地處東經108°44′~109°58′、北緯31°14′~31°44′之間,縣域最高海拔2 355 m,最低海拔159 m,屬中山區。酉陽縣位于重慶東南部,縣境幅員面積5 173 km2,地處東經108°18′~109°19′、北緯28°19′~29°24′之間,最高海拔1 702 m,最低海拔218 m,屬中低山區。

圖1 研究區位置示意圖
1.2 研究方法
在比例尺為1︰10 000的土地利用現狀數據庫基礎上,運用SimDTA(Simple Digital Terrain Analysis)軟件提取巫溪、酉陽2縣30 m×30 m DEM的高程、坡度、坡向、平面曲率、剖面曲率、地形粗糙指數、地形特征指數、地形部位指數8類地形因子,并進行分級定義;再運用Spss軟件和R語言軟件分別進行統計描述和重要性分析,找出中低山區域農村零散居民點用地的空間分布特征以及影響其分布的關鍵地形因子。
1.2.1 農村零散居民點的劃分 農村居民點的分布受地形影響較大,因此形成了不同大小的聚居形態,劉明皓等[21]將農村居民點的聚落形態劃分為集鎮(大聚落,>500人)、中心村(中聚落,300~500人)、基層村(小聚落,150~300人)、散戶及獨院(<150人)。在這個分類標準的基礎上,結合重慶市2013年農村居民人均住房面積標準,將面積小于6 232.5 m2的居民點歸屬為零散居民點。
1.2.2 地形因子 地形因子作為山地丘陵區土地利用格局分布的重要影響因素之一,其變化直接影響到地面的物質流動與能量轉化。地形因子對人類活動的限制性和對不同土地利用類型空間分布的自然選擇性,使得不同地類在地形梯度上的分布呈現出規律化變化特征[22]。高程、坡度、坡向等地形因子是表述地貌的3大傳統要素,隨著研究的深入,傳統地形因子已不足以反映地貌全部特征,筆者又引進平面曲率、地形粗糙度等因子來研究中低山區地形對農村零散居民點分布的影響。在前人研究的基礎上,以土地利用現狀數據為基礎,結合研究區的地形特征,對研究區的地形要素進行分級,如表1所示。
1.2.3 隨機森林算法 該算法是Breiman于2001年提出的一種非線性建模工具[23],基于bootsrap重抽樣方法從原始樣本中抽取多個樣本,對每個bootsrap樣本進行決策樹建模,然后組合多棵決策樹的預測,通過投票得出最終預測結果。該方法具有較高的預測準確率,對異常值和噪聲具有很好的容忍度,且不容易出現過擬合[24]。選擇零散居民點圖斑面積作為因變量,8類地形因子作為自變量,評價8類地形因子對巫溪、酉陽2縣農村零散居民點分布的影響程度。通過隨機森林算法建立回歸模型,以全部因變量為驗證集,對每一個因變量進行預測,獲得每個因變量的預測值。用平均絕對誤差(MAE)、歸一化均方誤差(NMSE)、均方根誤差(RMSE)和決定系數(R2)等對模型的精度進行評價,其公式如下:

表1 地形因子分級標準

2.1 統計描述分析
巫溪、酉陽2縣分別有44 597、29 329個農村居民點,總面積約為110 584.703、9 370.1 hm2;而巫溪縣零散的農村居民點有42 993個,酉陽縣有25 019個,面積分別為5 935.98、3 997.14 hm2,分別占各縣農村居民點總個數的96.40%、85.30%。由此可見,山地區域農村居民點以零散分布為主。
由表2可知,中山區域農村零散居民點的平均面積明顯小于中低山區域,但地形因子值明顯大于中低山區域,這表明以巫溪縣為代表的中山區域的地形更加復雜,梯度變化特征更加明顯,且中山與中低山區域農村零散居民點的分布存在空間差異性。
2.2 農村零散居民點面積分布特征
從圖2中可以看出,巫溪、酉陽兩個區域的農村零散居民點面積以0.05~0.10 hm2范圍內分布最多。其中,巫溪的農村零散居民點集中分布在該范圍內,占到了農村零散居民點總數的41.39%;酉陽縣該區間的農村零散居民點占總數的26.66%,各區間分布相對均勻。這表明山區的農村零散居民點分布由于受地形限制,斑塊面積主要在0.1 hm2以下,且海拔越高,地形越復雜的區域農村零散居民點的斑塊越零碎[25]。

表2 地形要素基本統計描述

圖2 農村零散居民點斑塊面積分布趨勢
2.3 地形因子下農村零散居民點分布特征
從高程來看,巫溪縣的農村零散居民點集中在600~1 200 m,其中800~1 000 m區間內最多,占總面積的20.12%。從坡向來看,東南、正南、西南3個坡向的農村零散居民點依次占總面積的15.05%、22.82%、14.63%;從坡度來看,農村零散居民點主要分布在6°~15°和15°~25°的緩地和斜坡上,分別占總面積的30.25%和33.25%;另外,坡度大于25°的山區,仍有一定數量的農村零散居民點分布,這與焦歡等[26]的結論一致。33.85%的農村零散居民點集中分布在-0.06~0.06的平面曲率區間,而剖面曲率則以-0.001~0.001區間分布較多,這些區域內高程變化小。地形特征指數上,小于-0.01的區間農村零散居民點較多;地形粗糙度各區間內,0~12等級范圍內農村零散居民點較多。從地形部位指數來看,中坡位的農村零散居民點面積占總面積的54.75%(圖3)。
酉陽縣的農村零散居民點在高程上多分布于400~1 000 m,其中600~800 m范圍內分布最多,占總數的29.68%,這個高度比巫溪縣低200 m左右;坡向上,正東、東南坡向農村零散居民點分布密集,其面積分別占總面積的18.71%、17.45%;與巫溪縣相同的是,酉陽縣的農村零散居民點同樣主要分布在緩地和斜坡。平面曲率為-0.06~0.06是渝東地區山地農村零散居民點分布的共有特征。剖面曲率上,以-0.001~0.001為主;地形特征上,<-0.01的地形位上最多;地形粗糙度各梯級區間內,集中于0~9的空間尺度下,范圍窄于巫溪縣;坡位上,中坡位最多,占到了農村零散居民點總面積的42.71%(圖3)。
從高程、坡度、坡向、剖面曲率和地形部位指數5個地形因子來看,農村零散居民點的分布呈現中間區間多、兩端區間少的趨勢;從在地形粗糙度與地形特征指數2個地形因子來看,農村零散居民點分布隨等級的增加而減少;而從平面曲率來看,中低山的農村零散居民點呈“W”形分布,在平面曲率(含正負)較大的地方也有少量分布。
由于受到農業生產耕作半徑的影響[27-28],中山區域相對于中低山區域在坡度更大、海拔更高的地方仍有一定數量的農村零散居民點分布。高程、坡度、地形粗糙度3個地形因子下農村零散居民點分布特征表明,中山區域農村零散居民點集中分布的垂直高度高于中低山區域,而從平面曲率因子上可以發現,水平方向上兩個區域的農村零散居民點都更多的分布在曲率變化較小的區域。
2.4 隨機森林模型結果分析
2.4.1 隨機森林模型精度評價 由表3可知,通過隨機森林模型評價,巫溪縣和酉陽縣的MAE、NMSE、RMSE等指標值均較小,同時決定系數均在0.965 0以上,且相關性達極顯著水平,這表明模型具有較高的可靠性。

表3 隨機森林模型精度評價
2.4.2 地形因子重要性預測結果 在R語言中采用隨機森林模型對影響兩個區域的地形因子的重要程度進行排序,分別選取兩個縣所有農村零散居民點面積作為模型因變量,高程、坡度等8個地形因子作為自變量,得到其相對重要性指標——均方誤差的增加幅度(%IncMSE)。該指標是依據袋外數據(OOB data)計算誤差,即假設模型中不存在某個變量時,會對模型誤差造成怎樣的影響[17]。
如圖4所示,兩個縣的地形因子重要性排序分別為:巫溪,地形粗糙度>坡度>平面曲率>地形部位指數>高程>地形特征指數>坡向>剖面曲率;酉陽,平面曲率>地形粗糙度>坡度>地形部位指數>高程>坡向>剖面曲率>地形特征指數。該結果表明,影響中低山區農村零散居民點分布的關鍵地形因子基本相同,即平面曲率、地形粗糙度和坡度,其重要性貢獻率均超過了50%;地形特征指數、坡向、剖面曲率3個地形因子作用均不明顯;同時,各個地形因子的重要性貢獻程度有所不同,中山區域重要性貢獻率最高的地形因子為地形粗糙度,中低山區域則為平面曲率。由表2可知,兩個研究區域地形存在空間差異性,導致影響兩個區域農村零散居民點分布的關鍵地形因子不一致;但顯而易見的是,地形粗糙度、坡度、平面曲率都是影響中低山山地區域農村零散居民點分布的關鍵地形因子。

圖4 地形因子重要性
從圖4中還可以看出,在中山區域的地形因子重要性排序中,除地形粗糙度、平面曲率、坡度外,坡位和高程也表現出較大的影響,其重要性貢獻率分別達到了72.94%和51.20%,這是由于中山區域地形起伏程度更大。圖3a和圖3h分別反映了農村零散居民點在高程和坡位上的空間格局特征,其結果表明中山與中低山區域的農村零散居民點均分布在中高地形位上,且農村零散居民點在山地區域的分布具有相似性,這與李玉華等[29]的研究結論一致。
中山區域的重要性排序結果表明,該區域反映地形垂直高度變化特征的地形因子占主導地位;在中低山區域的排序結果中,最關鍵的地形因子為平面曲率,高出地形粗糙度5個百分點,排在第三位的地形因子是坡度,重要性貢獻率為55.76%,第四位的是坡位,第五位是高程,重要性貢獻率分別為36.04%,29.08%。而中低山區域的重要性排序結果表明,反映垂直高度分布的地形因子重要性明顯下降,地形粗糙度、坡度、坡位、高程等4個因子重要性貢獻值均低于中山區域,表明中低山區域農村零散居民點的分布在垂直高度上低于中山區域,與實際情況一致。
影響中低山農村零散居民點分布最重要的地形因子是平面曲率,區別于中山區域的地形粗糙度,這是由于渝東北的中山區域屬于層狀構造喀斯特山地區,渝東南的中低山區域屬于峽谷型喀斯特山地區[30]。酉陽位于渝東南,該區域峽谷型喀斯特地貌發育良好,受地表水溶蝕嚴重、多洼地、槽谷,較于渝東北的中山區域,平整地塊更多且面積更大,因此渝東南地區農村居民點多在相對開闊的平坦地帶[31]。巫溪位于渝東北,地形起伏程度大,層狀喀斯特地貌發育,地形復雜,鮮有大面積平整區域,耕地破碎,農村居民點多繞耕地而建,導致農村零散居民點分布散亂,地形的起伏程度很大程度上決定了農村零散居民點的分布特征。綜合看來,中低山山地農村零散居民點多分布于地形起伏明顯但小區域內相對平整的地帶。
空間布局上,西南山地農村零散居民點集中分布在6°~15°和15°~25°的緩地和斜坡上,0°~6°坡度級的居民點數量相對較少。這是因為0°~2°和2°~6°這兩個坡度級的地勢比較平坦,土地利用方式以水田、旱地為主,便于生產,這樣的結果是農村居民點選址與環境和生存條件相協調的表現[13]。坡向上,中山區域農村零散居民點主要分布在陽坡,以便于居民點采光,而中低山農村零散居民點受地貌限制,多分布在半陽坡。綜合其他地形因子來看,山地農村零散居民點整體仍多分布于地形起伏程度較小,地形較為平整的區域。
基于隨機森林模型對影響山地農村零散居民點空間分布的關鍵地形因子進行探究,結果表明,地形粗糙度和平面曲率是影響中低山區域農村零散居民點分布的兩個關鍵地形因子,其相對重要性分列前兩位;而坡度也是重要的地形因子,但在低山區域的重要性明顯下降;坡位和高程對農村零散居民點的分布也有一定影響,而地形特征指數、坡向、剖面曲率這3個因子的重要程度排名相對靠后,影響較小。
零散居民點的空間分布情況在一定程度上反映了研究區域的地形特征,也說明山地農村居民點在選址時地形有著關鍵影響。因此,山地農村零散居民點在規劃時應當從地形條件入手,結合社會經濟及生產環境因素,減少復雜地形上(如坡度大于25°的陡坡)農村居民點的分布數量,促進農業生產生活和諧發展。
[1] 張小林. 鄉村空間系統及其演變研究:以蘇南為例[M]. 南京:南京師范大學出版社,1999. 24-56.
[2] 劉彥隨,劉 玉,翟榮新. 中國農村空心化的地理學研究與整治實踐[J]. 地理學報,2009,64(10):1193-1202.
[3] 姜廣輝,張鳳榮,顏國強,等. 科學發展觀指導下的農村居民點布局調整與整理[J]. 國土資源科技管理,2005,22(4):109-116.
[4] 張 霞,魏朝富,倪九派,等. 重慶市低山丘陵區農村居民點分布格局及其影響因素[J].中國農業資源與區劃,2012,33(3):45-50.
[5] 陳振杰,李滿春,劉永學. 基于GIS的桐廬縣農村居民點空間格局研究[J]. 長江流域資源與環境,2008,17(2):180-184.
[6] 閔 婕,楊慶媛,翁才銀. 基于村域范圍的農村居民點布局評價與空間格局優化——以重慶市石柱縣臨溪鎮前進村為例[J]. 中國農學通報,2012,28(15):283-290.
[7] 周 滔,楊慶媛,劉筱非. 西南丘陵山區農村居民點整理:難點與對策[J]. 中國土地科學,2003,17(5):45-49.
[8] 郜紅娟,張朝瓊,蔡廣鵬,等. 基于GIS的巖溶山區農村居民點用地適宜性評價[J]. 水土保持研究,2015,22(2):200-203.
[9] 哈 凱,丁慶龍,門明新,等. 山地丘陵區土地利用分布及其與地形因子關系——以河北省懷來縣為例[J]. 地理研究,2015,34(5):909-921.
[10] 鄒利林,王占岐,王建英. 山區農村居民點空間布局與優化[J]. 中國土地科學,2012,26(9):71-77.
[11] 吳學偉,龔文峰,袁 力. 基于DEM黑龍江省土地利用定量分析[J].東北林業大學學報,2009,37(9):74-75.
[12] 代冬梅,吳國平,司惠超. 基于DEM的瀏陽市土地利用空間格局分析[J]. 安徽農業科學,2009,37(3):1231-1234.
[13] 焦貝貝,石培基,劉春芳,等. 黃土高原低山丘陵區農村居民點分布與地形因子關系研究——以蘭州市七里河區為例[J]. 資源科學,2013,35(8):1719-1727.
[14] 張 霞,魏朝富,倪九派,等. 重慶喀斯特槽谷地區農村居民點分布與地貌形態要素的研究[J]. 中國巖溶,2012,31(1):59-66.
[15] 吳華芹. 基于訓練集劃分的隨機森林算法[J]. 科技通報,2013,29(10):124-126.
[16] 馬 昕,王 雪,楊 洋. 基于隨機森林算法的大學生異動情況的預測[J]. 江蘇科技大學學報(自然科學版),2012,26(1):86-90.
[17] 唐建榮,陳 實. 基于隨機森林方法的碳足跡及其影響因素研究[J].統計與信息論壇,2013,28(10):70-74.
[18] Martin W,Frauke B,Benjamin B,et al. Digtal mapping of soil organic matter stocks using Random Forest modeling in a semi-arid steppe ecosystem[J]. Plant Soil,2011,340:7-24.
[19] Grimm R,Behrens T,Marker M,et al. Soil organic carbon concentrations and stocks on Barro Colorado Island-Digital mapping using Random Forests analysis[J]. Geoderma,2008,146(1-2):102-113.
[20] Guo P T,Li M F,Luo W,et al. Digital mapping of soil organic matter for rubber plantation at regional scale:An application of random forest plus residuals kringing approach[J]. Geoderma,2015,237-238:49-59.
[21] 劉明皓,戴志中,邱道持,等. 山區農村居民點分布的影響因素分析與布局優化——以彭水縣保家鎮為例[J]. 經濟地理,2011,31(3):486-482.
[22] 梁發超,劉黎明. 基于地形梯度的土地利用類型分布特征分析——以湖南省瀏陽市為例[J]. 資源科學,2010,32(11):2138-2144.
[23] 崔東文,金 波. 基于隨機森林回歸算法的水生態文明綜合評價[J].水利水電科技進展,2014,34(5):56-60.
[24] 方匡南,吳見彬,朱建平,等. 隨機森林方法研究綜述[J]. 統計信息論壇,2011,(3):32-38.
[25] 程文仕,喬蕻強,陳 英. 西南山地丘陵區農村居民點用地適宜性評價與分區優化[J].水土保持通報,2014,34(5):322-327.
[26] 焦 歡,周啟剛,李 輝,等. 西南典型低山丘陵區農村居民點適宜性評價與整治規劃分區研究[J]. 水土保持研究,2015,22(5):204-208.
[27] 唐麗靜,王冬艷,王霖琳. 基于耕作半徑合理布局居民點研究——以山東省沂源縣城鄉建設用地增減掛鉤項目區為例[J]. 中國人口·資源與環境,2014,24(6):59-64.
[28] 黃海洋,楊慶媛,王 成. 基于DEM的土地利用類型與地形因子關系研究——以重慶市酉陽縣麻旺鎮為例[J]. 西南大學學報(自然科學版),2009,31(4):159-163.
[29] 李玉華,高 明,呂 煊,等. 重慶市農村居民點分形特征及影響因素[J]. 農業工程學報,2014,(12):225-232.
[30] 楚玉春. 重慶喀斯特地貌研究[D]. 重慶:西南大學,2010.
[31] 牛斌惠. 渝東南鄉村聚落景觀的保護與發展研究[D]. 重慶:西南大學,2012.
(責任編輯:成 平)
The Influence of Terrain Factors on the Distribution of Rural Scattered Settlements in the Mountainous Areas of Southwest China
ZHONG Ke-qiang1,LI Ai-di1,WU Wei2,LIU Hong-bin1
(1. College of Resources and Environment, Southwest University, Chongqing 400716, PRC; 2. College of Computer and Information Science, Southwest University, Chongqing 400716, PRC)
To understand the influence of terrain factors on the distribution of the rural scattered settlements in mountainous region, a study in two typical counties located in middle altitude and middle to low altitude regions in Southwest China was conducted. Eight terrain factors, such as elevation, slope, aspect, terrain ruggedness index, plan curve, profcurve, terrain characterization index, and terrain position index were extracted by GIS software. The Random Forest model was employed to investigate the relationships between terrain factors and the distribution of the rural scattered settlements. The results showed that the rural scattered settlements were mostly located in areas with elevation of 600-1 200 m, gentle slope and slope, half-sunny slope and sunny slope, middle terrain position, terrain characterization index<-0.01, plan curve and profcurve close to zero. This indicated that the rural scattered settlements in mountainous region were mostly built on medium and higher terrain in the vertical direction and relatively flat position in the horizontal direction. The results of random forest model suggested that terrain ruggedness index, plan curve and slope were the most important terrain factors affecting the distribution of the rural scattered settlements in the mountainous areas. Among them, terrain ruggedness index and plan curve played the critical role in middle altitude region and low altitude region, respectively.
rural scattered settlements; mountainous region; terrain factors; distribution characteristic; importance
K901.8
:A
:1006-060X(2017)02-0107-07
10.16498/j.cnki.hnnykx.2017.002.027
2016-11-14
鐘克強(1992-),男,重慶巫山縣人,碩士研究生,研究方向:土地利用。
劉洪斌