哈凱 門明新 王志濤



摘要:通過遙感解譯得到2013年懷來縣土地利用數據,探究山地丘陵地區土地利用演變規律和驅動機制。選取自然、經濟社會、空間距離及隨機因子等12個驅動因子,運用Logistic回歸方法對引起該地區土地利用變化的驅動因素進行了空間定量化分析,并對各地類回歸模型的擬合度進行了檢驗,計算得到了研究區土地利用類型空間分布概率圖。研究結果表明,各地類分布受地均純收入和人口密度影響較大,通過ROC檢驗得到各種土地類型的擬合度分別為:耕地0.844,園地0.780,林地0.904,建設用地0.882,水域0.983,其他用地0.650,各土地類型的擬和度均在0.600以上,擬和結果較滿意。社會經濟、地形、城鄉建設用地、道路交通等因素對研究地區土地利用格局形成與演變有著重要的影響。
關鍵詞:山地丘陵;Logistic回歸模型;驅動力;河北省
中圖分類號:F301.24 文獻標識碼:A 文章編號:0439-8114(2016)08-1957-07
DOI:10.14088/j.cnki.issn0439-8114.2016.08.013
Abstract:In order to investigate the evolution and driving mechanism of land use in hilly areas, to obtain land use data of Huailai county in 2013 was obtained through the interpretation of remote sensing. With the Logistic regression model, the driving factors of land use change were quantitatively analyzed from 12 factors such as nature, economic, social, spatial distance and random factors. The fitting degree of the regression model of all kinds of land was tested through ROC method. The probability map of the spatial distribution of land use type was calculated. The obtained fitting degree of different land type through the ROC test is 0.844 for cultivated land, 0.780 for garden, 0.904 for forest land, 0.882 for construction land, 0.983 for waters and 0.650 for other type of land. Fitting degree of each land type was more than 0.600, which is satisfying The results revealed that the factors such as development of social and economy, urban and rural construction land, roads, terrain distribution have important influence on the formation and evolution of land use pattern in the studied area.
Key words: mountain and hill;logistic regression model;driving force;Hebei province
土地利用/覆被變化(Land use/Land cover change,LUCC)是引起全球環境變化的重要作用因素,對地表生物、氣候、水文等過程都有著直接或間接的影響[1-3],通過定量化分析土地利用的空間演變機制,進一步預測未來土地變化的方向,一直是學術界探討的熱點和難點問題,也是政府進行科學土地利用調控面臨的現實問題。針對復雜的土地利用覆被狀態,對其進行研究的重要方法與途徑一般是建立定量化模型,分析土地利用的變化過程、驅動機制及變化趨勢[4,5]。近年來國內外學者通過從不同角度構建的多種模型對典型地區土地利用變化及驅動機制進行了研究,分析和預測土地利用演化格局,如余新曉等[6]、潮洛濛等[7]、徐廣才等[8]基于多年的遙感影像,運用土地利用變化模型,對流域、快速城鎮化地區及草原的土地利用/覆被的演變及驅動機制進行了研究;譚永忠[9]對縣級尺度土地利用變化驅動機制及空間格局變化進行了研究;謝花林[10]、姜廣輝等[11]、李強等[12]、徐嘉興等[13]均運用Logistic回歸模型對相應的典型區域土地利用變化的驅動力進行了分析,該模型考慮了引起土地利用變化的自然和社會經濟因素,通過選擇相關因素因子定量分析土地利用格局變化的過程,較好地揭示了引起LUCC的可能原因。在進行土地利用變化空間模擬的研究中,Logistic空間回歸分析得到了較為廣泛的應用,通過該模型可以定量化分析一個因變量(土地利用類型)與多個自變量變化(驅動因子)的關系,并能夠解釋因變量的概率發生值[14-18],從而在空間上模擬預測土地利用變化的方向。但針對縣域范圍內較為典型的山地丘陵地區,此方面的研究較少。
本研究選擇典型的山地丘陵地區懷來縣作為研究區,通過遙感解譯獲得研究區土地利用數據,然后對研究地區的土地利用格局進行定量化的驅動力分析。通過構建研究地區的土地利用格局在空間上的Logistic回歸模型,揭示典型山地丘陵地區土地利用變化過程的可能原因及與其影響因素之間的定量化關系,將對研究山地丘陵地區土地利用變化的發展趨勢及生態環境的影響,調整產業結構及土地的可持續利用有著重要意義。
1 材料與方法
1.1 研究區概況
懷來縣位于河北省張家口市東南,地處冀北山地,燕山山脈西南端,東經115°16′-115°58′,北緯 40°04′-40°35′。地貌形態主要有河川平原、丘陵和山地等類型,受地形地貌影響,懷來縣土地利用形成較為明顯的區域分布特征。地勢由中間“V”型盆地分別向南北崛起,西北高而東南低。2013年全縣地區生產總值實現119.4億元,人均GDP達到20 172元。2013年全縣總人口35.7萬人,其中農業人口24.1萬人,非農業人口11.6萬人,分別占總人口的67.5%和32.5%,冀西北間山盆地區生態脆弱,位于該區的懷來縣土地資源相對缺乏,加之人們對土地資源的合理利用不夠重視,導致土地資源利用出現了許多問題。
1.2 數據收集與處理
本研究所需要的數據包括懷來縣2013年土地利用遙感解譯數據,2012懷來縣土地利用變更調查數據,DEM數據以及懷來縣社會經濟數據。參照全國土地利用現狀分類將懷來縣土地利用類型分為耕地、園地、林地、建設用地、水域及其他土地6大類。以研究區2013年7月的Landsat TM影像為數據源,將1∶50 000地形圖作為地理坐標參考基準,利用 ENVI 4.8軟件對2013年的遙感影像進行幾何校正,并保證校正后誤差小于0.5個像元。以行政區作為掩膜完成遙感圖像的裁剪,采用監督分類并結合人機交互的方法完成遙感影像的分類,并進行分類后的處理,分別用代碼1,2,3…,6表示各土地利用類型,借助于地面實測數據(GPS野外調查)來檢驗解譯精度,隨機選取若干樣點,利用混淆矩陣法進行評價分析,結果表明,遙感影像分類結果的總體精度達到85.69%,解譯精度較好。在ArcMap中利用空間分析工具,將懷來縣2013年土地利用現狀圖各地類生成單獨的柵格文件,分辨率為100 m×100 m,如果屬于該地類,則屬性賦值為1,其他區域屬性賦值為0,最后將這些柵格圖通過Raster to ASCⅡ模塊轉換成ASCⅡ格式。
影響土地利用變化的因素復雜多樣,依據科學性和可獲取性原則,本研究選取了自然因素、社會經濟因素和空間距離因素。其中,自然因素包括高程、坡度和坡向,社會經濟因素包括地均GDP、總人口密度,空間距離因素包括到公路的距離、到鐵路的距離、到城鎮的距離、到農村居民點的距離、到工礦的距離和到河流水面的距離。自然因素的數據主要來源于中國科學院國際數據平臺下載的DEM高程圖;社會經濟因素主要來源于2013年懷來統計年鑒;空間距離因素在ArcGIS里的Spatial Analyst模塊通過Straight line計算得到的。數據最后都統一到西安1980坐標系下,分辨率為100 m×100 m。
1.3 研究方法
1.3.1 二元Logistic回歸模型 Logistic回歸模型一般是以柵格為最小單元,通過將研究區分為許多柵格單元,每一個柵格都有一個值,模型的目標變量(土地利用格局)用二分類變量表示,1表示某種土地利用類型出現,0表示不出現,模型的解釋變量(驅動因子)通過一系列的自然和社會經濟等因素因子來描述。二元Logistic回歸模型是一種非線性分類統計方法,適用于對二分因變量(0或1)進行回歸分析。回歸模型表達式如下:
式中,Pi表示每個柵格單元可能出現某一土地利用類型i的發生概率;Xi表示影響土地利用變化的i類驅動因子;?茁是各驅動因子的回歸系數,表示變量Xi對Pi的影響大小。
1.3.2 空間分布概率模擬 根據Logistic回歸模型可以得出土地利用類型的空間分布概率Pi,然后運用ArcGIS的Raster Calculator計算得到研究地區土地利用格局空間分布的經驗統計概率圖。
式中,Pi表示每個柵格可能出現某個土地利用類型i的概率,X表示與土地類型相關的各驅動因子,?茁0為常量,?茁1-?茁n分別對應于X1,i-Xn,i等各種驅動因子與土地利用類型i之間的相關度,?茁值越大表示其相關度越高。
2 結果與分析
將矢量的土地利用現狀圖轉換成柵格格式以后,再通過ArcGIS將各柵格格式的土地利用類型圖和驅動因素轉換成ASCⅡ格式,然后應用CLUE-S模擬軟件里的Accessorial Tools將數據繼續生成單列記錄文件,最后將數據導入到SPSS軟件中進行Binary Logistic逐步回歸分析。
2.1 回歸結果
Logistic回歸分析中,驅動因素beta值為負值的,則表示與相應的地類變化的概率為負相關,beta值為正值的,則表示與相應的地類變化的概率為正相關,數值越大,則相關度越大。由表1可知,與耕地變化概率呈負相關的因素包括:到工礦的距離、到公路的距離、到居民點的距離、地均純收入等,表明相應的距離因素越遠或地均純收入越高,耕地發生變化的概率越小;相應的與耕地變化呈正相關的因素,如到城鎮的距離和坡度等因素,在其他因素不變的情況下,隨著耕地到城鎮的距離的增加或坡度的升高,耕地轉換為其他地類的概率增加。其他5種地類與相應因素之間的關系亦是如此。
通過Logistic逐步回歸分析可以篩選出對各地類變化影響較為顯著的因素,同時剔除不顯著影響因素,并確定各因素之間的定量關系和作用相對大小[19-21]。對于每一種地類,其回歸方程的影響因子是不一樣的,但是研究中考慮的隨機因素對每個地類都不發生影響,說明各地類的形成與分布是有規律可循的。根據以上回歸結果,得到各地類的回歸模型如下:
式中,P1-P6表示耕地、園地、林地、建設用地、水域和其他用地的發生概率;X1-X11表示影響各地類變化的影響因子,分別為到城鎮的距離、到工礦的距離、到公路的距離、到河流水面的距離、到居民點的距離、到鐵路的距離、地均純收入、高程、坡度、坡向、人口密度。
由表2可知,懷來縣耕地分布受到城鎮的距離、到公路的距離、到鄉村居民點的距離、到鐵路的距離、地均純收入、高程、坡度、坡向和人口密度的影響,其中受地均純收入影響最大,發生比率為0.972 5,說明收入越高,耕地發生的概率越低。懷來縣園地分布主要受到城鎮的距離、到公路的距離、到河流水面的距離、到鄉村居民點的距離、到鐵路的距離、地均純收入、高程、坡度、坡向和人口密度的影響,其中受地均純收入和人口密度影響最大,發生比率分別為1.013 1和0.989 5,說明園地傾向于分布在地均純收入較高、人口密度小的地方。懷來縣林地分布主要受到工礦的距離、到公路的距離、到河流水面的距離、到鄉村居民點的距離、地均純收入、高程、坡度、坡向和人口密度的影響,其中受地均純收入影響最大,發生比率為0.983 3,說明地均純收入的地區林地較少。其次人口密度也對林地分布有較大的影響,其發生比率為0.999 1,說明林地主要分布在離人口居住區較遠的山地地區。懷來縣建設用地分布主要受到城鎮的距離、到工礦的距離、到公路的距離、到鄉村居民點的距離、到鐵路的距離、地均純收入、坡向和人口密度的影響,其中受人口密度影響最大,說明人口聚集在建設用地區,建設用地發生比率與人口密度有較大相關性,發生比率為1.010 3。上述各個因素對懷來縣水域用地分布均有影響,到河流水面的距離、到鄉村居民點的距離、地均純收入、高程、坡度、坡向和人口密度都有較顯著的影響,其中受地均純收入和人口密度影響最大,其發生比率分別為1.053 9和0.959 6,這說明河流水域分布也受地均純收入、人口密度影響較大,此處的河流水域用地是合并了河流、灘涂和水庫用地,說明人類在生產過程中較多利用水域資源。懷來縣其他用地分布主要受到城鎮的距離、到工礦的距離、到河流水面的距離、到鄉村居民點的距離、到鐵路的距離、地均純收入、高程、坡度、坡向和人口密度的影響,其中影響因素最大的是地均純收入,發生比率為1.009 6。
2.2 模型檢驗
真實的地類分布格局與應用二元Logistic回歸分析得到的地類概率分布格局是否具有較高的一致性,這需要通過相應的檢驗方法來檢驗。由于Logistic回歸分析不像其他線性回歸方法可以用R2對回歸效果進行檢驗,所以在此應用Pontius等[22]提出的ROC(Relative Operating Characteristics)方法對Logistic回歸結果進行擬合度檢驗。
該方法來源于二值可能性表,每個可能性的內容是實際變化和實際保持穩定的柵格對模擬變化和沒有變化的比值。一個完整的隨機模型所確定的ROC值為0.5,而令人滿意的最適ROC值為1.0。運用SPSS進行ROC的驗證,選取實際的土地利用類型作為狀態變量,預測的土地利用類型的可能性作為檢測變量,如果其ROC曲線大于0.5,則說明模型擬合度達到合格。
通過上述方法,本研究得到的各土地利用類型的ROC曲線見圖2。由圖2及表3可以看出,各地類ROC值分別為0.844(耕地)、0.780(園地)、0.904(林地)、0.882(建設用地)、0.983(水域用地)、0.650(其他用地)。林地和水域用地的擬合度最好,超過了0.900,充分說明了選取因素的解釋性較強,但是對于其他用地的ROC值則低于0.700,擬合度解釋力相對較弱。
2.3 不同土地利用類型的空間概率分布模擬
在驅動因子分析的基礎上,運用Logistic逐步回歸的結果對研究區的每個一柵格單元可能出現的某一種土地利用類型的概率進行判別,利用Arc GIS中的Raster Calculator功能,根據公式(2)計算得到各土地利用類型的空間分布概率圖[12]。其中2013年各地類概率分布見圖3。
在分析現狀圖的基礎上,通過對比各土地利用類型的空間分布概率模擬圖,發現模擬結果與實際情況吻合度較好,由此可見,耕地出現的高概率值區分布在官廳水庫周圍及左上和中間部分的平原丘陵地區;出現園地的概率較高的區域較耕地更加分散,且與耕地部分重合,高值區域出現在區域中部和部分山地地區;林地的出現概率則集中于西北部和南部山地地區;出現建設用地的高值概率區則呈散點狀態分布在平原和丘陵地帶,且呈現平原-丘陵-山地概率依次降低的趨勢;水域的概率分布則以官廳水庫為中心,集中分布于中部河谷地區;其他土地的概率分布高低差異較其他5類小,且高概率出現在北部和南部山地地區。同時可以看出,模擬的吻合程度與ROC值密切相關。當ROC值越大時,吻合程度越高,其中水域、林地、建設用地、耕地和園地ROC值較高,分別為0.983、0.904、0.882、0.844和0.780,說明這5種地類的模擬吻合度較高。其他土地的ROC相對較低,為0.650,模擬吻合程度較低。造成這種偏差的原因可能是其他土地利用類型的構成較為復雜,同時選取的影響土地利用空間分布格局的驅動因素除了本研究選取的12個驅動因子以外,還有其他比較復雜且難以空間量化的因素,這些數據的缺失可能是造成模擬結果偏差的主要原因。
3 小結與討論
本研究通過建立針對土地利用變化的二元Logistic回歸模型,揭示了典型山地丘陵地區引起土地利用變化的可量化的驅動因素。在空間上對土地利用變化的方向進行了概率診斷,能為研究山地丘陵地區的土地利用變化的方向提供借鑒,在此基礎上可以指導未來的土地利用方式和方向。
研究區六種地類的分布受到地均純收入和人口密度的影響較大,說明社會經濟因素是各地類分布的主要影響因素。除此之外,耕地和園地的分布受到鄉村居民點的距離、高程、坡度的影響較大,說明受距離和地形因素的影響較大;林地分布受高程、坡度、坡向等自然因素影響較大,社會經濟和距離因素影響較小,這也充分證明了主要分布在山地地區的林地受到空間距離因素干擾較小;懷來縣建設用地分布受距鄉村居民點的距離影響較大,這也從側面驗證了廣泛分布于地勢平緩的丘陵和平原地帶的居民點,其向外擴張的趨勢在空間上受到距離和地形的約束;水域用地分布受距河流水面、距鄉村居民點空間因素和高程、坡度、坡向自然因素影響較大;其他土地分布受高程和坡度影響較大。
通過對比懷來縣土地利用現狀圖,發現模擬結果基本吻合實際情況,并且模擬的吻合程度與ROC值密切相關,當ROC值越大時,吻合程度越高。其中水域用地、林地的ROC值達到0.900以上,這兩種地類的模擬吻合度也最高;建設用地和耕地的ROC值在0.800以上,吻合度也較好;園地和其他土地的ROC值都在0.800以下,吻合度相對較低。
土地利用變化是一個相當復雜的過程,與當地乃至整個區域的自然因素、經濟、社會、人口、政治等都有著密切的聯系,難免有些因素沒有考慮到或者難以量化納入模型,同時本研究選取總人口密度變量只細化到了鄉鎮范圍,精度不高。作為北京市重要水源地的官廳水庫,其難以量化的政策限制因素較多,在一定程度上也影響了模型的精度。另外,如何將模型用于對未來一段時間內土地利用變化的預測分析,也值得進一步深入研究。
參考文獻:
[1] 李秀彬.全球環境變化研究的核心領域-土地利用/土地覆被變化的國際研究動向[J].地理學報,1996,51(6):5532-5571.
[2] 劉紀遠,張增祥,莊大方,等.20世紀90年代中國土地利用變化時空特征及其成因分析[J].地理研究,2003,22(1):1-12.
[3] TURNER B L,LAMBIN E F,REENBERG A.The emergence of land change science for global environmental change and sustainability[J].Proceedings of the National Academy of Sciences of the United States of America,2007,104(52):20666-20671.
[4] 擺萬奇,趙士洞.土地利用和土地覆蓋變化研究模型綜述[J].自然資源學報,1997,12(2):169-175.
[5] 陳佑啟,VERBURG P H,徐 斌.中國土地利用變化及其影響的空間建模分析[J].地理科學進展,2000,19(2):116-127.
[6] 余新曉,張曉明,牛麗麗,等.黃土高原流域土地利用/覆被動態演變及驅動力分析[J].農業工程學報,2009,25(7):219-225.
[7] 潮洛濛,翟繼武,韓倩倩.西部快速城市化地區近20年土地利用變化及驅動因素分析—以呼和浩特市為例[J].經濟地理,2010,30(2):239-243.
[8] 徐廣才,康慕誼,李亞飛.錫林郭勒盟土地利用變化及驅動力分析[J].資源科學,2011,33(4):690-697.
[9] 譚永忠.縣級尺度土地利用變化驅動機制及空間格局變化模擬研究[D].杭州:浙江大學,2004.
[10] 謝花林.基于Logistic回歸模型的區域生態用地演變影響因素分析—以京津冀地區為例[J].資源科學,2011,33(11):2063-2070.
[11] 姜廣輝,張鳳榮,陳軍偉,等.基于Logistic回歸模型的北京山區農村居民點變化的驅動力分析[J].農業工程學報,2007,23(5):81-87.
[12] 李 強,任志遠.基于logistic回歸分析的土地利用變化空間統計與模擬[J].統計與信息論壇,2012,27(3):98-103.
[13] 徐嘉興,李 鋼,陳國良.基于logistic回歸模型的礦區土地利用演變驅動力分析[J].農業工程學報,2012,28(20):247-255.
[14] 楊云龍,周小成,吳 波.基于時空Logistic回歸模型的漳州城市擴展預測分析[J].地球信息科學學報,2011,13(3):374-382.
[15] 段增強,張鳳榮.苗利梅.基于鄰域因子的土地利用空間格局分析—以北京市海淀區為例[J].農業工程學報,2006,22(6):71-76.
[16] VERBURG P H,SOEPBOER W,VELDKAMP A,et a1.Modeling the spatial dynamics of regional land use the CLUE-S Model[J]. Environmental Management,2002,30(3):391-405.
[17] BUI D T,LOFMAN O,REVHAUG I,et al. Land slide susceptibility analysis in the Hoa Binh province of Vietnam using statistical index and logistic regression[J]. Natural Hazards,2011,59(3):1413-1444.
[18] 戴聲佩,張 勃.基于CLUE-S模型的黑河中游土地利用情景模擬研究—以張掖市甘州區為例[J].自然資源學報,2013,28(2):336-348.
[19] 段增強,VERBURG P H,張鳳榮,等.土地利用動態模擬模型的構建及其應用—以北京市海淀區為例[J].地理學報,2004,59(6):1037-1047
[20] 馮仕超,高小紅,顧 娟,等.基于CLUE-S模型的湟水流域土地利用空間分布模擬[J].生態學報,2013,33(3):985-997.
[21] 吳健生,馮 喆,黃 力,等.基于CLUE-S模型框架的土地可持續利用情景預測—以陽泉市郊區為例[J].資源科學,2011,33(9):1699-1707.
[22] PONTIUS R,GIL J R,LAURA C S. Land-cover change model validation by an ROC method for the Ipswich watershed, Massa-chuset,USA[J]. Agriculture Ecosystems and Environment,2001,85(5):239-248.