999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于隨機森林算法的耕地面積預測及影響因素重要性分析
——以甘肅省慶陽市為例

2018-12-05 08:48:14王全喜孫鵬舉劉學錄李尚澤高建存
水土保持通報 2018年5期
關鍵詞:影響模型

王全喜, 孫鵬舉, 劉學錄, 李尚澤, 高建存

(1.甘肅農業大學 管理學院, 甘肅 蘭州 730070; 2.甘肅農業大學 資源與環境學院, 甘肅 蘭州 730070;3.甘肅省國土資源規劃研究院,甘肅 蘭州 730000; 4.中國地質大學(武漢) 公共管理學院, 湖北 武漢 430074)

隨著城鎮化進程的持續推進,建設不斷占用耕地。同時,生態保護工程的實施也造成了耕地面積的減少。當前,區域社會經濟發展與耕地保護矛盾日益突出,耕地保護越顯重視。2017年國務院出臺《關于加強耕地保護和改進占補平衡的意見》中強調了耕地數量、質量、生態“三位一體”保護。耕地數量的變化反映了一個區域社會經濟發展的基本態勢[1],其不斷減少會影響區域糧食安全[2]。了解耕地利用歷史變化規律,探析區域的耕地面積變化及影響因素的研究愈發重要。

當前關于耕地面積變化及影響因素研究已經取得豐碩成果。項靈志等[3]針對耕地面積變化與各產業關系進行了研究。然而,耕地面積變化與影響因素之間關系復雜,影響因素多元,耕地面積預測精確度有待提高。現階段針對耕地面積變化研究包括兩個方面:一方面考慮社會經濟驅動因素,主要采用STIRPAT模型[4]、灰色關聯分析法[5]、主成分分析法[6-7]、地理加權回歸模型[8]、PLS方法[9]等方法研究影響因素。另一方面是對耕地面積進行預測,探討合適的耕地面積預測模型,提高預測精度。包括灰色預測模型[10]、空間自回歸模型[11]、移動趨勢平均法[12]等傳統方法,BP神經網絡[13]、支持向量回歸機[14]等算法,使得預測精度有了較大提高。上述研究成果表明:經濟發展水平、人口因素和農業發展水平等是影響耕地面積變化的主要因素。但是,當前研究往往將耕地面積變化影響因素分析以及耕地面積預測單獨進行研究,對兩者的研究采用兩種或多種方法來進行,而且對導致耕地面積變化的影響因素重要程度研究較少。

隨機森林(random forest,RF)算法能夠很好的處理非線性建模問題[15],對數據量綱不敏感,無需歸一化處理,通過對大量分類樹的匯總來提高預測精度,而且能夠測度各影響因素的重要性[16]。當前,隨機森林算法已應用于需水量和山體滑坡空間預測[17-18],農耕區[19]、工礦復墾區[20]等特殊區域進行土地利用分類,研究證實了RF算法是預測和分類的有效方法。田義超等[21]研究了近300 a來黃土高原耕地變化及時空格局,表明黃土高原耕地面積呈現出從增加到減少,然后又到增加的趨勢。因此,本研究以屬于黃土高原地區的慶陽市為例,嘗試采用隨機森林算法對慶陽市耕地面積進行預測,并探析慶陽市社會經濟發展對耕地面積變化的影響,以期為更精確地預測耕地面積,分析耕地面積變化的影響因素提供新方法,對合理確定耕地保護紅線以及更好地保護耕地具有重要意義。

1 研究區概況與數據來源

1.1 研究區概況

慶陽市(106°20′—108°45′E,35°15′—37°10′N),位于甘肅省東部的隴東黃土高原區,地處陜甘寧3省區的交匯處,屬黃河中上游黃土高原溝壑區。地勢為北高南低,海拔高度為885~2 082 m。境內山、川、塬兼有,溝、峁、梁相間,是黃土高原的典型代表區,年均降雨480~660mm,是甘肅優質農畜產品生產基地。慶陽市現轄1區7縣,2015年總人口為2.65×104,土地總面積為2.71×106hm2。如圖1所示,根據整理的1995—2015年慶陽市耕地面積可以看出:1995—2015年慶陽市耕地面積變化總體呈現先減少后波動上升的態勢。

圖1 1995-2015年慶陽市耕地面積變化

1.2 數據來源

本研究以1995—2015年為研究期,所涉及的數據中,2000—2015年數據來源于《慶陽年鑒》(2001—2016),1995—1999年數據來源于《甘肅發展年鑒》(1996—2000),部分數據通過計算得到。

2 研究方法

2.1 影響因素分析

綜合借鑒國內相關研究成果[4-8],耕地面積變化受到自然因素、社會、經濟、農業發展和政策的影響,它們之間相互影響、相互制約而綜合作用于土地利用方式,然而一定時期內可以認為自然因素變化較穩定。本研究主要考慮社會經濟因素的影響,影響因素選取遵循代表性、可行性等原則,初步采用文獻分析法來分析影響因素。人口因素是導致土地利用變化最重要的因素[1],而經濟因素決定土地的開發利用方向和開發程度,提高農業技術的投入提高耕地的產出和利用效益可以緩解耕地面積的減少帶來的壓力。綜合考慮慶陽市耕地利用的實際情況與數據資料的可獲取性,選取了人口因素、經濟因素、農業因素3個方面的10個具體影響因素。包括人口因素:總人口(x1),農業人口(x2),城市化水平(x3);經濟因素:GDP(x4),固定資產投資額(x5),農民人均純收入(x6),第一產業產值比重(x7),第二、三產業產值比重(x8);農業因素:糧食總產量(x9),農業機械總動力(x10)。

2.2 隨機森林算法

隨機森林算法是Breiman于2001年提出的一種非線性建模工具[15],包括分類(random forest classification,RFC)和回歸(random forest regression,RFR)兩種算法。通過bootstrap抽樣方法,從原始訓練樣本集N中有放回地重復隨機抽取K個樣本生成新的訓練樣本集合,然后根據自助樣本集生成K個決策樹組成隨機森林。對于回歸功能而言,將所有決策樹的平均值作為最終預測結果。通過預測精度法(衡量把一個變量的取值變為隨機數,隨機森林預測準確性的降低程度)計算每個變量的重要性。隨機森林回歸算法計算步驟包括[22-23]:

(1) 利用bootstrap方法從原始數據集N中隨機抽取K個不同的樣本數據集,作為各決策樹的子訓練集,各樣本容量和原始數據集相同;

(2) 利用每個樣本訓練集,生成對應的K顆決策樹;假設特征有M維,從M維特征中隨機抽取m(m為大于零且小于M的整數)個特征作為當前節點的分裂特征集,并以這m個特征中最好的分裂方式對該節點進行分裂,每顆樹都完整生長而不進行剪枝;

(3) 對于測試數據,利用每個決策樹分別進行測試,得到對應的單顆決策樹的預測值;

(4) 將得到的K棵決策樹預測結果取平均值,最后得到最終預測值。

2.3 模型精度評價

本研究通過構建基于BP神經網絡模型的耕地面積預測模型作為對比模型,同時計算相對誤差、均方根誤差指標評價模型預測精度。

3 結果與分析

3.1 耕地面積預測模型構建

隨機森林算法運算過程中涉及ntree和mtry兩個參數的設定,即決策樹顆數和節點分裂的次數。一般而言,模型的計算量與每次生成的樹的數量成正比,在ntree增加時,在模型預測精度不能提高的情況下,ntree設定應盡可能小,默認為500。mtry設定為變量個數的1/3。本研究利用隨機森林算法構建耕地面積預測模型,由于隨機森林算法對樣本數據的量綱和單位不敏感,所以運算時無需對樣本數據進行歸一化處理。圖2可知,當決策樹目為500,mtry為3時,均方誤差基本趨于穩定狀態。

為了驗證模型的預測精度,同時采用BP神經網絡模型進行預測。采用梯度下降法進行訓練,即traingd函數,對模型進行設定:循環1 000次顯示一次結果,學習率設為0.5,最大循環次數為50 000次,收斂誤差設為0.002,模型的輸入設為10,輸出設為1。經多次測試,將神經網絡結構設計為10—12—1。運算過程均以Matlab R2016b軟件來編程實現,以慶陽市1995—2015年耕地面積為研究對象,將1995—2010年作為訓練數據,2011—2015年作為檢驗數據。

圖2 慶陽市耕地面積預測模型預測精度均方誤差變化

3.2 耕地面積預測結果分析

運用上述構建的耕地面積預測模型,對2011—2015年慶陽市耕地面積進行預測。此外,在預測2020,2025,2030年的耕地面積時,首先采用3次指數平滑法預測出各個影響因素相應年份的預測值,然后將預測值分別輸入兩種耕地面積預測模型中,得到預測年份的耕地面積,具體結果見表1。同時,為驗證兩種預測模型的精度,通過計算2011—2015年耕地面積實際數據和預測結果間的相對誤差、均方根誤差進行預測精度評價,最終得到預測精度對比結果(見表2)。

表1 慶陽市耕地面積的兩種模型預測值結果104 hm2

表2 慶陽市耕地面積的兩種模型預測結果精度對比

表1結果可知,隨機森林算法預測出未來15 a間慶陽市耕地面積不斷減少并且趨于穩定,更加符合實際情況;BP神經網絡模型預測的2011—2015年耕地面積數量較實際值低,未來15 a間耕地面積整體結果也偏低。

表2結果可知,隨機森林算法預測結果相對誤差和均方根誤差均低于BP神經網絡模型相應值。隨機森林算法預測結果中,表現出2015年的相對誤差為0.459%,高于其他年份相應值,精度相對低,而均方根誤差為0.121,滿足預測要求;BP神經網絡模型預測結果中,表現出2014年的相對誤差高達2.112%,均方根誤差為0.500,說明預測結果較隨機森林算法預測結果差。在預測結果穩定性方面,2011—2015年隨機森林算法預測結果波動不大,而BP神經網絡預測結果變動幅度較大,說明隨機森林算法預測結果的穩定性優于BP神經網絡模型。針對BP神經網絡而言,其結構設計和參數確定困難[23],即隱含層個數和訓練函數難確定,隱含層個數只能通過對程序不斷運行測試來確定,預測結果不穩定,精度有待進一步提高。隨機森林算法設置參數較少,僅有決策樹顆數和每次樹模型重建時節點分裂的次數2個參數,而且在確定參數時,為不失一般性,通過隨機化處理方式設置參數,預測精度高,穩定性好,更加適用于耕地面積預測。

3.3 耕地面積變化影響因素重要性分析

運用隨機森林算法進行耕地面積變化影響因素的重要性分析,本研究選用隨機森林算法中的預測精度法比較變量重要程度,其主要通過擾動這些變量對精確度的影響大小而進行判斷,比較平均準確率降低程度反映各變量的重要性。圖3結果可知,預測精度法對影響因素重要程度由高到低排序為:農業機械總動力(x10)>農業人口(x2)>GDP(x4)>固定資產投資額(x5)>糧食總產量(x9)>農民人均純收入(x6)>第一產業產值比重(x7)>第二、三產業產值比重(x8)>城市化水平(x9)>總人口(x10)。

圖3 慶陽市耕地面積變化影響因素重要性

3.3.1 人口因素對耕地面積變化的影響重要性 通過預測精度法計算出耕地面積變化影響因素重要性得分,農業人口得分均高于總人口和城市化水平這2個影響因素得分值。將1995—2015年總體上可以分為2個階段:1995—2005年慶陽市農業人口持續增加,從2.11×106人增加至2.26×106人,增加了1.56×105人。同期,耕地面積總體波動下降趨勢,從4.45×105hm2減少到4.43×105hm2,減少了0.26 hm2,農業人口的增加必然需要占用更多的耕地用于農村居民點等建設。2005—2015年慶陽市農業人口總體上不斷減少,2015年農業人口為1.91×106人,減少了3.54×105人。同期,耕地面積總體波動上升,從4.43×105hm2增加到4.55×105hm2,增加了1.18×104hm2,農業人口的減少,空閑出部分非農用地,尤其是農戶對窯洞退出,通過實施土地整治項目,復墾窯洞等有效地增加了耕地面積。

3.3.2 經濟因素對耕地面積變化的影響重要性 在影響耕地面積變化的經濟因素中,地區生產總值(GDP)和固定資產投資額的重要性得分最高。1995—2000年,慶陽市GDP緩慢增長,由3.78×109元增加到了5.99×109元,增加了2.21×109元,同期固定資產投資也緩慢增長,增加了1.34×109元,但該時期耕地面積總體下降;2000—2015年,慶陽市GDP和固定資產投資額逐漸呈現快速增長現象,GDP增加到2015年的6.90×1010元,增加了10.18倍,固定資產投資額增加到2015年的1.22×1011元,增加了1.96×1011元。這一時期耕地面積總體波動上升。主要是由于:一方面,農業經濟的發展勢頭逐漸變好,農民的生活水平的需求提高,對耕地的開墾與利用會變得更加重視;另一方面,經濟發展使得農民看到經濟收益,通過農業用地結構的調整來達到目的,導致土地利用結構變化[8],使得耕地面積不斷變化。

3.3.3 農業因素對耕地面積變化的影響重要性 在影響耕地面積變化的農業因素中,通過預測精度法對影響因素進行重要性排序顯示,農業機械總動力得分排第一,而且糧食總量與耕地面積的變化也有著密切關系。1995—2015年慶陽市農業機械總動力總體不斷增長,其中1995—1997和2003—2006年增長速度較緩慢。總體上從1995年的4.50×105kW增加至2015年的1.95×106kW,增加了1.50×106kW,年均增加7.10×104kW。主要是由于慶陽市土地整治工程的實施,使道路通達程度逐年提高,農業機械總動力投入不斷增加,使農民受益較多,激發了農民對耕種的積極性,農民對耕地開發和保護的意愿更強,影響耕地面積變化。

4 討論與結論

4.1 討 論

耕地面積變化影響因素多元,存在非線性關系,傳統統計方法分析耕地面積變化影響因素較難。而傳統智能算法雖具有較強的處理非線性問題的能力,比如BP神經網絡模型,但其對訓練數據樣本依賴性大,穩定性不足。隨機森林算法一種比較新的非線性建模工具,具有精度高、穩定性好、收斂快、參數少等特性,且不易產生過擬合現象[17]。隨機森林算法對數據集前提條件的要求寬松,且對量綱不敏感,無需預處理,在綜合性能上具有一定優勢,耕地面積變化的各影響因素數據作為復雜的時間序列數據,數據分布特征多樣,存在量綱,這些方面相比對訓練樣本有依賴、需要預處理的智能算法,運用隨機森林算法構建耕地面積預測模型更加可行。同時,隨機森林算法還能夠測定變量重要性,能夠采用預測精度法計算出變量重要性得分,進而分析耕地面積變化的影響因素。

本研究運用隨機森林算法建立了慶陽市耕地面積預測模型,同時對影響耕地面積變化的因素進行了重要性排序。采用隨機森林算法對耕地面積預測結果表明,與曹銀貴等[13]和車明亮等[24]通過建立BP神經網絡耕地面積預測模型研究表明預測精度相比灰色預測模型的傳統方法優,但其結構設計需要測試,隱含層個數不好設定,結果穩定性差相比,隨機森林算法預測耕地面積更可行。從預測結果來看,在單純不考慮耕地政策或其他方面影響情況下,未來15 a間慶陽市耕地面積逐漸減少,而且相比BP神經網絡模型,隨機森林算法較適合耕地面積預測。從影響因素重要程度來看,耕地面積變化受農業機械總動力、農業人口和GDP等因素的影響,這與卞德鵬等[25]對屬于黃土丘陵溝壑區的吳起縣的研究結果是相同的。針對單項因素而言,由于研究區域的差異,選取的指標不同,研究結果也就不同。慶陽市耕地面積變化的影響因素重要程度不盡相同,更應要重視農業科技的投入,激發農民對耕種的積極性,協調耕地資源與區域經濟的關系。本研究僅從人口因素、經濟因素和農業發展方面分析影響因素來構建了耕地面積預測模型,并未考慮耕地保護政策因素等的影響,還需要進一步做更細致的研究。今后的研究將結合遙感影像來研究區域耕地空間格局變化特征,將自然因素、相關政策因素等因素共同納入隨機森林算法中進行實證研究,以期全面考察耕地面積變化的重要驅動因素。

4.2 結 論

(1) 預測精度方面,隨機森林算法的預測值與實際值之間的相對誤差和均方根誤差均低于BP神經網絡模型的,其預測出2020,2025,2030年耕地面積分別為4.515×105,4.513×105,4.512×105hm2,呈現減少的趨勢;預測結果穩定性方面,隨機森林算法預測結果波動較小,優于BP神經網絡模型。

(2) 運用預測精度法得到主要影響因素重要程度排序為:農業機械總動力>農業人口>地區生產總值>固定資產投資額。農業機械總動力投入不斷增加,促進了農民對耕種的積極性,對耕地開發和保護的意愿更強;農業人口的增減,經濟發展使得人們對美好生活水平的需要不斷提高,使得耕地面積呈現波動變化態勢。

猜你喜歡
影響模型
一半模型
是什么影響了滑動摩擦力的大小
哪些顧慮影響擔當?
當代陜西(2021年2期)2021-03-29 07:41:24
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
沒錯,痛經有時也會影響懷孕
媽媽寶寶(2017年3期)2017-02-21 01:22:28
3D打印中的模型分割與打包
擴鏈劑聯用對PETG擴鏈反應與流變性能的影響
中國塑料(2016年3期)2016-06-15 20:30:00
基于Simulink的跟蹤干擾對跳頻通信的影響
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 五月婷婷精品| 国产99视频精品免费视频7| 99这里只有精品在线| 91探花在线观看国产最新| 成人免费网站在线观看| 沈阳少妇高潮在线| 毛片基地美国正在播放亚洲| 亚洲熟妇AV日韩熟妇在线| 香蕉精品在线| 四虎国产在线观看| 波多野结衣AV无码久久一区| 国产香蕉一区二区在线网站| 欧美国产综合色视频| 黄色福利在线| 久久精品娱乐亚洲领先| 精品国产美女福到在线直播| 国产成人无码久久久久毛片| 国产乱子伦精品视频| 人妻丰满熟妇AV无码区| 免费毛片视频| 有专无码视频| 久久亚洲天堂| 漂亮人妻被中出中文字幕久久| 在线日本国产成人免费的| 青青草一区| 三上悠亚在线精品二区| 欧美色99| 五月天久久综合| 色播五月婷婷| 日韩在线永久免费播放| 青青青视频91在线 | 日韩欧美国产综合| 国产av剧情无码精品色午夜| 国产啪在线| 国产女人18毛片水真多1| 女人18毛片水真多国产| 69国产精品视频免费| 久久国语对白| 午夜欧美理论2019理论| 免费一级无码在线网站| 欧美成人在线免费| 日日噜噜夜夜狠狠视频| 伊人大杳蕉中文无码| 日韩成人免费网站| 91精品专区| 亚洲系列中文字幕一区二区| 国产一区二区三区在线观看免费| 免费又爽又刺激高潮网址| 色婷婷亚洲综合五月| 亚洲欧洲综合| 久久伊人操| 99视频免费观看| 不卡无码h在线观看| 国产激情影院| 99精品国产电影| 午夜精品一区二区蜜桃| 国产成人免费观看在线视频| 国产高清无码麻豆精品| 色哟哟国产精品| 色偷偷一区二区三区| 五月婷婷中文字幕| 97人妻精品专区久久久久| 国产人前露出系列视频| 亚洲VA中文字幕| 国产av剧情无码精品色午夜| 亚洲天堂网在线播放| 国产精品嫩草影院av| 亚洲一区二区三区香蕉| 亚洲天堂精品视频| 欧美不卡在线视频| 2020国产免费久久精品99| 国产精品成人观看视频国产 | 国产制服丝袜无码视频| 欧美精品xx| 性视频一区| 国产精品综合久久久| 久草热视频在线| 九色91在线视频| 亚洲高清在线天堂精品| 91精品国产91久久久久久三级| 亚洲中文无码av永久伊人| 成人午夜亚洲影视在线观看|