999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

隨機森林在甘肅省農村貧困戶識別中的應用

2018-05-14 17:05:45李佳容
農村經濟與科技 2018年4期
關鍵詞:精準扶貧

李佳容

[摘 要]本文根據甘肅省農村入戶調查資料,利用隨機森林分類方法對其進行貧困戶識別,經過研究發現隨機森林分類在貧困戶識別的中表現出了其在離散變量中的優勢,識別正例的命中率達到71%。因此,在貧困戶識別方法上可以有所借鑒。

[關鍵詞]貧困戶;隨機森林;識別方法;精準扶貧

[中圖分類號]F323.8 [文獻標識碼]A

自改革開放以來,雖然甘肅已取得了顯著的減貧效果,但2011年國家提高貧困線(2300元)以后,甘肅的貧困覆蓋面增大,據2013年的統計數據,甘肅共有552.2萬貧困人口,貧困發生率為26.5%。因此,實現“精準扶貧”是當前需要解決的重要問題。本文結合目前應用廣泛的隨機森林方法,嘗試精準識別貧困,為今后在貧困戶識別方法上提供借鑒。

1 隨機森林的應用及理論背景介紹

隨機森林算法是Leo Breiman和Adele Cutler在2001年提出的一種集成學習算法,它是通過將bagging和隨機特征選擇結合起來,對決策樹模型添加額外的多樣性。即每次隨機選擇一些特征變量,獨立建立決策樹模型,不斷重復。而且,需要確保每次建樹時,特征變量等可能的被選擇,這樣在樹的集成產生之后,使用投票的方法來組合預測結果。在隨機森林被提出到現在,在生物學、經濟、金融等很多領域都有廣泛的應用。從隨機森林算法提出至今,人們對隨機森林算法進行了深入的研究,作出多種優化改進策略并取得了良好的效果。

2 隨機森林模型識別貧困戶

2.1 數據介紹與清洗

本文采用隨機森林的方法對2015年甘肅省86個縣(區)入戶調查資料進行貧困戶識別實證研究。數據信息包括住戶基本信息、主要固定資產信息和期末耐用商品信息。因為調查戶從業類型的不同,資產擁有情況也有明顯的差異。由于本研究是對農村貧困戶的識別挖掘,因此重點研究調查戶中農業戶的家庭情況。農村最低生活保障(簡稱“低保”)制度是指政府對家庭年人均純收入低于當地農村居民最低生活保障標準的農村常住居民家庭實行的基本生活救助制度。所以領取低保的農業戶通常是經濟基礎較差,生活有困難的住戶,可以視為貧困戶。

農業戶調查數據主要包括住戶基本信息、主要固定資產信息和期末耐用商品信息等,共有27個變量信息。總體描述如表1:

將原始調查數據經過簡單的處理,主要為了方便導入R軟件進行分析重新命名變量,然后導入到R軟件中。對數據處理的步驟如下:對空值處理;對變量標準化;處理缺失值;處理異常值;對數據量非常少的變量處理。經過數據清洗整理,數據集共有12個屬性變量、3296條記錄。其中領取低保的農業戶有722戶,占所有調查的農業戶的28%。

2.2 貧困戶分類

首先將整理后數據集按70%和30%劃分為訓練集和測試集,并經過Kolmogorov-Smirnov(柯爾莫哥洛夫-斯莫洛夫)同質性檢驗,通過R語言中的函數ks.test()實現,由檢驗結果可知訓練集與測試集具有同質性。

2.2.1 模型的構建過程

本文采用的是R語言中的party包中的cforest(函數訓練的隨機森林模型,具體模型構建過程:(1)通過party包中的cforest(函數對數據集train構建隨機森林;(2)根據選取不同的樹的數量值,構建隨機森林,確定最優的樹的數量。這里根據每次預測值計算的auc值來評價分類器的優劣,最終確定最優樹數量是220棵;(3)將測試集test代入構建好的隨機森林,并用predict函數進行預測,并繪制箱線圖可視化結果;(4)繪制混淆矩陣,展示預測值的情況,并直觀顯示預測值與真實值之間的差距,來說明模型的準確性;(5)繪制ROC曲線圖,來評價模型的適用性。

2.2.2 模型的結果及檢驗

根據模型在測試集預測結果建立混淆矩陣如下:

可以看出,預測的正確率為(410+157)/(410+356+65+157)= 58%;正例的覆蓋率為157/(157+356)=31%,正例的命中率為157/(65+157)=71%。可見正例的命中率比較高,說明對貧困戶識別的正確率比較高。

再次,對模型性能進行評價,繪制ROC曲線圖(見圖1)。根據評估結果,可以看出,隨機森林模型表現得比較好。

3 總結與展望

精準扶貧在政府和學術界一直都是關注的重點,經濟發展到今天,我們國家已經脫離了貧窮落后走向了繁榮富強,但是由于經濟發展的不平衡,在一些地區仍然有貧困現象,那么如何在龐大的人群中準確地找到他們,是現在面臨的一個難題。因此,本文嘗試應用隨機森林對甘肅省入戶調查數據進行貧困戶識別的實證研究。實證分析選擇缺失數據較少的農業戶生產性固定資產和期末耐用商品的擁有情況數據作為研究樣本數據。由隨機森林預測結果可知,正例命中率到達71%。因此對比邏輯回歸方法,在相同數據集中,隨機森林表現較好。

對于本次研究來說,由于數據集選取的是農業戶的生產性固定資產和期末耐用商品的情況,無法全面得描述農業戶家庭的整體情況,這也對分類分析造成一定的局限。為了得到更好的貧困戶識別的準確性,在以后的研究里可以將更多的家庭情況考慮進來。因此,希望在今后的研究中可以有所借鑒。

[參考文獻]

[1] 汪三貴.論中國的精準扶貧[J].貴州社會科學,2015(05).

[2] 汪三貴,王姮,王萍萍.中國農村貧困家庭的識別[J].農業技術經濟,2007(01).

[3] 李昊源,崔琪琪.農村居民家庭貧困的特征與原因研究[J].上海經濟研究,2015(04).

[4] 韓旭峰,豆紅玉.甘肅省農村最低生活保障標準測算與分析——基于擴展線性支出模型[J].西北人口,2017(01).

猜你喜歡
精準扶貧
精確理解“精準扶貧”
民生周刊(2016年20期)2016-11-11 13:39:21
淺析全面建設小康社會中的精準扶貧問題
人間(2016年28期)2016-11-10 21:29:58
貴陽實施精準扶貧之農村電商研究
人間(2016年28期)2016-11-10 21:22:47
芻議智慧金融下的精準扶貧
普惠金融視角下大學生返鄉創業與精準扶貧現狀分析
論高校“智庫”扶貧工程的實施及推廣
人間(2016年26期)2016-11-03 16:15:11
精準扶貧背景下山區貧困縣脫貧路徑選擇
精準審計的現狀研究
商(2016年27期)2016-10-17 05:42:30
“精準扶貧”視角下的高校資助育人工作
科技視界(2016年20期)2016-09-29 12:23:49
主站蜘蛛池模板: 亚洲综合在线最大成人| 久久国产热| www.亚洲国产| 伊人色综合久久天天| 91啦中文字幕| 日本少妇又色又爽又高潮| 激情亚洲天堂| 免费一级无码在线网站| 免费不卡在线观看av| 日日噜噜夜夜狠狠视频| 欧美日韩激情在线| 九色综合伊人久久富二代| 在线观看无码av免费不卡网站| 网友自拍视频精品区| 日本高清成本人视频一区| 国产亚洲精品自在久久不卡| 午夜无码一区二区三区在线app| 国产精品亚洲一区二区在线观看| 国产乱子伦无码精品小说| 黄色网在线免费观看| 国产免费福利网站| 亚州AV秘 一区二区三区| 综合色婷婷| 精品亚洲欧美中文字幕在线看| 综合久久五月天| 欧美国产三级| 亚洲品质国产精品无码| 国产精品女熟高潮视频| 国产成人av一区二区三区| a色毛片免费视频| 亚洲日韩精品无码专区97| 国产精品爆乳99久久| 91在线激情在线观看| 精品国产一区91在线| 国产欧美视频在线| 久久香蕉国产线看观看式| 国产成人综合日韩精品无码不卡 | 欧美人人干| 欧美国产日产一区二区| 亚洲AV色香蕉一区二区| 免费看一级毛片波多结衣| 国产全黄a一级毛片| 亚洲 欧美 日韩综合一区| www.99精品视频在线播放| 国产精品国产三级国产专业不| 毛片最新网址| 尤物精品视频一区二区三区| 国产99热| www.精品国产| 91口爆吞精国产对白第三集| 麻豆AV网站免费进入| 18禁影院亚洲专区| 精品福利视频导航| 成人午夜亚洲影视在线观看| 99资源在线| 欧美日本在线一区二区三区 | 国产成人精品一区二区免费看京| 无码AV高清毛片中国一级毛片| 在线另类稀缺国产呦| 日韩天堂视频| 毛片a级毛片免费观看免下载| 久久久久国产一区二区| 成人午夜视频网站| 性激烈欧美三级在线播放| 午夜视频日本| 毛片国产精品完整版| 中文字幕在线日韩91| 欧美三級片黃色三級片黃色1| 在线国产综合一区二区三区 | 国产爽妇精品| 日韩无码一二三区| 国产迷奸在线看| 九九热这里只有国产精品| 手机在线看片不卡中文字幕| 在线观看国产精美视频| 国产福利不卡视频| 在线国产三级| 色婷婷在线影院| 欧美日一级片| 无码福利日韩神码福利片| 日韩一区二区三免费高清| 97国产精品视频自在拍|