999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

西部農村產權抵押信貸中農戶分類實例研究

2017-05-30 16:43:02孫一清陳漳順李啟璐石行邱麗萍吳養會
安徽農業科學 2017年29期
關鍵詞:抵押分類模型

孫一清 陳漳順 李啟璐 石行 邱麗萍 吳養會

摘要 基于陜西及寧夏部分地區農戶關于產權抵押貸款的有關調研數據,以所在地區、年齡、家庭年收入等6個因素作為自變量,以農戶產權抵押貸款需求為因變量,利用R語言構建決策樹的農戶產權抵押貸款信用評估模型,為相關農村金融機構提供金融政策方面的支持。研究結果表明:對于具有不同特征的農戶,其貸款意愿呈現出一定的差異性。最終,除耕地面積變量外其余5個變量被引入決策樹模型進行分析。通過檢驗和改進后的模型具有一定的分類正確性及準確性,對于農村金融機構在制定相應的金融政策及實際貸款風險控制過程中能起到一定的參考作用。

關鍵詞 產權抵押貸款;C5.0決策樹模型;ROC曲線

中圖分類號 S-9 文獻標識碼 A 文章編號 0517-6611(2017)29-0209-05

A Case Study of Farmers Classification in the Western Rural Property Mortgage Credit

SUN Yiqing, CHEN Zhangshun,LI Qilu,WU Yanghui* et al

(College of Science,Northwest A&F University, Yangling, Shaanxi 712100)

Abstract The decision tree model about the farmers credit evaluation of property mortgage was constructed by Rlanguage based on the investigation data related to the property mortgage in Shaanxi and Ningxia. We chose the region, age, family income, et al was 6 factors as the independent variables, the demands of farmers property mortgage as the dependent variable. The purpose of the model was to provide support for the related rural financial institutions in financial policy. The results showed that the willing to lend of farmers who have different characteristics present a certain diversity. Except the cultivated area, the other 5variables were introduced into the decision tree model to analyze. By testing and improving operation, the model had a certain correctness and accuracy in classification. The results of the model provided a certain reference role in corresponding financial policy and controlling the process of the actual loan risk.

Key words Property mortgage;C5.0 decision tree model;ROC curve

基金項目 2015年西北農林科技大學大學生創新訓練項目(20151071 2172)。

作者簡介 孫一清(1995—),男,山東威海人,本科生,專業:信息與計算科學。*通訊作者,副教授,博士,從事數據挖掘與應用研究。

收稿日期 2017-08-09

長期以來,由于歷史和社會發展等原因,在西部地區金融資金供給不足、農村金融市場化不足、農村金融業結構與服務不完善等因素制約下,我國西部地區的農村金融經濟發展相對緩慢[1]。而農村金融發展是促進農業經濟發展和提高農民收入水平的關鍵力量,因此,如何加快農村金融的快速發展成為一項重要的發展問題。實踐發現,農村產權抵押融資是有效地解決這一現實問題的重要途徑。農村產權抵押融資是一種農戶或集體以自身所擁有的土地所有權、使用權等作為信貸物向銀行或其他金融機構進行抵押貸款的行為。針對農村產權抵押貸款,國內學者主要對其發展意義、現狀、制約因素及其制度中存在問題等進行定性分析,而基于農戶微觀數據的定量研究相對偏少[2]。向紅等[3]以重慶為例,采用制度經濟學的分析方法,對重慶農村“三權”(土地承包經營權、林權和宅基地使用權)抵押融資現狀、制約因素等進行深入探索,并根據融資的制約因素提出了相關對策。陳波等[4]運用結構方程模型對影響農村產權抵押融資農戶滿意度的因素進行了實證研究,并提出了提高滿意度的政策建議。許多學者對影響農戶參與農村產權抵押意愿的因素進行了研究[5-7],得出農戶年齡、性別、文化程度、勞動力數目、家庭總收入、金融機構服務滿意度和政策了解程度等因素對農戶參與產權抵押有較顯著的影響。

縱觀以上研究,大多都是制度研究或少數以Logistic回歸模型進行的實證分析,但由于模型同性質和獨立同分布等理想化假設,研究結果很難全面客觀地反映出農戶融資的實際需求,也難以為銀行業根據不同類型的農戶制定抵押貸款政策提供有效的依據。因此,筆者將前期已獲得的農戶調查資料作為對象,利用SPSS、MATLAB、決策樹等統計及數學軟件與方法,根據特定的因素對農戶進行分類,建立并檢驗以農戶貸款預期為目標的分類模型,以便于未來新數據預測與分類的使用。

1 決策樹分類方法

在機器學習問題中,決策樹方法[8]是以實例為基礎的歸納學習算法,代表的是對象屬性與對象值之間的一種映射關系。樹中每個節點表示某個對象,每個分叉路徑則代表某個可能的屬性值,而每個葉節點則對應從根節點到該葉節點所經歷的路徑所表示的對象的值。 決策樹方法從一組無次序、無規則的事例中推理出決策樹表示形式的分類規則,通常用來形成分類器和預測模型,可以對未知數據進行分類或預測、數據挖掘等。人們可以利用樹上各節點的分支將樣本分成若干組,通過選擇將數據分類。決策樹模型能夠從一個或多個決策變量中,根據自變量的值預測因變量的值。作為一種決策技術,決策樹分類已廣泛應用于生物醫學、工程控制、金融管理等諸多領域中。

決策樹分類方法分為2個階段:構建決策樹階段和分類階段。第一階段:利用訓練樣本集建立決策樹模型。這個過程實際上是一個從數據中獲取知識,進行機器學習的過程。這一步通常分為特征選擇、節點分裂和決策樹剪枝3個步驟。在生成決策樹的過程中需要根據不同屬性將節點分開,形成多個類別,通常的做法是測試所有屬性,對每個屬性分裂的好壞做出量化評價,選擇一個最佳的屬性作為當前節點的分裂屬性,這個過程叫特征選擇。節點分裂是根據該屬性不同的取值將節點分開,生成新的節點。決策樹的剪枝則是對樹結構進行修建,刪除已多余分支的過程。第二階段:利用建好的決策樹對測試樣本集進行分類。

2 基于決策樹的農戶產權抵押貸款信用評估模型

2.1 數據來源

該研究數據是西北農林科技大學經管學院學生采用調查問卷的方式走訪陜西及寧夏部分地區的農戶所獲取的。問卷主要分為5個部分,即農戶基本信息、貸款經歷及對此的評價、產權抵押政策的落實情況、未來融資的需要與打算和對農村產權抵押貸款的意見和建議。參考之前國內外學者在這方面的研究,最終通過聚類等數據處理方法選取了所在地區、戶主性別、經營類型、年齡、家庭年收入、教育程度、家庭土地經營面積、家庭規模、政策了解程度、機構數目、機構信譽、交通便利、服務滿意等13個因素初步作為該研究的自變量,并以產權抵押貸款需求作為因變量來進行研究。

2.2 數據規范化

相比銀行信貸部門的貸款申請表和貸款人違約記錄等相關資料,調查問卷數據存在著變量繁多、缺失值難以忽略,難以選取適合的自變量、因變量等問題。因此,對得到的數據進行初步的數據預處理顯得尤為重要。調查問卷得到的數據含有定性和定量問題,離散性變量和連續性變量共存,所以要做數據規范化,把連續性變量轉變為離散性,定量問題變為定性問題,規范化后數據見表1。

2.3 缺失數據補缺與變量精簡

2.3.1

缺失值的補缺。由于調查數據存在一定的缺失現象,該研究利用等級變量補缺方法對缺失數據進行填補。其主要過程為:以變量為參考,將調查數據分為矩陣A1和矩陣A2,無缺失值的數據集記為A1,有缺失的數據集記為A2。然后根據A2中第i行第t列元素x(2)ij與該列樣本均值 t的關系找出缺失值x(2)ij,以完全樣本A1的相關矩陣找出與缺失數據x(2)ij所屬變量Xj相關系數最大的變量Xk并且x(2)ik沒有缺失,如果缺失便向下尋找相關系數第二大的變量,一般選取和缺失變量相關系數最大的前2個到前5個變量。其計算公式為:

| (2)ij- j|= 1 5 5 t=1 (x(2)it- t)

根據以上公式計算出 (2)ij估計值,其中正負號的取法為x(2)it大于與該列樣本均值 t取正,小于則取負。最后,由于該研究所采用的數據中的變量等級不等,即調查問卷的每個問題不全是A、B、C、D這4個選項,所以當估計值 (2)ij小數部分取值大于0.65或小于0.35時,對估計值 (2)ij進行四舍五入取整得到缺失值的補缺估計值x(2)ij 。 當估計值 (2)ij小數部分取值在0.35~0.65時,利用公式zk= x(2)ik-1 Mk-1 及 (2)ij=zk(Mj-1)+1(其中Mk為變量Xk的最大取值,其中Mj為變量Xj的最大取值)對 (2)ij四舍五入后作為缺失值的補缺估計值x(2)ij 。

2.3.2 變量的精簡。由于變量間相關性、同質性等關系會對數據分析存在一定的影響,需要對調查問卷中涉及的所有變量進行篩選精簡以獲得較佳的分類預測結果。該研究采用主成分分析方法,根據變量與主成分的貢獻率間的關系,采取逐步剔除的方法獲得新的變量用于后續分析。

采用主成分分析法[9]選取14個評價指標的相關系數矩陣的特征根,結果見表2。從表2可以看出,特征值大于1的為前7個主成分,但是前6個主成分的貢獻率已經達到60%,而且各個主成分貢獻率相差不大,根據主成分方法篩選變量原則,可以從原來的14個變量中剔除8個。剔除方法為:從第14個主成分開始,變量“機構信譽”與該主成分之間的相關系數(絕對值)最大,為0.399,因此首先應該剔除該變量,重復上述步驟直至第7個主成分。最終結果剔除了機構信譽、經營類型、貸款意愿、文化程度、政策了解程度、交通便利、性別、機構數目這8個變量。

3 決策樹模型構建與分析

3.1 訓練樣本和測試樣本的選擇

由于樣本數據集合數據量比較大,采用保留法建立和評估模型,即把樣本集合分為訓練樣本集合和測試樣本集合兩部分。在500條樣本記錄中隨機抽取80%(400條)作為訓練集合,剩余的20%(100條)作為測試樣本集合對模型進行檢驗。通過詳細的問卷調查,確定農戶對產權抵押貸款的愿意程度,通過此標準將農戶分為愿意貸款客戶和不愿貸款客戶。

3.2 模型構建

采用決策樹C5.0建立決策樹結構(圖1),利用R語言建立決策樹模型、對模型預測處理并檢驗模型的有效性以及真實性,為相關農村金融機構提供金融政策方面的支持。

該決策樹以貸款意愿為決策目標,利用400條數據的訓練集建立決策樹模型,通過決策樹剪枝之后得到上圖的決策樹模型。由從圖1可以看出,最終的決策樹模型一共有6層,其中變量“耕地面積”沒有被納入決策樹的因素之中,說明耕地面積的大小對農戶貸款意愿的影響并不顯著,雖然耕地面積作為農戶產權抵押的資本可能決定了銀行為農戶貸款的意愿及額度,但并不影響農戶自身的貸款意愿。

基于上述的決策樹模型,對于具有不同特征的農戶,其貸款意愿呈現出一定的差異性。例如:所在地區為縣城郊區的農戶貸款意愿特別大,其愿意貸款的概率高達78%,這說明處于偏遠的縣城郊區的農戶往往經濟狀況低下,相比留在家鄉種地經營農業,他們更愿意通過土地抵押兌換為本金從而去城市尋求更進一步的發展;所在地區為農區或小城鎮的年齡在40~49歲的農戶,年收入在20 001~50 000元并且對貸款服務態度表示滿意的農戶,其中66%愿意貸款,說明家庭收入且年齡為40~49的此類農戶自身具有較高的經濟水平,其進一步發展家庭經濟及償還貸款的能力均具有一定的信心;年齡處于20~29歲,家庭規模為3~4人或7人以上的農戶,貸款意愿較高(75%),說明在家庭勞動力充足的前提下,這部分年輕的農戶愿意嘗試貸款來進一步發展。

反觀不愿意貸款的農戶,其中農區小城鎮50歲以上的農戶67%不愿貸款,因為大部分老年農戶生活已經穩定,并不想也不需要貸款;處于農區小城鎮的年齡在30~39歲對農村金融機構的服務態度不滿意的農戶,其中80%不愿意貸款;地處農區年齡在40~49歲年收入20 001~50 000元的農戶由于不滿意服務態度而不愿貸款的占64%,這部分農戶其實是具有償還貸款的能力并且想要進一步發展經濟的,但是由于對金融機構服務態度的不滿意使得他們中的大部分貸款積極性不高,這需要金融機構提高自身的服務水平,防止這部分優質的客戶流失。

從最后得到的各因子構建決策樹時的重要性來看,較高的變量是所在地區和年齡,分別為100%和83.75%,重要性相差無幾的變量是服務滿意度(24.75%)和家庭年收入(2125%),最低的是家庭規模(8.00%)。決策樹模型直觀地表明基于抵押貸款為目的的農戶分類結果,其分類規則可以為金融機構提供有指導價值的農戶分析與認識,這對于考察產權抵押貸款政策落實情況以及進一步完善產權抵押貸款政策具有積極的指導意義。

3.3 模型評估

利用R構造的ROC曲線和混淆矩陣來評價該研究所建立的分類模型的分類效果。ROC曲線指受試者工作特征曲線,是反映敏感性和特異性連續變量的綜合指標,是用構圖法揭示敏感性和特異性的相互關系。它通過將連續變量設定出多個不同的臨界值,從而計算出一系列敏感性和特異性,再以敏感性為縱坐標、特異性為橫坐標繪制成曲線。曲線下面積越大,診斷準確性越高。在ROC曲線上,最靠近坐標圖左上方的點為敏感性和特異性均較高的臨界值。

從圖2可以看出,ROC曲線下圖形面積為0.666,表明該研究所建立的決策樹分類模型對于農戶分類問題具有較高的正確率及可靠性,建立在農戶調研數據基礎上的決策樹分類模型具有一定的應用價值,可以應用與農戶貸款預測與分析。從表3可以看出,在此分類問題中,模型的準確率為66%,其中,負例覆蓋率為74.07%,遠大于正覆蓋率5652%,這說明將沒有貸款意愿的客戶正確分類的概率要遠大于將有貸款意愿的客戶正確分類的概率。但是從金融風險的角度上來講,錯分有貸款意愿的客戶要比錯分沒有貸款意愿的客戶代價高出很多。為了改進上述出現的情況,規避金融風險,進一步提高分類的精準度,應在決策樹模型中引入代價矩陣。

4 結語

針對農戶產權抵押貸款試點執行過程中所獲取的調查數據進行決策樹分類研究,對繁瑣的調查問卷數據采用規范化和填補缺失值,利用主成分分析從影響貸款意愿的14個因素中,選擇有顯著影響的6個因素作為分類研究對象,利用決策樹C5.0算法對農戶建立決策樹模型,根據最后的決策樹結果,給出金融機構建議:第一,貸款抵押的政策推廣方面應該加大貸款意愿較高的偏遠縣城郊區的推廣工作;第二,提高機構的服務態度與水平,從而挽回部分優質的客戶;第三,積極為20~29歲家中人口較多的農戶提供貸款幫助。

由于該研究的樣本容量較小(只有500份),導致最后的分類精度有所降低,在后續的研究中將擴大樣本容量,進一步改進決策樹分類模型,更全面地分析和比較分類結果,做好西部農村金融貸款工作,推動西部農村經濟快速發展,完善西部農戶產權抵押貸款制度。

參考文獻

[1] 王毛毛. 我國西部地區農村金融發展現狀與對策淺析[J].企業技術開發,2010,29(8):27.

[2] 于琴, 劉亞相. 西部地區農村產權抵押貸款對農戶收入影響的實證分析[J].四川農業大學學報,2014(4):455-461.

[3] 向紅,曹躍群,何濤.農村產權抵押融資的制約因素及路徑選擇:以重慶為例[J].安徽農業科學,2011,39(3):19517-19519.

[4] 陳波,汪海洋,孔榮.基于農戶視角的農村產權抵押融資方式評價:以寧夏同心縣為例[J].貴州農業科學,2013,41(5):230-233.

[5] 庸暉,羅劍朝.農戶選擇農村產權抵押融資行為的影響因素研究:基于不同貸款選擇的對比分析[J].廣東農業科學,2014,41(21):220-226.

[6] 袁小博,白雪,劉亞相.西部地區農村產權抵押融資的農戶滿意度影響因素[J].貴州農業科學,2015(3):211-215.

[7] 崔詩雪,菅惠立,張立中. 農戶參與農村土地承包經營權抵押貸款意愿影響因素分析:基于內蒙古包頭市土右旗調研數據[J].安徽農業科學,2016,44(16):28-30.

[8] 毛國君,段立娟,王實,等.數據挖掘原理與算法[M]. 北京:清華大學出版社,2005:1-10,109-127.

[9] 王紹輝.對消費信貸中個人信用評價方法的探索[D].北京:首都經濟貿易大學,2004.

[10] 蔡麗艷,馮憲彬,丁蕊.基于決策樹的農戶小額貸款信用評估模型研究[J].安徽農業科學,2011,39(2):1215-1217.

[11] ROBIN X,TURCK N,HAINARD A,et al.pROC:An opensource package for R and S+ to analyze and compare ROC curves[J].BMC Bioinformatics,2011,12:77.

猜你喜歡
抵押分類模型
一半模型
《民法典》時代抵押財產轉讓新規則淺析
客聯(2022年6期)2022-05-30 08:01:40
分類算一算
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
俄藏5949-28號乾祐子年貸糧雇畜抵押契考釋
西夏學(2020年2期)2020-01-24 07:42:42
動產抵押登記辦法
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
主站蜘蛛池模板: 国产91高清视频| 亚洲最大在线观看| 国产亚洲第一页| 国产麻豆aⅴ精品无码| 美女一区二区在线观看| 波多野结衣无码中文字幕在线观看一区二区| 国产一区成人| 亚洲精品无码抽插日韩| 中国特黄美女一级视频| 亚洲无卡视频| 中文字幕在线观| 中文一级毛片| 在线观看亚洲成人| 精品国产成人a在线观看| 成人精品视频一区二区在线| 国产综合色在线视频播放线视| 黄色三级网站免费| 一个色综合久久| 欧美综合成人| 亚洲一级毛片免费看| 依依成人精品无v国产| 99re精彩视频| 亚洲免费人成影院| 国产成人成人一区二区| 色精品视频| 蜜臀av性久久久久蜜臀aⅴ麻豆| 日韩欧美中文| 免费A级毛片无码免费视频| 人妻精品全国免费视频| 青青久久91| 在线观看热码亚洲av每日更新| 国产剧情一区二区| 日本久久网站| 国产SUV精品一区二区6| 国产一区在线视频观看| 麻豆国产精品| 九色91在线视频| 国产欧美日韩在线一区| 少妇精品久久久一区二区三区| 久久永久免费人妻精品| 2024av在线无码中文最新| 欧美丝袜高跟鞋一区二区| 国产成人夜色91| 婷婷午夜影院| 国产在线精品香蕉麻豆| 福利国产微拍广场一区视频在线| 久久精品人人做人人爽97| 国产丰满大乳无码免费播放| 成人在线观看不卡| 久久久久青草大香线综合精品| 青草视频网站在线观看| 日韩免费中文字幕| 国产在线97| 日本中文字幕久久网站| www.亚洲一区二区三区| 97影院午夜在线观看视频| 欧美精品亚洲二区| 日本一区二区三区精品AⅤ| 高清无码不卡视频| 亚洲综合色吧| 精品国产免费人成在线观看| 国产一区二区网站| 国产日韩精品欧美一区喷| 久久久久久久久18禁秘| 毛片免费网址| 亚洲国产精品无码AV| jijzzizz老师出水喷水喷出| 99视频只有精品| a天堂视频在线| 中文毛片无遮挡播放免费| 情侣午夜国产在线一区无码| 欧美成人精品欧美一级乱黄| 久久semm亚洲国产| 草草影院国产第一页| 2022精品国偷自产免费观看| 国产人妖视频一区在线观看| 视频在线观看一区二区| 亚洲精品成人片在线观看| 亚洲天堂视频在线播放| 色婷婷电影网| 一级毛片高清| 天天综合天天综合|