999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx

基于決策樹技術的農戶小額貸款客戶信用評價研究

2019-12-16 01:48:12尹水軍
電腦知識與技術 2019年29期
關鍵詞:商業銀行分類信息

尹水軍

摘要:本文研究決策樹分類算法lD3算法、C4.5算法和C5.0算法的基礎上,通過比較決策樹幾種分類算法優劣,選擇決策樹C5.0算法作為本文模型建立方法,并以某市農村商業銀行農戶小額貸款數據信息作為數據源,利用SPSS Clemen—tinel2.0開發環境建立了決策樹分類模型,建立農戶小額貸款客戶信用評價的決策樹模型,并以此幫助農村商業銀行對農戶信用進行評價,并作為貸款與否的依據。

關鍵詞:決策樹;C5.0 算法;農戶小額貸款;信用評價

中圖分類號:G642文獻標識碼:A

文章編號:1009-3044(2019)29-0259-04

1概述

決策樹是一顆判定樹,其內部結點代表屬性判定,分支結點代表測試結果,葉子節點就代表一個判定類別。決策樹根結點信息量最大,樹的中間結點是子樹中信息量最大的屬性,決策樹的葉子結點是樣本的類別值。決策樹的構建是一種自上而下的歸納過程。從根結點開始,對每個非葉子結點,找出其樣本集中的一個屬性對樣本集進行測試。根據測試結果將樣本集劃分成子樣本集,子樣本集構成新葉子結點。對新葉子結點再重復上述過程,直至達到終止條件。構建決策樹的關鍵環節是測試屬性的選擇和樣本集的劃分。構建決策樹后可對一個新數據對象進行分析,從而判定出新數據對象的分類或取值。

決策樹的歸納學習是以樣本集為基礎的,它是從一組無序樣本集中形成分類規則。它采用遞歸方式,其內部結點進行屬性值的比較,根據判定并得到向下分支。最終得到判定結論。得出分類模型后,取一級已知類別的數據作為測試集,用測試集對分類模型進行測試,以驗證其分類判定的正確性。決策樹的生成過程可表示為如圖1所示,從圖中可知決策樹的生成過程是一種歸納一測試一演繹過程。由訓練集得到決策樹分類模型的過程稱歸納一過程,用測試集對分類模型進行測試稱為測試過程,再由分類模型對新數據進行分類的過程稱為演繹過程。

2ID3算法

ID3算法是一種基于信息熵的由Quinlan提出的決策樹分類算法,其選擇測試屬性的依據是信息熵的下降速度,屬性集的取值確定其類別。在構造決策樹時,ID3算法屬性選取的標準是信息增益,決策結點即為信息增益最大的屬性,并由其建立分支,再遞歸調用該方法建立決策樹結點的子分支,直至僅包含同一類別的數據為止。

5農村商業銀行農戶小額貸款分類模型實證研究

5.1實證背景

農戶小額貸款作為金融服務的新品種,自推出以來,就受到了廣大農民的歡迎,這一新的支農金融政策為支持農村經濟發展發揮了積極的作用。然而農戶小額信用貸款向農戶發放的無抵押擔保的貸款,是農村商業銀行的一種創新產品。因為農戶小額貸款對象經營的是一受自然災害的制約因素較多的產業,導致各類逃債的現象極為頻繁,不良貸款比率遠遠高于其他商業貸款,嚴重損害了農村商業銀行的利益。因此,農村商業銀行業面臨的緊迫問題是建立一個信用風險評估模型,以降低農村商業銀行的信貸風險。將決策樹技術應用于信用評估模型,能在一定程度上解決農村商業銀行所面臨的信貸風險問題。本文以某市農村商業銀行農戶小額貸款數據信息作為數據源,利用決策樹分類模型C5.0對農戶信用進行評價,并作為貸款與否的依據。

5.2商業理解

在實施決策樹分類前,要充分理解項目的商業目標。如果不能完全理解項目的商業目標,挖掘模型很難符合要求。在項目進行需求分析之后才能進行項目實施,以此確定系統的目標。決策樹挖掘模型能將重要信息從海量數據中挖掘出來,以形成有用的規劃,且這些重要信息人們很難通過觀察直接得到,我們可以利用形成的規則來確定信用等級。本文以農戶小額貸款相關數據信息作為測試對象,運用決策樹模型形成的規則幫助農村商業銀行進行信用評估,分析出農戶哪些因素能確定農戶信用等級,并用決策樹的形式顯示其相關程度,為農村商業銀行發放小額貸款提供參考依據。

5.3數據準備

數據準備是決策樹分類過程中一個重要環節,數據準備階段工作量巨大。要對某一項目建立決策樹分類模型,必須有明確的數據樣本,因此,準備數據就成為決策樹分類過程中的非常關鍵的一個過程。本文的數據信息主要來自某市農村商業銀行2018年貸款農戶的基本數據信息,考慮到運用決策樹分類技術是為了發現規律,作為農戶借款的依據,我們只選取了與農戶信用評價關系較為密切的信息。我們總共選取采集了600份農戶信息,其中300份農戶信息作為訓練數據集。另外300份農戶信息作為測試數據集。

5.4數據預處理

數據預處理的目的是得到完整的、含噪聲相對較少的、基本一致的數據。本文的農戶數據信息雖然都來自某農村商業銀行網點,但由于農戶辦理小額貸款全部分散到全市所有的營業網點,其數據的填寫并非完全一致,將其整理成為一個數據庫,有很多與本研究主題無關的信息需要將其摒棄,有的數據還需要進行離散化處理。

(1)數據變換。在農戶信息數據庫中,保存著農戶基本信息,其中有很大一部分是與此次挖掘任務無關的信息,如果用全部數據進行挖掘,就會使此次挖掘變得毫無意義。本文中的農戶數據信息來自不同的營業網點,部分數據缺失且不規范,將來這些來自多數據源的數據按統一格式組合、連接到一起,將部分不規范的數據屬性作規范化變換。例如。本次挖掘模型中,為方便運用挖掘模型,將家庭收入來源分為三類,包括純種植業收入、種植業和畜牧業、種植業、畜牧業及其他混合。

(2)數據清洗。采集來的數據中有些是與個人信用風險評估無關的數據,在數據模型建立前必須將其清除,否則將會影響建模效果。本次采集的數據中。由于源數據庫包含的個人客戶信息很多,有些信息與個人信用評估基本沒有關系,如農戶姓名、農戶身份證號碼、農戶住址、電話號碼、合同編號、合同簽訂日期、貸款調查人、貸后管理人員等,為簡單起見,直接從數據庫中刪除。

(3)噪聲處理。在最終形成的農戶信息數據庫中,有一些數據明顯偏離預期挖掘目標、不符合建模要求、空缺值多、有誤差等數據進行清洗或修正,最終得到比較整齊的、干凈的、可以用作數據處理和模型開發的數據樣本。

此次采集到的數據,通過多次使用上述方法進行數據預處理,從農戶小額貸款處理數據集形成一個適合數據挖掘任務的數據集,這個集合共有600條記錄,每條記錄由9個字段組成,分別為:農戶年齡、婚姻狀況、供養人數、家庭年平均收入、月還款收入比、家庭收入來源、貸款用途、貸款數額以及信用記錄。

5.5基于C5.0算法的數據挖掘模型的構造

將決策樹預測應用于農村商業銀行農戶貸款信用評價問題中,基本思路是:根據已知的樣本與原始信用評價狀態,運用決策樹發現貸款人信用狀態與其某些特征屬性之間的關系,使得能夠通過對農戶這些屬性的具體觀察值,對貸款人的信用情況進行預測。

本文采用SPSS Clementine12.0數據挖掘分析工具設計數據挖掘流,得出挖掘結果并進行針對主題的分析,根據需求所建立的數據挖掘模型如圖2所示。

5.6挖掘模型執行結果分析

由于挖掘模型選擇月還款收入百分比作為根結點,所以能夠得出的結論是:農村商業銀行要對農戶進行貸款前的評估,農戶的月還款與收入的比值與農戶的評估等級關系最為密切,其次是家庭收人來源,這兩項對評估農戶的信用等級最為重要,再是家庭平均收入和貸款數額,這兩項也與評估農戶的信用等級關系較為密切。此外,婚姻狀況、信用記錄、供養人數、貸款用途也與評估農戶信用等級存在一定的關系。農戶年齡雖然與評估農戶的信用等級相關,但相關度還是非常弱的。通過用決策樹C5.0算法對農戶信息數據庫的實證分析,筆者認為農村商業銀行對農戶進行貸款,不應重點關注貸款數額的多少,更應該注重農戶的還款能力,而且應重點關注農戶的家庭收入來源。

對上面的分析結果,也可以用圖表形式瀏覽挖掘模型,當選擇數據模型頁面中的Viewer頁面后,得到一個瀏覽窗口,該瀏覽窗口是用一個形象的樹來描述模型,且能清晰地看到各個結點中客戶信用評級情況,如圖3所示。

5.7C5.0模型準確度分析

前面用C5.0決策樹模型分析農戶信用評估信息后,利用訓練集的數據來檢驗此模型的準確程度,執行測試集的數據流的分析結果如圖4所示。

從C5.0模型準確度分析圖可以看出,用C5.0算法對農戶訓練數據集進行測試后,此模型的準確率為86%,數據總數為300個,錯誤率為14%。從準確率來看,用此模型對農戶數據信息進行分析的結果具有一定的參考價值。但不意味著具有這些特征的農戶都只要放心貸款,因為此模型的錯誤率為14%,略為偏高,分析其原因可能是本次挖掘所得到的數據并不全面,或是農戶數據信息過少引起的,或者是所選擇的數據中還有一部分數據也具有一定的噪聲。因此,在數據挖掘中,應該選擇農戶數據信息足夠多,且必須花大量工作來進行數據預處理,這樣才能為農村商業銀行提供有真正意義的貸款依據。

6結束語

農戶小額貸款是面向農村的金融服務的新品種,是國家高度重視“三農”問題的真實體現。如何充分地利用農戶信息,把數據挖掘技術應用到小額貸款業務是當前農村商業銀行面臨的一個非常重要的現實問題,通過建立新的評價模型輔助信貸管理人員進行決策與分析,真正地做到對農戶進行客觀的評價,從而達到加強信貸能力減少不良貸款產生的目的。

猜你喜歡
商業銀行分類信息
分類算一算
商業銀行資金管理的探索與思考
分類討論求坐標
數據分析中的分類討論
關于加強控制商業銀行不良貸款探討
消費導刊(2017年20期)2018-01-03 06:27:21
教你一招:數的分類
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
我國商業銀行海外并購績效的實證研究
我國商業銀行風險管理研究
當代經濟(2015年4期)2015-04-16 05:57:02
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
主站蜘蛛池模板: 国产特级毛片| 亚洲资源站av无码网址| 亚洲精品自拍区在线观看| 91麻豆精品视频| 国产女人在线视频| 亚洲国产精品日韩专区AV| 伊人久久精品无码麻豆精品| 亚洲无码视频一区二区三区| 日韩欧美在线观看| 香蕉视频在线精品| 欧美亚洲另类在线观看| 毛片免费在线| 操美女免费网站| 5555国产在线观看| www精品久久| 国产真实乱人视频| 亚洲无码37.| 久久久久久午夜精品| 国产主播一区二区三区| 国产日韩精品欧美一区灰| 成人国产小视频| 激情国产精品一区| 在线精品欧美日韩| 国产亚洲精品91| 欧美丝袜高跟鞋一区二区| 国产激情影院| 国产一区二区丝袜高跟鞋| 在线va视频| 亚洲天堂.com| 久久国产热| 天天色综合4| 亚洲欧美成人| 色亚洲成人| 国产精品无码AV中文| 亚洲欧洲自拍拍偷午夜色无码| 亚洲人在线| 呦系列视频一区二区三区| 性色在线视频精品| 亚洲第一黄色网址| 久久黄色免费电影| 九九这里只有精品视频| 欧美中文字幕第一页线路一| 国内a级毛片| 免费毛片网站在线观看| 国产乱子伦精品视频| 亚洲乱伦视频| 91免费国产在线观看尤物| 亚洲精品视频免费| 91精品国产自产91精品资源| 中日韩一区二区三区中文免费视频| 成人精品免费视频| 一级毛片在线播放| 亚洲最大福利网站| 99视频在线看| 亚洲婷婷在线视频| 亚洲av无码久久无遮挡| 日本国产精品一区久久久| 亚洲国产看片基地久久1024| 国内精品久久人妻无码大片高| 激情亚洲天堂| 国产精品尤物铁牛tv| 亚洲av色吊丝无码| 人妻一区二区三区无码精品一区| 国产第八页| 91福利在线观看视频| 中文字幕无码av专区久久| 男女性午夜福利网站| 色婷婷亚洲综合五月| 色窝窝免费一区二区三区 | 亚洲国产日韩视频观看| 国产精品内射视频| 青青国产视频| 国产精品不卡片视频免费观看| 精品无码人妻一区二区| 91伊人国产| 国产丝袜91| 国产亚洲欧美在线视频| 婷婷在线网站| 国产第一页免费浮力影院| 国产欧美亚洲精品第3页在线| 性69交片免费看| 亚洲AV一二三区无码AV蜜桃|