999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

商業(yè)銀行信用風(fēng)險(xiǎn)評(píng)估實(shí)證分析及方法比較

2013-07-23 01:37:40李君藝張宇華
關(guān)鍵詞:分類(lèi)模型

李君藝 張宇華

1東莞職業(yè)技術(shù)學(xué)院計(jì)算機(jī)工程系 廣東 523808 2廣東工業(yè)大學(xué)計(jì)算機(jī)學(xué)院 廣東 510006

0 引言

我國(guó)的金融風(fēng)險(xiǎn)主要表現(xiàn)為信用風(fēng)險(xiǎn),我國(guó)商業(yè)銀行信用風(fēng)險(xiǎn)管理已由傳統(tǒng)經(jīng)驗(yàn)判斷時(shí)期逐步發(fā)展到現(xiàn)代信用風(fēng)險(xiǎn)模型化階段。隨著管理信息系統(tǒng)的廣泛使用和電子商務(wù)的深入發(fā)展,我國(guó)商業(yè)銀行大都擁有大量客戶(hù)數(shù)據(jù),而面對(duì)海量數(shù)據(jù),傳統(tǒng)的信用風(fēng)險(xiǎn)管理方法逐漸無(wú)法負(fù)荷。數(shù)據(jù)挖掘技術(shù)的出現(xiàn),為解決海量數(shù)據(jù)下的信用風(fēng)險(xiǎn)管理問(wèn)題提供了新的思路和方法。數(shù)據(jù)挖掘是以人工智能為基礎(chǔ)的數(shù)據(jù)分析技術(shù),是從大量的、不完全的、有噪聲、模糊的、隨機(jī)的數(shù)據(jù)中,提煉隱含其中的、具有潛在作用的信息和知識(shí)的過(guò)程。數(shù)據(jù)挖掘可以為商業(yè)銀行信用風(fēng)險(xiǎn)提供諸多分析方法,本文對(duì)三種常用的數(shù)據(jù)挖掘方法——多元判別分析、聚類(lèi)分析和貝葉斯網(wǎng)絡(luò)模型進(jìn)行實(shí)證研究,通過(guò)結(jié)果分析,比較三者作為信用風(fēng)險(xiǎn)評(píng)估方法的優(yōu)劣。

1 商業(yè)銀行信用風(fēng)險(xiǎn)評(píng)估指標(biāo)

信用風(fēng)險(xiǎn)評(píng)估方法的驗(yàn)證數(shù)據(jù)選用某商業(yè)銀行的數(shù)據(jù),選擇已成功申請(qǐng)房貸的 6000條個(gè)人客戶(hù)數(shù)據(jù)為研究對(duì)象,其中5000條數(shù)據(jù)作為訓(xùn)練樣本,1000條數(shù)據(jù)作為結(jié)果驗(yàn)證。LEVEL表示信用風(fēng)險(xiǎn)等級(jí),劃分為 High(H)、Middle(M)、Low(L)三個(gè)等級(jí),各等級(jí)在樣本數(shù)據(jù)中大致均勻分布。LEVEL作為響應(yīng)變量或目標(biāo)變量,其余的變量為客戶(hù)信用指標(biāo)集,反應(yīng)客戶(hù)的各項(xiàng)屬性,即特征屬性變量,如表1所示。

表1 屬性指標(biāo)列表

以上數(shù)據(jù)以SAS數(shù)據(jù)集的形式儲(chǔ)存于ODS數(shù)據(jù)層,訓(xùn)練數(shù)據(jù)統(tǒng)一存放于數(shù)據(jù)集studydata,驗(yàn)證數(shù)據(jù)存放于數(shù)據(jù)集newdata。

信用風(fēng)險(xiǎn)評(píng)估方法的實(shí)現(xiàn)功能是:在給定的風(fēng)險(xiǎn)等級(jí)分類(lèi)體系下,根據(jù)分析客戶(hù)的以上特征屬性變量,自動(dòng)確定客戶(hù)的信用風(fēng)險(xiǎn)等級(jí)類(lèi)別LEVEL。我們將通過(guò)對(duì)三種不同的分析方法進(jìn)行驗(yàn)證,比較三種方法在信用風(fēng)險(xiǎn)評(píng)估分析中的性能及準(zhǔn)確度。

2 實(shí)證分析

2.1 多元判別分析

判別分析是根據(jù)表明研究對(duì)象特征的變量值判別樣品所屬類(lèi)型的一種分類(lèi)方法。根據(jù)樣本的已知分類(lèi)及所測(cè)得的數(shù)據(jù),篩選出最能表明研究對(duì)象特征的變量,并根據(jù)這些變量和已知類(lèi)別,建立使誤判率最小的判別函數(shù)。在風(fēng)險(xiǎn)評(píng)估算法中,可把風(fēng)險(xiǎn)等級(jí)作為分類(lèi)變量,各個(gè)指標(biāo)屬性作為數(shù)值變量,從已知分類(lèi)數(shù)據(jù)中訓(xùn)練出判別函數(shù),用于客戶(hù)風(fēng)險(xiǎn)等級(jí)的分類(lèi)預(yù)測(cè)。

我們利用SAS系統(tǒng)軟件中的STEPDISC、DISCRIM過(guò)程對(duì)信用風(fēng)險(xiǎn)評(píng)估指標(biāo)進(jìn)行判別分析。過(guò)程如下:

(1)指標(biāo)篩選

首先,利用STEPDISC過(guò)程對(duì)指標(biāo)進(jìn)行篩選,選出對(duì)判別分析結(jié)果相關(guān)性較大的指標(biāo)。proc stepdisc data=studydata method=sw;class X20;var X1-X19;run;

STEPDISC過(guò)程逐步選出F值最大,即對(duì)判別效果貢獻(xiàn)最大的變量,選入模型,最后選出Pr>F小于判據(jù)0.15的變量。結(jié)果在19個(gè)變量中選擇了X3,X5,X10,X14,X18,X19共6個(gè)變量。

(2)判別分析過(guò)程

評(píng)估指標(biāo)的變量既有離散型變量也有連續(xù)型變量,數(shù)據(jù)的分布不能確定,我們須采用SAS中的DISCRIM過(guò)程。下面我們將以 studydata作為訓(xùn)練樣本,在前面已經(jīng)過(guò)STEPDISC的變量篩選,現(xiàn)在我們基于 studydata對(duì)新樣本newdata進(jìn)行風(fēng)險(xiǎn)等級(jí)分類(lèi)。

proc discrim data=newdata testdata=studydata testout=result list;

class x20;

var x3 x5 x10 x14 x18 x19;

run;

Studydata中的風(fēng)險(xiǎn)等級(jí)分類(lèi)共有H、M、L三級(jí),即X20有三種取值。運(yùn)行過(guò)程是首先得出三個(gè)級(jí)別的線(xiàn)性判別函數(shù)的系數(shù)和常數(shù)項(xiàng),用回代法將newdata每個(gè)觀測(cè)的變量代入三個(gè)判別函數(shù),哪個(gè)函數(shù)值大,觀測(cè)就屬于哪一類(lèi)。這里我們使用了 LIST選項(xiàng),使分類(lèi)結(jié)果自動(dòng)列出,并顯視各觀測(cè)分到每一類(lèi)的后驗(yàn)概率,最后結(jié)果是觀測(cè)被分到后驗(yàn)概率最大的那一項(xiàng)(圖1)。

圖1 PROC DISCRIM部分運(yùn)行結(jié)果

我們把DISCRIM過(guò)程的分類(lèi)結(jié)果與銀行內(nèi)部的實(shí)際風(fēng)險(xiǎn)評(píng)級(jí)結(jié)果相比,分類(lèi)正確的數(shù)據(jù)為776條,準(zhǔn)確率達(dá)到77%以上。然后我們嘗試把studydata樣本提高為8000條數(shù)據(jù)時(shí),newdata的分類(lèi)準(zhǔn)確率提升為80.6%。

2.2 聚類(lèi)分析

聚類(lèi)分析和判別分析有相似的作用,都是起到分類(lèi)的作用。但是,判別分析是已知分類(lèi)然后總結(jié)出判別規(guī)則,是一種有指導(dǎo)的學(xué)習(xí);而聚類(lèi)分析則是有了一批樣本,不知道它們的分類(lèi),甚至連分成幾類(lèi)也不知道,希望用某種方法把觀測(cè)進(jìn)行合理的分類(lèi),使得同一類(lèi)的觀測(cè)比較接近,不同類(lèi)的觀測(cè)相差較多,這是無(wú)指導(dǎo)的學(xué)習(xí)。因聚類(lèi)分析適合于分析樣本量少的數(shù)據(jù),下面我們只從newdata中選取100條數(shù)據(jù)作分析。

SAS中的聚類(lèi)分析過(guò)程有 11種分類(lèi)方法(METHOD),下面我們采用最短距離法(METHOD=SINGLE),即通過(guò)計(jì)算兩類(lèi)觀測(cè)間最近一對(duì)的距離,得出分類(lèi)結(jié)果。

圖2 PROC CLUSTER運(yùn)行結(jié)果

如圖2所示,Cluster History中的變量依次表示分類(lèi)的類(lèi)數(shù)、原分類(lèi)、每步合并入的類(lèi)、此步類(lèi)中的觀測(cè)數(shù)、R平方。系統(tǒng)聚類(lèi)法首先將所有樣本觀測(cè)各獨(dú)自視為1類(lèi),然后逐步合并至只有1類(lèi)。然后,我們?cè)O(shè)信用等級(jí)分類(lèi)數(shù)ncl為3,接下來(lái),可以用proc tree和proc means進(jìn)一步完善后續(xù)工作。

最后,根據(jù)數(shù)據(jù)集result可以得到將100個(gè)客戶(hù)分為3類(lèi),再結(jié)合對(duì)各類(lèi)客戶(hù)的定性評(píng)分,可以把信用風(fēng)險(xiǎn)定為高,中,低三個(gè)級(jí)別。與實(shí)際評(píng)級(jí)結(jié)果相比,運(yùn)算結(jié)果準(zhǔn)確的條數(shù)達(dá) 74條,準(zhǔn)確率為 74%。聚類(lèi)分析只能應(yīng)用于數(shù)據(jù)量較少的樣本,并且只能對(duì)樣本進(jìn)行分類(lèi),無(wú)法具體確定每一類(lèi)的風(fēng)險(xiǎn)級(jí)別。確定每個(gè)分類(lèi)的風(fēng)險(xiǎn)級(jí)別需要結(jié)合因子分析或人為定性分析。

2.3 貝葉斯網(wǎng)絡(luò)模型

貝葉斯網(wǎng)絡(luò)的構(gòu)建可以通過(guò)學(xué)習(xí)和人工構(gòu)建兩種方式進(jìn)行。人工構(gòu)建通過(guò)專(zhuān)家經(jīng)驗(yàn)手工構(gòu)造,學(xué)習(xí)則是通過(guò)數(shù)據(jù)分析獲得,即利用機(jī)器學(xué)習(xí)的方法分析數(shù)據(jù)來(lái)獲得貝葉斯網(wǎng)絡(luò)。在訓(xùn)練樣本充分的情況下,可以從數(shù)據(jù)中訓(xùn)練出貝葉斯網(wǎng)絡(luò)模型。貝葉斯網(wǎng)絡(luò)模型的構(gòu)建過(guò)程包括網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí),步驟如下:

(1)各個(gè)指標(biāo)作為節(jié)點(diǎn),運(yùn)用K2算法對(duì)studydata樣本進(jìn)行訓(xùn)練,尋找CH評(píng)分高的貝葉斯網(wǎng)絡(luò)模型,確定節(jié)點(diǎn)間的關(guān)系,生成貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)表。

(2)利用最大似然估計(jì)算法進(jìn)行參數(shù)學(xué)習(xí),確定節(jié)點(diǎn)的概率分配,為每個(gè)節(jié)點(diǎn)各生成一個(gè)條件概率表。

圖3 信用風(fēng)險(xiǎn)評(píng)估貝葉斯網(wǎng)絡(luò)模型

通過(guò)以上步驟構(gòu)建的貝葉斯網(wǎng)絡(luò)模型結(jié)構(gòu)如圖3所示。現(xiàn)對(duì)模型進(jìn)行驗(yàn)證。把從前面參數(shù)學(xué)習(xí)取得的 20個(gè)條件概率表,建立20個(gè)數(shù)據(jù)集,依次命名為T(mén)1,T2,…,T20。把網(wǎng)絡(luò)結(jié)構(gòu)表建立一個(gè)獨(dú)立的數(shù)據(jù)集,命名為 network。SAS算法將對(duì)客戶(hù)數(shù)據(jù)(newdata)逐條處理,過(guò)程如下:

(1)讀取客戶(hù)數(shù)據(jù),初始化運(yùn)算公式:

(2)搜索表Network,獲取屬性變量Xi(i=1,2,…,19)的父節(jié)點(diǎn);

(3)搜索表Ti(i=1,2,…,19),獲得該子節(jié)點(diǎn)與父節(jié)點(diǎn)的聯(lián)合條件概率,將其加入運(yùn)算公式;

(4)搜索表 T20,把 3個(gè)風(fēng)險(xiǎn)等級(jí)下的條件概率分別加入運(yùn)算公式,得出客戶(hù)在3個(gè)風(fēng)險(xiǎn)等級(jí)(H,M,L)的概率結(jié)果,最后確定把客戶(hù)分到概率最高的一個(gè)等級(jí)。

驗(yàn)證過(guò)程是通過(guò)輸入客戶(hù)的數(shù)據(jù)(newdata),得出客戶(hù)在3個(gè)信用風(fēng)險(xiǎn)級(jí)別(H,M,L)的概率,最后確定客戶(hù)屬于概率最大的一個(gè)級(jí)別。算法流程見(jiàn)圖4。

圖4 貝葉斯網(wǎng)絡(luò)驗(yàn)證算法流程圖

根據(jù)以上過(guò)程,我們使用newdata樣本的1000條數(shù)據(jù)進(jìn)行結(jié)果驗(yàn)證。把模型的分類(lèi)結(jié)果與銀行內(nèi)部的實(shí)際風(fēng)險(xiǎn)評(píng)級(jí)結(jié)果相比,分類(lèi)正確的數(shù)據(jù)為886條,準(zhǔn)確率達(dá)到88.6%。

3 結(jié)論

從表2的結(jié)果看,三種分析方法相比,對(duì)于中、低風(fēng)險(xiǎn)級(jí)別的客戶(hù)數(shù)據(jù),貝葉斯網(wǎng)絡(luò)方法的準(zhǔn)確率優(yōu)于判別分析和聚類(lèi)分析;對(duì)于高風(fēng)險(xiǎn)級(jí)別的客戶(hù)數(shù)據(jù),貝葉斯網(wǎng)絡(luò)的準(zhǔn)確率與其它兩種方法基本持平。貝葉斯網(wǎng)絡(luò)模型在判斷高風(fēng)險(xiǎn)客戶(hù)上沒(méi)有明顯的優(yōu)勢(shì),大約是因?yàn)楦唢L(fēng)險(xiǎn)客戶(hù)的指標(biāo)屬性集近似吻合條件獨(dú)立的假定。但是,對(duì)于中、低風(fēng)險(xiǎn)的客戶(hù)而言,其影響還款能力的各方面因素大多是相關(guān)的,貝葉斯網(wǎng)絡(luò)模型在解決條件依賴(lài)方面有明顯優(yōu)勢(shì)。總體來(lái)看,貝葉斯網(wǎng)絡(luò)模型的總體準(zhǔn)確率高于判別分析和聚類(lèi)分析。貝葉斯網(wǎng)絡(luò)能運(yùn)用所有的屬性指標(biāo)并明確確定每個(gè)指標(biāo)的依賴(lài)關(guān)系和條件概率,判別分析則只選取相關(guān)性較高的指標(biāo)進(jìn)行概率估算,因此貝葉斯網(wǎng)絡(luò)的精確度顯然要高于判別分析;與聚類(lèi)分析相比,貝葉斯網(wǎng)絡(luò)是基于對(duì)大量歷史數(shù)據(jù)進(jìn)行學(xué)習(xí)而獲得的,并能用于分析數(shù)據(jù)規(guī)模較大的樣本,而聚類(lèi)分析能應(yīng)用于數(shù)據(jù)量較少的樣本,并且只能對(duì)樣本進(jìn)行分類(lèi),無(wú)法具體確定每一類(lèi)的風(fēng)險(xiǎn)級(jí)別,在這一點(diǎn)上,貝葉斯網(wǎng)絡(luò)模型明顯優(yōu)于聚類(lèi)分析。

表2 三種方法正確率對(duì)照表

[1]張連文,郭海鵬.貝葉斯網(wǎng)引論[M].科學(xué)出版社.2006.

[2]譚浩強(qiáng).SAS/PC統(tǒng)計(jì)分析軟件使用技術(shù)[M].國(guó)防工業(yè)出版社.1996.

[3]李君藝,梁智城.SAS判別分析在商業(yè)銀行信用風(fēng)險(xiǎn)評(píng)估中的應(yīng)用[J].計(jì)算機(jī)安全.2011.

[4]薄純林,王宗軍.基于貝葉斯網(wǎng)絡(luò)的商業(yè)銀行操作風(fēng)險(xiǎn)管理[J].金融理論與實(shí)踐.2008.

[5]汪辦興.我國(guó)商業(yè)銀行信用風(fēng)險(xiǎn)模型的國(guó)際比較與改進(jìn).當(dāng)代經(jīng)濟(jì)科學(xué)[J].2007.

[6]Jiawei Han,Micheline Kamber.數(shù)據(jù)挖掘概念與技術(shù)[M].機(jī)械工業(yè)出版社.2008.

[7]General J.Financial analysis using Bayesian networks[J].Applied Sochastic Modelsin Bussiness and Industry.2001.17(1):57-67.

猜你喜歡
分類(lèi)模型
一半模型
分類(lèi)算一算
垃圾分類(lèi)的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
重要模型『一線(xiàn)三等角』
重尾非線(xiàn)性自回歸模型自加權(quán)M-估計(jì)的漸近分布
分類(lèi)討論求坐標(biāo)
數(shù)據(jù)分析中的分類(lèi)討論
教你一招:數(shù)的分類(lèi)
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
主站蜘蛛池模板: 毛片网站观看| 波多野结衣一区二区三区四区视频 | 国产欧美中文字幕| 黄色片中文字幕| 国产精品久久久久鬼色| 亚洲色欲色欲www网| 欧美在线一级片| 91口爆吞精国产对白第三集| 国产欧美日韩另类| 国产亚洲精品精品精品| 中文无码精品a∨在线观看| 成人毛片免费在线观看| 精品久久香蕉国产线看观看gif| 国产成本人片免费a∨短片| 波多野结衣视频网站| 99久久亚洲精品影院| 亚洲精品天堂在线观看| 亚洲无码日韩一区| 国产激爽大片在线播放| 色偷偷一区二区三区| 国产69囗曝护士吞精在线视频| 亚洲伊人电影| 久久国产精品国产自线拍| 国产00高中生在线播放| 国产精品短篇二区| 久久狠狠色噜噜狠狠狠狠97视色 | 精品五夜婷香蕉国产线看观看| 夜夜高潮夜夜爽国产伦精品| 国产在线自乱拍播放| 永久免费AⅤ无码网站在线观看| 99re视频在线| 久久久成年黄色视频| 青青久视频| 欧美高清国产| 国产香蕉在线视频| 色AV色 综合网站| 精品视频一区在线观看| 99尹人香蕉国产免费天天拍| 91成人在线免费视频| 婷婷中文在线| 亚洲视频色图| 毛片手机在线看| 国产久草视频| 欧美专区日韩专区| 视频一区亚洲| 精品综合久久久久久97超人| 99精品在线看| 久久精品国产精品国产一区| 婷婷99视频精品全部在线观看| 欧美人人干| 91综合色区亚洲熟妇p| 欧美成人精品一级在线观看| 国产精选小视频在线观看| 国产美女精品一区二区| 久久久久久久久18禁秘| 97视频在线观看免费视频| 熟妇丰满人妻av无码区| 亚洲日本www| www精品久久| 91久久国产综合精品女同我| 国产精品久久久久鬼色| 欧美a在线视频| 狠狠色狠狠综合久久| 国产91精品久久| 国产成a人片在线播放| 国产成人精品2021欧美日韩| 中文字幕乱码二三区免费| 福利国产在线| 欧美在线视频不卡第一页| 激情综合网激情综合| 久久动漫精品| 伊人蕉久影院| 日韩在线1| 久久精品女人天堂aaa| 亚洲欧美成aⅴ人在线观看 | 国产人人射| 亚洲不卡无码av中文字幕| 伊人查蕉在线观看国产精品| 在线播放精品一区二区啪视频| 伊人久久婷婷五月综合97色| 色综合热无码热国产| 精品天海翼一区二区|