[摘 要]本文以銀行信用風(fēng)險(xiǎn)管理為例,將粗糙集和決策樹兩種具有互補(bǔ)優(yōu)勢的數(shù)據(jù)挖掘方法相結(jié)合,對客戶信用做出歸類分析判斷,最后利用決策樹生成決策規(guī)則。實(shí)踐證明,這種方法忠于原始數(shù)據(jù),提高了分類準(zhǔn)確度,減小了決策樹規(guī)模,具有良好的性能。
[關(guān)鍵詞]粗糙集;決策樹法;銀行信用風(fēng)險(xiǎn)
doi:10.3969/j.issn.1673-0194.2009.15.033
[中圖分類號]F830.51[文獻(xiàn)標(biāo)識碼]A[文章編號]1673-0194(2009)15-0108-04
1 引 言
近來,由美國引發(fā)的信貸危機(jī)表明,世界銀行業(yè)對信用風(fēng)險(xiǎn)管理環(huán)節(jié)還缺乏較為有效的測量和評估手段。面對海量銀行客戶數(shù)據(jù),如何從中發(fā)現(xiàn)有價(jià)值的信息或知識,成為一項(xiàng)重要的任務(wù)。數(shù)據(jù)挖掘作為一種潛在的、功能強(qiáng)大的新技術(shù),能夠幫助銀行在大量的、隱含的、事先未知的數(shù)據(jù)中找到重要的和有價(jià)值的信息,使銀行信貸活動(dòng)具有前瞻性,有助于銀行做出基于客戶信息的決策。
被廣泛應(yīng)用于信用風(fēng)險(xiǎn)研究的模型主要有數(shù)值統(tǒng)計(jì)模型和人工智能模型兩類[1] 。傳統(tǒng)的統(tǒng)計(jì)模型有多元判別分析、logistic回歸分析等。20世紀(jì)80年代以來,人工智能得到了大力的發(fā)展,專家系統(tǒng)、神經(jīng)網(wǎng)絡(luò)、SVM等人工智能技術(shù)被引入信用風(fēng)險(xiǎn)評估中,克服了統(tǒng)計(jì)方法對假設(shè)要求嚴(yán)格的缺點(diǎn)。但是這些新方法又各有不足,神經(jīng)網(wǎng)絡(luò)法的網(wǎng)絡(luò)結(jié)構(gòu)難以確定,訓(xùn)練時(shí)容易陷入局部極值,訓(xùn)練效率不高;SVM要求在機(jī)器學(xué)習(xí)過程中正反兩類樣本數(shù)據(jù)的數(shù)量盡量接近,這和信用風(fēng)險(xiǎn)的實(shí)際情況不相符,會有一定的主觀性和局限性。針對這些缺點(diǎn),本文提出使用數(shù)據(jù)挖掘中最為成熟并被廣泛使用的決策樹理論算法建立模型,使用粗糙集對數(shù)據(jù)進(jìn)行預(yù)處理,經(jīng)過實(shí)證分析,取得了較好的效果。……