張潔琳
?
試論貝葉斯網(wǎng)絡(luò)在用戶信用評估中的應(yīng)用
張潔琳
(中年民族大學(xué)計算機科學(xué)學(xué)院,湖北 武漢 430070)
近年來隨著我國經(jīng)濟的不斷進(jìn)步與發(fā)展,越來越多的人開始使用信用消費,住房貸款、購車貸款等等一系列個人消費貸款行為都需要由個人信用當(dāng)擔(dān)保。當(dāng)前我國已經(jīng)將個人信用制度列入到國家信用體系當(dāng)中,為個人信用消費打造了良好的平臺。當(dāng)前個人信用評估是個人信用制度的重要組成部分,實際應(yīng)用過程中最主要的目的就是對有可能出現(xiàn)的信用風(fēng)險進(jìn)行定性方面的分析,同時進(jìn)行科學(xué)嚴(yán)謹(jǐn)?shù)挠嬎悖瑢⑾M者的違約概率計算出來,為授信方的決策提供相應(yīng)的依據(jù)。基于概率估計的貝葉斯以及相應(yīng)的貝葉斯網(wǎng)絡(luò)分析模型在實際工作的過程中有著其他數(shù)據(jù)挖掘工具所不具備的優(yōu)勢。通過對貝葉斯網(wǎng)絡(luò)進(jìn)行分析,以最小風(fēng)險決策準(zhǔn)則作為基本原則,在對用戶進(jìn)行信用評估時建立了一種全新的用戶信用評估模型。在對數(shù)據(jù)進(jìn)行采集的過程中,通過交叉驗證的方式對數(shù)據(jù)進(jìn)行了驗證,最終檢測結(jié)果表明,在對用戶進(jìn)行信用評估的過程中基于最小風(fēng)險準(zhǔn)則的貝葉斯以及貝葉斯網(wǎng)絡(luò)分類模式可以有效的降低信用評估的風(fēng)險。
數(shù)據(jù)挖掘;貝葉斯網(wǎng)絡(luò);用戶信用評估;分析;研究
在貝葉斯公式的實際應(yīng)用過程中,為了不斷提高樸素貝葉斯分類其實際的工作性能,相應(yīng)的科學(xué)技術(shù)人員不斷提出相應(yīng)的技術(shù)與方法。在實際研究過程中有人提出了具有樹狀結(jié)構(gòu)的分類器,這類結(jié)構(gòu)使得樸素貝葉斯中的獨立假設(shè)性條件進(jìn)行了有效的拓展,將整個樸素貝葉斯結(jié)構(gòu)進(jìn)行了顯著的擴展,可以讓每個屬性結(jié)點可以依賴一個非類節(jié)點。此結(jié)構(gòu)具備良好的綜合性能,可以在學(xué)習(xí)效率與非類精度之間進(jìn)行合理的調(diào)節(jié)。但是此種算法在實際應(yīng)用的過程中首先需要構(gòu)造一個以條件信息為權(quán)的完全無向圖,然后構(gòu)造最大權(quán)最終生成一種樹狀結(jié)構(gòu),得到一個TAN模型。通過實驗對此類算法進(jìn)行驗證,在實際應(yīng)用過程中若是選取的根節(jié)點不同最終分類性能會存在著極大的差別。因此,此類模型結(jié)構(gòu)方法在實際應(yīng)用過程中不能很好的反映各個屬性之間的依賴關(guān)系。相應(yīng)的科學(xué)技術(shù)人員在研究過程中通過依賴關(guān)系設(shè)定相應(yīng)的方向,并且還將有向樹算法引入到TAN分類器的構(gòu)造當(dāng)中,最終研究出一種新的TAN模型構(gòu)造方法法。
在實際進(jìn)行個人信用評估工作時,不僅需要對消費者信貸的分類最大限度的作出正確的判斷,還需要明確若是判斷失誤會帶來什么樣的后果。若是在對用戶進(jìn)行信用評估時把信用良好的用戶誤判為信用差的用戶,這種判斷失誤最多是讓銀行失去一個客戶,可若是將信用不好的用戶錯誤的判斷為信用良好的用戶,造成銀行的錯誤授信,進(jìn)而給銀行帶來一定的的損失,我們通過分析可以了解到顯然后者出現(xiàn)失誤時對銀行的損失更大[1]。
由于信用評估這項工作十分復(fù)雜,并且實際的應(yīng)用性十分高,因此當(dāng)前在對個人信用進(jìn)行評估時逐漸開始采用貝葉斯網(wǎng)絡(luò)對用戶信用進(jìn)行評估,此種技術(shù)的應(yīng)用極大程度的降低了在信用評估過程中出現(xiàn)錯誤的概率。在實際進(jìn)行分類分類決策的過程中,盡可能的降低出現(xiàn)錯誤的概率是十分必要的。但是在實際應(yīng)用過程中還有比錯誤概率更加廣泛的概念,那就是風(fēng)險。在銀行對用戶進(jìn)行信用評估時,可以將用戶“違約”類的樣本錯誤的定義為“不違約”給銀行帶來的直接損失與“不違約”類樣本錯度的定義為“違約”樣本存在著很大的差別。因此當(dāng)前以樸素貝葉斯分類模型以及貝葉斯網(wǎng)絡(luò)分類模型為基礎(chǔ),引入了最小決策風(fēng)險分類準(zhǔn)則,并且在實際的應(yīng)用過程中對相應(yīng)的數(shù)據(jù)集進(jìn)行了科學(xué)合理的測試。在當(dāng)前對用戶進(jìn)行信用評估的過程中將決策風(fēng)險分類準(zhǔn)則進(jìn)行合理的應(yīng)用之后,TAN結(jié)果算法實際應(yīng)用性能最好。
想要在實際應(yīng)用過程中不斷降低出現(xiàn)錯誤判定的概率,需要在實際應(yīng)用過程中對于損失函數(shù)進(jìn)行充分的考量。損失函數(shù)可以將每個具體的算法步驟進(jìn)行充分的考量,并且將概率轉(zhuǎn)換為一種判定手段。在實際應(yīng)用過程中由一定的數(shù)集表示可能采取的行為集,相應(yīng)的損失函數(shù)可以用來描述某一特定行為出現(xiàn)風(fēng)險的幾率。通過決策理論當(dāng)中術(shù)語對其進(jìn)行表述,一個預(yù)期到的損失情況可以可以當(dāng)做一種風(fēng)險,可以將其稱為條件風(fēng)險。在設(shè)定公式的過程中x為隨機向量的觀察值,在面對不同的觀察值時采用不同的決策替代值[2]。
在實際應(yīng)用過程中,降低的實際應(yīng)用過程中的錯誤率,其實正是貝葉斯網(wǎng)絡(luò)的實際應(yīng)用核心目標(biāo)。但在貝葉斯網(wǎng)絡(luò)的理論基礎(chǔ)建設(shè)過程中,其主要考慮的不單單是錯誤率的高與低,更為重要的是,考慮比錯誤率更為廣泛的一個概念體系風(fēng)險。尤其是將貝葉斯網(wǎng)絡(luò)理論基礎(chǔ)以及實踐應(yīng)用技能應(yīng)用到個人的信用評估過程中,在對消費者貸款進(jìn)行分類時不僅要盡可能地對消費者自身信用評估作出正確判斷,還要考慮到當(dāng)作出錯誤判斷后如何進(jìn)行解決。同樣還要考慮到做出錯誤判斷后所產(chǎn)生的后果,以及機構(gòu)所要承擔(dān)的額外風(fēng)險。簡單舉個例子,如果將信用好的人評定為信用差的人。那么會對結(jié)果造成一定量的損失,但是后果是可以進(jìn)行后期處理,甚至是能夠減輕風(fēng)險歸零,但如果將信用差的人評定為信用好的人,那么所產(chǎn)生的后果以及危害將會大大影響到評定機構(gòu)自身的效益。同樣是錯誤,卻會產(chǎn)生不同的影響結(jié)果。貝葉斯網(wǎng)絡(luò)在進(jìn)行使用過程中,不單單是屬于對個人信用評定的一種方式與技能,更為重要的是在評定信用過程中避免風(fēng)險的產(chǎn)生。要想使誤判函數(shù)得到有效控制,就要考慮該種運算模式。在運算過程中對系統(tǒng)參數(shù)的把控[3]。
從個人信用體系以及評估體系建立以來,我國的信用評估機構(gòu)以及信用評估系統(tǒng)一直都依據(jù)著五 大選擇原則對個人的信用進(jìn)行綜合評估。第一,個人品質(zhì),品質(zhì)原則在信用評估過程中,其主要表現(xiàn)為借貸人按期還款以及自身誠實守信的程度,或者是按照借款時所簽定合同歸屬內(nèi)容之內(nèi),準(zhǔn)時還清貸款的意向。而該種的評估原則也是個人信用體系在進(jìn)行評估過程中最重要的一項評估原則,對消費者主要從三方面來進(jìn)行其個人品質(zhì)的鑒定,穩(wěn)定性,信貸歷史,職業(yè)以及個人聲望。第二,選擇原則就是對消費者的個人能力進(jìn)行評估,在對個人信用評估過程中,一定要考慮到消費者自身是否擁有能夠還清貸款的能力,或者其自身能否進(jìn)行管理更為龐大的貸款業(yè)務(wù),在進(jìn)行考察過程中這些都是消費者自身的業(yè)務(wù)能力所體現(xiàn)出來的。第三,評估原則就是對消費者自身的資本進(jìn)行詳細(xì)審核,消費者自身的資本能夠很好的體現(xiàn)出消費者是否具有良好的貸款能力以及還款能力,通過對消費者的資本進(jìn)行審核與鑒定,可以更好地展現(xiàn)出消費者自身的綜合信用水平,不僅能夠通過消費者自身的資本總價值進(jìn)行衡量,同時也能夠通過對資本總價值的衡量,展現(xiàn)出消費者自身的能力是否足夠支撐消費者自身的信貸業(yè)務(wù)的。在我國,像吳京的個人資本審核過程中,其中有一個問題是針對個人資本現(xiàn)金情況進(jìn)行詳細(xì)設(shè)定的,這個問題就是當(dāng)借貸人以及消費者自身由于某些原因?qū)е伦陨淼氖杖氘a(chǎn)生大幅度變化,借貸人自身是否還擁有其他手段來償還相應(yīng)貸款,而在此次個人信用評估過程中對資本評估最主要的體現(xiàn),就是在個人的財務(wù)報表上。第四,原則擔(dān)保品,在進(jìn)行對個人信用評估過程中一定要考慮到個人的總體資本是否符合信貸標(biāo)準(zhǔn),而擔(dān)保品也屬于個人所有資產(chǎn)的一種[4]。對個人擔(dān)保品審核過程中,審核內(nèi)容主要有擔(dān)保品種類,擔(dān)保品自身還有價值,自身價值的上升空間,擔(dān)保品的市場效益。第五個原則也就是個人條件,個人條件在個人信用評估過程中,其主要指的就是外在環(huán)境以及在外的因素對個人償還貸款能力的影響條件。以上提到的五種原則其組成部分不僅有發(fā)散性屬性指標(biāo)同時也包括離散型屬性指標(biāo),而在貝葉斯網(wǎng)絡(luò)用戶信用評估模型的建立過程中,一定要考慮到上述五個選擇原則對模型的影響,在對模擬對象選擇過程中也一定要根據(jù)上述五個原則來進(jìn)行篩選[5]。
模型構(gòu)造以及建設(shè)過程中一定要考慮兩方面,第一,確定網(wǎng)絡(luò)的結(jié)構(gòu),第4學(xué)習(xí)屬性變量條件概率分布以及確定類先驗概率。
首先,在該種方法的模型建設(shè)過程中,一定要選取兩類不同樣本,簡稱兩類人。同時,兩類人的總體人數(shù)比例要達(dá)到一比一持平的效果,然后對這兩類人的整體生活評估整體信用評估以及對個人的整個消費情況進(jìn)行仔細(xì)的掌握與了解,在進(jìn)行分散性分裂過程中,要采取樹狀圖形式將兩類人進(jìn)行區(qū)別分類,根據(jù)該種網(wǎng)絡(luò)模型的運算方法,將每個人的信貸情況以及信貸變化參數(shù)設(shè)為未知量x,然后將其運用到建立系統(tǒng)的運算算法當(dāng)中,通過信貸變化參數(shù)不同來計算出兩類人,其自身的信貸服務(wù)區(qū)間,然后根據(jù)服務(wù)區(qū)的范圍不同,將兩類人分別進(jìn)行仔細(xì)規(guī)劃與分類,通過數(shù)據(jù)對比可以更好的觀察出兩類人之間所存在的信貸使用情況的變化范圍。通過特殊算法與計算,可以將這類人的整體評估風(fēng)險進(jìn)行數(shù)據(jù)顯示,通過該算法可以更好地將人們的評估信用。通過數(shù)字范圍變化區(qū)間的方式展現(xiàn)到,自身的資本評估上,可以幫助評估機構(gòu)更好地了解于掌握借貸人的自身整體信息,也可以更好地有效控制錯誤率[6]。
在進(jìn)行模型建立之后,可以開展相應(yīng)的仿真實驗,進(jìn)而采用不同的信用評估借貸方法,可以讓人們真正的了解到自身的信用效果,同時也可以在開展過程中使評估機構(gòu)選擇更好的評估方法來真正和對人們的自身信貸信息,而同樣通過此次的方面實驗,大大展現(xiàn)出貝葉斯網(wǎng)絡(luò)在用戶信用評估中擁有更好的應(yīng)用市場與應(yīng)用前景,能夠更加準(zhǔn)確的分析出用戶自身的綜合信用,保證系統(tǒng)在進(jìn)行信用評估以及信用分類,使更加準(zhǔn)確減少失誤率[7]。貝葉斯網(wǎng)絡(luò)必須通過相應(yīng)的模型建立,然后經(jīng)過后期的仿真實驗才能夠真正體現(xiàn)出該種運算方法以及信用評估方法,可以真正將人們的自身信用信息進(jìn)行綜合總結(jié),更好地展現(xiàn)出人們的信貸結(jié)果,幫助我國相應(yīng)的信貸機構(gòu)以及銀行更好的控制人們的銀行信貸情況,在我國傳統(tǒng)的信用評估過程中說采取的方法在很大程度上不能夠準(zhǔn)確地將人們自身信貸結(jié)果進(jìn)行仔細(xì)分類與劃分,大大影響相應(yīng)工作機構(gòu)的工作開展[8]。比如傳統(tǒng)的銀行再進(jìn)行消費者信貸評估過程中對消費者自身的信用情況評估的并不是十分準(zhǔn)確,導(dǎo)致很多負(fù)債累累的消費者依然可以通過銀行進(jìn)行貸款,對銀行自身的效益產(chǎn)生不良影響。而將貝葉斯網(wǎng)絡(luò)計算方法應(yīng)用到人們的信用評估過程中可以更好更精確的對人們的信用情況進(jìn)行仔細(xì)評估,保證人們通過貝葉斯網(wǎng)絡(luò)評估方法評估之后,可以更好的將自身的信用情況反應(yīng)給銀行,保證銀行自身工作的工作效率,減少銀行等其他機構(gòu)的工作失誤,維護社會信用體系正常發(fā)展[9-10]。
貝葉斯網(wǎng)絡(luò)在用戶信用評估中的應(yīng)用,不僅提高了用戶信用評估的準(zhǔn)確度同時也大大提高了銀行以及等其他評估機構(gòu)的自身工作效率,促進(jìn)我國社會信用制度的穩(wěn)定發(fā)展,保證了我國的人們信用評估機制得到有序的發(fā)展以及更好地完善,希望通過本文的仔細(xì)論述,可以起到拋磚引玉的作用,為我國的相應(yīng)工作開展提供更好的幫助,同時也提高銀行等其他機構(gòu)對人們借貸情況或者是信用評定情況工作的精準(zhǔn)度,保證我國金融行業(yè)以及信貸行業(yè)的穩(wěn)定發(fā)展,使各行各業(yè)的發(fā)現(xiàn)能夠有一個穩(wěn)定性較高的金融后盾。
[1] 楊立洪, 葉成達(dá). 貝葉斯網(wǎng)絡(luò)在用戶信用評估中的應(yīng)用研究[J]. 軟件導(dǎo)刊, 2018, 17(06): 146-149.
[2] 陸靜, 王捷. 基于貝葉斯網(wǎng)絡(luò)的商業(yè)銀行全面風(fēng)險預(yù)警系統(tǒng)[J]. 系統(tǒng)工程理論與實踐, 2012, 32(02): 225-235.
[3] 王占孔, 王學(xué)麗. 基于貝葉斯網(wǎng)絡(luò)的分層網(wǎng)絡(luò)故障診斷[J]. 軟件, 2011, 32(04): 87-90.
[4] 裘江南, 劉麗麗, 董磊磊. 基于貝葉斯網(wǎng)絡(luò)的突發(fā)事件鏈建模方法與應(yīng)用[J]. 系統(tǒng)工程學(xué)報, 2012, 27(06): 739-750.
[5] 余文輝, 王沾, 曾祥君, 等. 基于貝葉斯網(wǎng)絡(luò)的多狀態(tài)變壓器可靠性跟蹤分析[J]. 電力系統(tǒng)保護與控制, 2015, 43(06): 78-85.
[6] 陳驥群, 趙書強, 馬燕峰, 等. 貝葉斯網(wǎng)絡(luò)法與盲數(shù)相結(jié)合的配電網(wǎng)可靠性評估[J]. 電力自動化設(shè)備, 2015, 35(06): 112-116.
[7] 胡明禮, 張彩芬, 朱建軍. 基于貝葉斯網(wǎng)絡(luò)推理的雙重不確定信息集結(jié)模型[J]. 中國管理科學(xué), 2014, 22(02): 135- 141.
[8] 李旭升. 貝葉斯網(wǎng)絡(luò)分類模型研究及其在信用評估中的應(yīng)用[D]. 西南交通大學(xué), 2007.
[9] 閆瑞姣. 基于社交網(wǎng)絡(luò)的信用評估模型的研究與實現(xiàn)[D]. 中北大學(xué), 2017.
[10] 何莉娟. 電子商務(wù)環(huán)境下的我國中小企業(yè)信用評估體系構(gòu)建[D]. 西南財經(jīng)大學(xué), 2012.
Discussion on Application of Bayesian Network in User Credit Evaluation
ZHANG Jie-lin
(Computer Science School, Middle-aged University for Nationalities, Wuhan, Hubei 430070)
In recent years, with continuous progress and development of China's economy, more and more people begin to use credit consumption, a series of personal consumption loans,including and housing loans, car loans, need to be guaranteed by personal credit. At present, personal credit system has been included in the national credit system in our country, which has created a good platform for personal credit consumption. Personal credit evaluation is an important part of personal credit system, with main purpose of qualitative analysis of possible credit risks in practical application, and providing corresponding basis for decision-making of the creditor based on default probability of consumers through rigorous scientific calculation. Bayesian network analysis model based on probability estimation has advantages that other mapreduce tools can not compete in actual work process. Based on Bayesian network analysis and principle criterion of minimum risk decision, the article establishes a new user credit evaluation model when evaluating users'credit. During data collection process, result of data verification through cross-validation shows, Bayesian and Bayesian network classification model based on minimum risk criterion can reduce credit evaluation risks in credit evaluation process of users effectively.
Mapreduce; Bayesian network; User credit evaluation; Analysis; Research
P413
A
10.3969/j.issn.1003-6970.2018.12.044
張潔琳(1992-),女,研究生,研究方向:數(shù)據(jù)挖掘。
張潔琳. 試論貝葉斯網(wǎng)絡(luò)在用戶信用評估中的應(yīng)用[J]. 軟件,2018,39(12):194-197