999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于LIME的P2P借款人信用風險的可解釋性研究

2021-03-19 05:32:32陳為民趙艷秋
科技經濟導刊 2021年5期
關鍵詞:特征模型

陳為民,趙艷秋

(湖南科技大學商學院,湖南 湘潭 411100)

1.引言

機器學習常被應用于評估P2P領域內的借款人信用風險,信用風險評估(也稱貸款違約預測)是利用不同的特征解釋和預測借款人未按要求償還貸款的過程,最終目的是為了幫助投資人做出決策以及借款人的信用得到合理的評估。通過閱讀P2P信用風險評估領域的文獻,我們可以發現,越來越多的研究使用信用風險評估模型來評估違約風險,并不斷提出精確度更為優秀的評估模型,從傳統的統計模型,發展到如火如荼的機器學習模型,以及近年來備受推崇的組合模型,但可以發現除模型準確度之外,可解釋性也應被人們所重視。

雖然現有研究者們提出了一個又一個準確度極高的評估模型,但不排除最后得到的結果只是一堆“看上去”毫無意義的模型參數和高的準確度。而我們需要得到的不僅僅是準確的結果,我們也需要了解我們從數據或特征中學到了哪些知識,從而導致我們產生了最終的決策,這也是為什么在機器學習構建的模型準確率很高的情況下,統計模型依舊備受推崇的原因之一。如果一個模型完全不可解釋,那么在很多領域的應用就會因為沒辦法給出更多可靠的信息而受到限制。

本文的可能貢獻在于,基于真實的人人貸數據,在保證信用評估準確性的同時,利用LIME算法對借款人信用風險評估結果進行解釋,希望可以為P2P領域內的信貸決策助力。具體來說,人人貸數據常被用于P2P領域的信用風險研究,但是以往文獻的研究重點并非在可解釋性的研究;機器學習中的樹模型和邏輯回歸被用于信用風險的評估;而在模型的結果解釋方面,選用了LIME算法,該算法從局部解釋的角度出發,對某個特定觀測值的類別分類結果進行解釋,并說明某個變量對于預測結果的貢獻程度。

本文剩余部分結構為:第二部分是信用風險評估領域可解釋性相關的研究。通過對相關研究的梳理,為研究方法和模型的選擇提供了依據;第三部分是實證,包括對借款人信用風險的評估以及基于LIME算法的評估結果解釋;第五部分是結論。

2.P2P信用評估領域的可解釋性問題現狀

現有的P2P信用風險評估多用特征重要性評分或者模型系數大小對評估結果進行解釋,比如邏輯回歸模型的系數大小;決策樹模型、XGBoost以及性能更加優化的LightGBM模型,但這并滿足可解釋性的目標。

2.1 可解釋性的體現

指出模型的可解釋性可以從三方面來體現:全局和局部可解釋性、時間限制以及不同受眾的專業知識差異。具體到P2P信用風險評估領域,全局可解釋性是指解釋“黑箱”模型背后的整個邏輯,而局部可解釋性是指解釋預測結果的原因,即只需要解釋特定選擇的原因;在時間限制方面,和短的決策時間相比,決策者更需要復雜和詳盡的解釋;關于不同受眾的專業知識差異,對于信貸領域的研究者來講,他們會更加傾向于復雜的模型,而對于相關背景知識和經驗較少的投資者而言,透明度高的模型會更具有可解釋性。

2.2 局部可理解的與模型無關的解釋

Interpretable Model-agnostic Explanations(LIME)是通過一個可解釋的模型g在被解釋分類的數據點x處近似擬合模型進而解釋分類器f的預測一種算法,具體來說,為了做到與模型無關,LIME不會深入模型內部;為了搞清楚哪一部分輸入對預測結果產生貢獻,在被解釋數據點x周圍進行隨機擾動,觀察模型的預測行為,然后根據這些擾動的數據點z距離被解釋分類點x的距離分配權重,基于上述學習得到一個可解釋的模型和預測結果。

3.實證分析

3.1 數據來源及樣本選取

人人貸是目前我國P2P網貸行業影響力較大的網貸平臺之一,其在合法合規以及運營等方面都是P2P行業的典范,同時平臺也積累了大量真實有效的交易數據,因此,本文選取人人貸平臺的實際交易數據作為研究樣本。

3.2 建模

我們通過邏輯回歸模型以及以樹模型為代表的機器學習模型(決策樹以及LightGBM)對樣本進行建模,由表1可知集成樹模型LightGBM的表現要優于其余兩個模型。

表1 各模型精度比較Tab.1 Comparison of accuracy of each model

由表1可知集成模型LightGBM在四種評價指標中的表現都是最優的,故接下來我們將針對LightGBM模型的結果進行進一步解釋。

3.3 LightGBM的結果解釋

3.3.1 LightGBM的特征重要性

一般情況下LightGBM結果的可解釋性體現在該模型自帶的特征重要性,結果如下:

表2 LightGBM特征重要性結果Tab.2 Lightgbm feature importance results

3.3.2 基于LIME算法的結果討論

LIME在測試數據集中選擇特定樣本,以獲得每個類的概率值并對分配概率的原因進行說明。

圖1 Lime結果Fig.1 Lime results

圖1是樣本的預測結果,可以看出哪些特征決定樣本被分類到類別0(藍色),哪些特征決定樣本被分類到類別1(橙色),且具體列出樣本在這些特征的數值大小,具體來說,LightGBM中ProjectStatus和SuccessfulNum是影響借款人違約的重要因素。

4.結語

為了增加信用評估的可解釋性,本文首先選擇在建模前對相關變量進行數據探索性分析,找到可能會對借款人是否違約產生關鍵性作用的變量;接著選擇具備特征重要性評分的樹模型(決策樹和LightGBM)以及以模型系數指代特征重要性的邏輯回歸模型對數據進行建模,發現LightGBM的綜合表現最優;最后基于LIME算法對LightGBM模型的結果進行說明,得出結論:在結構化的因素中,除財務因素外,借款人之前的借款成功次數也會對借款人是否會違約產生關鍵性影響。

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學特征認識
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: a天堂视频| 亚洲综合色婷婷中文字幕| 五月天久久综合| 青青青视频91在线 | 亚洲男人天堂2020| 亚洲国产91人成在线| Jizz国产色系免费| 18禁黄无遮挡免费动漫网站| 亚洲天堂视频网站| 国产精品白浆无码流出在线看| 亚洲人成亚洲精品| 亚洲欧美一级一级a| 国产一区二区三区免费观看| 久久综合色播五月男人的天堂| 亚洲天堂精品视频| 欧美国产日韩在线| 制服丝袜一区| 国产真实二区一区在线亚洲| 丰满人妻被猛烈进入无码| 亚洲a级毛片| 伊人狠狠丁香婷婷综合色| 欧美日韩一区二区在线免费观看| 尤物精品视频一区二区三区| 亚洲欧洲天堂色AV| 91在线视频福利| 无码人妻免费| 中文字幕在线不卡视频| 日本精品视频| 国产成人综合网在线观看| 国产三级a| 丁香综合在线| 亚洲天堂777| 精品人妻AV区| 青青青国产在线播放| 九九九国产| 国产夜色视频| 久久精品亚洲专区| 久久99精品久久久久久不卡| 亚洲床戏一区| 欧美日本激情| 婷婷99视频精品全部在线观看| 亚洲va视频| 久久99国产乱子伦精品免| 97在线观看视频免费| 国产激情无码一区二区APP | Jizz国产色系免费| 亚洲中文字幕97久久精品少妇| 日本午夜精品一本在线观看| 亚洲天堂伊人| 亚洲无码电影| 国产精彩视频在线观看| 99爱视频精品免视看| 国产精品思思热在线| 成人综合久久综合| 色综合成人| 国产大片喷水在线在线视频| 日韩一区精品视频一区二区| 99伊人精品| 免费在线观看av| 国产福利一区视频| 九九热精品免费视频| 第九色区aⅴ天堂久久香| 国产在线视频福利资源站| 日本不卡视频在线| 无码一区中文字幕| 欧美日韩午夜| 色吊丝av中文字幕| 中文字幕无码中文字幕有码在线| 在线视频一区二区三区不卡| 欧美一区精品| 日韩二区三区无| 成人久久精品一区二区三区| 亚洲黄网在线| 久久精品亚洲热综合一区二区| 欧洲欧美人成免费全部视频| 国产女人综合久久精品视| 亚洲日韩精品伊甸| 久久久久亚洲av成人网人人软件| 亚洲第一av网站| 久久一级电影| 亚洲免费成人网| 国产在线97|