999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Logistic模型的網貸違約風險預測研究

2021-03-15 06:43:56王飛祥吳禮好
中國管理信息化 2021年5期

王飛祥 吳禮好

[摘? ? 要] 隨著網絡在人們生活中的普及使用,傳統的借貸模式也跟著發生了改變,傳統借貸模式逐漸被網絡借貸模式所替代。如今,網絡借貸違約現象極大地制約了網絡借貸的健康發展。為減少網絡借貸平臺違約率,現對某一P2P網貸平臺的貸款數據進行分析,結合網貸借款人的基礎信息和借款信息的18個特征變量,建立邏輯回歸違約風險評估模型,并通過混淆矩陣以及ROC曲線檢驗結果表明,模型具有較高的精度,可以有效預測借款人的違約風險。

[關鍵詞] 網絡借貸;Logistic模型;違約風險

0? ? ? 引? ? 言

隨著我國經濟快速發展,越來越多的人接觸到網絡借貸,而如何從廣大用戶中有效識別出優質客戶,降低客戶的違約率對網絡借貸平臺來說,對其穩健發展至關重要。據網貸之家數據顯示近三年來網絡借貸平臺正常運營平臺數量持續降低,究其原因,借款人的違約不乏為其中一個重要影響因素。因此,能夠精準甄別網貸風險、降低借款人違約率顯得十分必要。

蘇亞,成春林(2017)認為在對網貸借款人違約行為的影響分析中應多維綜合考慮借款人的“軟信息”和“硬信息”。[1]丁嵐,駱品亮(2017)提出Stacking集成策略來降低預測模型中的一、二類錯誤從而達到提升借款人違約風險預測的準確度。[2]熊正德,劉臻煊,熊一鵬(2017)通過將“違約”與“不違約”兩類細分為“提前結清”“當前正常”“可疑”“損失”四類,構造有序多分類logistic模型,得出“當前正常”和“可疑”兩類客戶的預測效果相對準確率更高。[3]沈玉溪,徐浩(2018)運用Lending Club2017年第一季度的交易數據通過決策樹模型對借款人的違約風險特征的重要性進行分析。[4]譚中明,謝坤,彭耀鵬(2018)利用Logistic回歸方程式的方法篩選變量建立梯度提升決策樹模型來對借款人的信用風險進行評測,檢驗的結果表明GBDT模型的預測效果更好,但在特征變量的篩選中借款人收入多少與有無房貸等重要特征并不顯著。[5]舒方媛,趙公民,武勇杰(2019)建立Logistic二分類模型分析了網貸借款人的違約因素,得出信用評級、逾期次數等因素更為顯著。[6]黃建瓊郭文龍陳曉峰(2020)的研究結果表明,相對于決策樹和隨機森林模型,采用五只交叉驗證的支持向量機模型具有更好的穩定性與泛化能力。[7]以上學者對網絡貸款風險研究多基于單向影響因素探究,往往易忽略現實中多方面因素的影響,因此本文綜合借款人的基礎信息與借款信息的18個特征變量,運用統計分析結合實證分析方法將借款人是否違約作為目標變量,建立Logistic二分類模型,并通過混淆矩陣和ROC檢驗來檢驗模型的精度,得出模型具有較高的精度能夠有效預測借款人違約風險,對網絡借款人的風險評估具有參考作用。

1? ? ? Logistic模型

(2)混淆矩陣,它的本質可以理解為就是一張表格,以真陽性(TP)、真陰性(TN)和假陽性(FP)、假陰性(FN)四個基礎指標組成的表格。如在分類模型中我們需要預測是否違約具有“不違約”(negative)和“違約”(positive)兩類結果,而這四個基本指標分別表示:

①真陽性:樣本類別為positive,模型預測的結果是positive;

②真陰性:樣本類別為negative,模型預測的結果是negative;

③假陽性:樣本類別為negative,而模型預測的結果是positive;

④假陰性:樣本類別為positive,而模型預測的結果是negative。

四個基礎指標所組成的混淆矩陣如表1所示。

對于分類模型的評價,在混淆矩陣中,TP與TN的觀測值越大越好,而FP與FN的觀測值越小越好,這樣就表示模型預測的越準確。

在混淆矩陣的基礎上延伸出精確率(Precision)和召回率(Recall)和F1分數,其對應意義如表2所示。

2? ? ? 實證分析

2.1? ?特征變量的選取

數據來源為某P2P借貸平臺歷史借款數據,樣本量為5 000,文中數據處理與分析皆使用Python來實現。主要使用了Python中的Numpy、Pandas、Matplotlib、Seaborn處理數據、作圖以及機器學習庫。

通過Python的Describe函數以及Info函數顯示,樣本包含了3列時間類型(datetime)數據、12列浮點型(float)數據、15列數值型(int)數據以及23列文本類型(object)數據。首先依據直觀判斷去除與本文研究無關的數據和無效的數據,選取需要的特征變量;其次對數據進行初步預處理。缺失值與異常值處理中Isnull函數能夠查找到數據中的缺失值,對于缺失值,一般根據變量特征類型需要采取中位數、眾數或者平均數等來替代。變量特征數據缺失嚴重的則選擇直接刪除這一樣本。數據中的有些特征變量為文本型類型如性別,為了更好地識別與建模,需要對它們做One-Hot編碼處理。對于具有連續性的特征變量,需要做標簽編碼處理。

數據預處理效果如表3所示分別為性別、年齡、受教育程度、婚姻狀態、月收入、工作年限、所在單位規模、有無房產、有無房貸、有無車產、有無車貸等11個貸款人基礎信息特征變量和借款利率、借款期限、信用分數、信用等級、逾期次數、申請貸款筆數7個貸款人的借款信息特征變量,以及是否違約作為目標變量。

2.2? ?描述性分析

樣本中借款人年齡分布主要集中在30歲到40多歲之間,其中借款人年齡最小的為22歲,最大的為64歲,借款人年齡分布線圖如圖1。

樣本數據中借款人借款違約率跟年齡與性別分布如圖2所示,從其柱形圖和折線圖可以看出,借款人貸款違約樣本主要集中在30歲到40歲之間,其次是20歲至30歲的年齡段,違約率將近于48%,50歲到60歲之間年齡段中的貸款違約率相對最少,只占其中的25%;而相對于女性來說男性貸款的違約率則遠遠高于女性借款人。這一結果表明位于30到40歲之間的借款人的貸款需求高于其他年齡段的借款人,同樣,處于這一年齡段的借款人的違約率也高于其他年齡段的借款人,借款平臺在放款時需加強對這一年齡段的借款人的資格審查,嚴格管控這一年齡段的借款人的違約行為。

網絡借貸違約風險與借款人所受教育程度的關系如圖3所示,隨著學歷的升高,借款人的違約概率逐漸降低。根據樣本數據顯示,借款人所受教育程度在高中或高中以下學歷,其違約的概率明顯高于學歷更高的借款人,說明學歷越高其還款意識或者還款能力越強,能夠及時履行作為借款人的義務如期還款,而學歷低的借款人更容易違約。

2.3? ?實證結果及分析

將預處理好的樣本數據進行切分,隨機種子train_size設為0.8,即樣本數據的80%作為訓練集,20%作為測試集,其中特征變量為處理后的借款人基本信息和借款信息,目標變量y為借款人的違約狀態。將數據輸入得到違約風險預測的準確率為98.68%,說明所建立的違約風險模型效果較好。將模型特征變量按重要性排序,如圖4所示,顯然,在所有特征變量中屬于借款人基礎信息特征的貢獻度小于借款人的借款信息即信用信息特征。貢獻度最大的特征變量是違約次數,違約次數這一特征屬于連續性變量,隨著次數的增大其借款人的違約風險越大,說明借款人因某一原因在規定的時間內未能如期還款或者沒有能力償還借款而違約,那么其后續產生違約的可能性更大,而違約次數為零的借款人其產生違約的可能性很小;其次,違約風險模型中貢獻度影響僅次于違約次數這一特征變量的是借款人的借款利率,借款人的借款利率越高,其違約風險越大。在基礎信息特征中對違約風險模型影響最大的特征為收入,借款人是否違約受借款收入的影響,顯然收入越高越具有還款能力。

違約風險預測模型的混淆矩陣和ROC曲線分別如圖5、圖6所示,通過計算得出模型的精確率、召回率和F1分數分別為98.32%、97.86%和98.09%,模型具有較高的準確性,訓練集、測試集中AUC值分別為0.998 5、0.998 0,AUC值越接近1,說明模型的精度越高。

3? ? ? 結? ? 論

本文運用統計性分析方法分析了網絡借貸平臺網貸借款人的違約特征,結合借款人的基礎信息與借款信息的18個特征變量,將是否違約作為目標變量,建立Logistic二分類模型,通過混淆矩陣、F1得分以及ROC曲線檢驗,所建立的違約風險預測模型能夠有效預測網貸借款人的違約風險,有助于網絡借貸平臺對網貸借款人進行貸前的風險評估,從而促進網絡借貸的綠色健康發展。

主要參考文獻

[1]蘇亞,成春林.P2P網貸借款人違約行為影響因素的實證研究[J].金融發展研究, 2017(1):70-76.

[2]丁嵐,駱品亮.基于Stacking集成策略的P2P網貸違約風險預警研究[J].投資研究, 2017,36(4):41-54.

[3]熊正德,劉臻煊,熊一鵬.基于有序logistic模型的互聯網金融客戶違約風險研究[J].系統工程, 2017,35(8):29-38.

[4]沈玉溪,徐浩.P2P網貸借款人違約風險評估——基于決策樹的研究[J].經營與管理, 2018(9):13-15.

[5]譚中明,謝坤,彭耀鵬.基于梯度提升決策樹模型的P2P網貸借款人信用風險評測研究[J].軟科學, 2018,32(12):136-140.

[6]舒方媛,趙公民,武勇杰.P2P網貸借款人違約風險影響因素研究——基于Logistic模型的實證分析[J].湖北農業科學,2019,58(4):103-107,119.

[7]黃建瓊,郭文龍,陳曉峰.基于支持向量機的網貸借款人違約風險評估[J].科技和產業, 2020,20(4):40-44.

主站蜘蛛池模板: 亚洲精品桃花岛av在线| 国产精品漂亮美女在线观看| 成人福利视频网| 亚洲国产精品一区二区第一页免 | 国产粉嫩粉嫩的18在线播放91| 91精品国产丝袜| 国产成人亚洲精品色欲AV| 亚洲精品777| 国产精品久久精品| 欧美日韩国产系列在线观看| 久久窝窝国产精品午夜看片| 久久中文电影| 亚洲日韩第九十九页| 亚洲毛片网站| 色亚洲激情综合精品无码视频 | 亚洲精品自在线拍| 国产91视频免费观看| 毛片在线区| 成人午夜网址| 国产精品视频导航| 国产一级二级在线观看| 久久婷婷五月综合97色| 蜜臀AVWWW国产天堂| 国产粉嫩粉嫩的18在线播放91| 国产导航在线| 中文字幕欧美日韩高清| 亚洲丝袜中文字幕| 国产成人精品一区二区| 亚洲第一视频网| 亚洲色偷偷偷鲁综合| 又黄又爽视频好爽视频| 波多野结衣一区二区三区88| 青青操视频在线| 四虎AV麻豆| 亚洲人成网站色7799在线播放| 日韩无码真实干出血视频| 欧美精品成人一区二区视频一| 在线国产资源| AV无码无在线观看免费| 久久国产黑丝袜视频| 色婷婷丁香| 免费啪啪网址| 天天综合网色| 亚洲一区第一页| 久久久久久尹人网香蕉| 91麻豆精品视频| 国产农村1级毛片| 四虎永久免费网站| 久久精品人人做人人综合试看| 日韩a级片视频| 亚洲福利片无码最新在线播放| www欧美在线观看| 欧美日韩专区| 亚洲无码视频喷水| 日韩成人午夜| 久久99久久无码毛片一区二区| 精品国产91爱| 无码网站免费观看| 91久久夜色精品国产网站| 玖玖免费视频在线观看| 欧美日韩国产在线播放| 精品综合久久久久久97| 亚洲乱码视频| 亚洲成A人V欧美综合| 99re在线免费视频| 永久毛片在线播| 中文字幕va| 91福利国产成人精品导航| 久久91精品牛牛| 日本不卡在线播放| 国产免费a级片| 高h视频在线| 国产欧美网站| 免费又爽又刺激高潮网址 | 成人综合网址| 丁香五月婷婷激情基地| 日韩在线永久免费播放| 18禁高潮出水呻吟娇喘蜜芽| 在线观看网站国产| 国产精选自拍| 国产成人精品三级| 91久久精品国产|