999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于SVM-Logistic組合模型的P2P借款者信用風險評估
——以微貸網為例

2018-12-07 02:54:50都紅雯盧孝偉
生產力研究 2018年10期
關鍵詞:模型

都紅雯,盧孝偉

(杭州電子科技大學 經濟學院,浙江 杭州 310018)

一、引言

隨著經濟和網絡的不斷發展,互聯網與傳統金融業相結合,互聯網金融成為全新的熱門話題,作為互聯網金融典型代表之一的P2P網貸平臺,2005年起源于英國,隨后迅速在歐洲、美國、亞洲等地發展,唐寧引進了我國的第一家網貸平臺-宜信。在之后十多年的時間,P2P網貸平臺在我國開啟了爆發式的增長,速度相當驚人,2015年12月18日,宜人貸在紐交所正式上市,這也標志著P2P網貸平臺的發展進入一個新紀元。網貸之家發布了《P2P網貸行業2018年5月月報》,月報數據顯示,2018年4月,P2P網貸行業單月實現了1 826.6億元的整體成交量,截至2018年5月底,P2P網貸行業歷史累計成交量達到了71 584.64億元,突破了七萬億大關。與此同時,P2P網貸平臺各種問題和弊端也暴露出來,據網貸之家數據顯示,截至2018年5月,問題平臺累計達到4 270家。這些不斷出現問題的平臺也給互聯網金融的發展帶來了諸多負面影響,借款人的信用風險評估與管理也成為了亟待解決的問題。

國外有不少學者對P2P網貸信用評估模型提出了自己的看法,如Fisher(1936)提出信用評分即將個人的情況分級分類,并歸類評分;Wiginton(1980)年將Logistic模型率先用于信用風險評估;而Vapnik(2005)提出SVM模型擁有比神經網絡模型具有更優的分類精度,對數據假設條件依賴性小,比傳統的Logistic模型樣本要求低,因而在信用統計方法中廣泛傳播。Gestel和Baesens(2003)也認為SVM模型在信用風險管理中比神經網絡模型和Logistic模型更具有優勢,并率先將SVM模型運用于信用風險管理。Carmen(2008)通過對比發現,組合模型比單個模型具有更優的風險預測結果。

而在國內,陳靜(1998)率先使用傳統的回歸模型進行借款人信用風險管理;沈翠華在2005年個人信用評估中首次提出使用SVM模型;張杰、王凡(2008)在對上市公司的信用風險評估中使用了SVM-Logistic組合模型,總結出該組合模型比二者單一模型的預測精度高的特點;向暉(2011)通過對比組合模型和單個模型優缺點后,認為組合模型能為個人信用風險評估準確性和穩健性的最優選擇問題給出解決方案。

通過上述論點的研究以及對組合模型和單個模型特點對比研究,本文采用Logistic和SVM模型進行組合,并結合平臺本身構建適合其自身特點的信用評價體系,以滿足金融創新背景下的平臺借款者信用評估的需求。

二、模型的構建

(一)選擇組合模型

1.單一模型原理與比較。目前,對個人信用評分方法主要分為統計和非統計兩類。統計類一般是貝葉斯網絡、Logistic回歸模型和決策樹等;非統計方法是SVM模型和神經網絡模型等。其具體比較如表1所示。

表1 各大信用評分方法比較

2.組合模型的必要性及選擇。上述方法都是單一的模型,而在對借款者信用評估的建模過程中,需要考慮預測精度,這些模型都有其各自的優點,預測精度高、穩健性強、或者解釋性強等,也有其各自的劣勢,其共性是都不能完全在信用評估的內外部因素之間進行有效解釋。因而近年來不少學者將單一模型進行組合以期進行信用評估。靳云匯(2005)使用了將Logistic和神經網絡模型進行組合的方法;謝行恒(2007)在信用評估中使用了RBF-Logistic混合模型;向暉(2011)將單一模型和多種混合模型進行對比,發現混合模型的穩健性、預測的精度、解釋性等都優于單一的模型。

因此,筆者決定將Logistic模型與SVM模型組合進行信用風險評估主要從以下幾個方面考量:

(1)SVM模型和Logistic模型具有一定的互補性。SVM模型的預測精度高,而Logistic模型的預測精度低;SVM模型的劣勢是穩定性差,解釋性低,而Logistic模型的優勢是穩定性較好,解釋性高。因此二者結合可以互相彌補不足。

(2)兩個模型都可以解決非線性問題,且二者對數據的假設要求條件低。

由此可見,SVM和Logistic模型作為組合模型,不僅能體現SVM模型的高精度和Logistic模型的高穩定性,而且Logistic又補足了SVM低解釋性的缺點,優化結果。

圖1 SVM-Logistic組合模型流程圖

圖1為組合模型的流程,即為樣本數據輸入后,率先運用SVM模型進行信用評分,將SVM得出的結果作為一個解釋變量和其他的用戶個人變量一起作為Logistic模型的解釋變量。

(二)SVM和Logistic模型原理

1.SVM的基本原理。SVM一種新式的數據挖掘方法,是常見的一種判別方法。在數據挖掘的領域中廣泛運用,SVM模型的核心是將處于低維的樣本映射到高維空間中,在高維空間將樣本數據以最大間距分隔開來。

假設有線性可分的訓練樣本(X1,Y1),……,(X1,Y1),X1∈Rd,Y1∈{-1,+1},i=1,…,l,那么一定存在將樣本分開的間隔平面ωX+b=0

的條件。二者中位于最優分割超平面上的樣本,能使等號成立,這些樣本成為SVM。

像本文中信用評分運用的是線性不可分的樣本時,則需要把樣本通過映射函數轉化到高維空間中,轉化的映射函數稱為核函數。一般的核函數有:

2.Logistic模型的基本原理。Logistic模型是一種廣泛運用的線性回歸判別模型。假設存在一個因變量Y,表示事件發生可能性大小,當自變量X的值達到閾值時,表示事件Y發生,例如當X>0時,Y=1;反之,Y=0。在本文中,Y=1代表事件發生,Y=0代表事件未發生。假設因變量和自變量 Xi線性相關,即 Yi=α+βXi+δ,則有:

(三)SVM-Logistic組合模型的實現

第一步是通過SVM對樣本進行分類;第二步是將SVM得出的自變量和其他變量一起作為自變量帶入Logistic模型中,繼續進行信用評估。

將P2P借款人發生逾期違約的情況記為Y=1,反之,記為Y=0,則SVM-Logistic模型為:

在式(8)中,P代表借款人逾期違約的概率,1-P為借款人按期還款的概率,P越大,違約概率越大,反之越小。本文將第一階段通過SVM得到的結果作為特征向量,再加上一組特征向量X={X1,X2,…,Xn},總共有 n+1 個自變量,以上述變量搭建SVM-Logistic組合模型來對借款者進行信用風險評估,得出最終結果。

三、實證檢驗

成立于2011年7月的微貸網,是中國首家專注于汽車抵押借貸服務的P2P網貸平臺。據網貸之家公布的2018年6月網貸平臺評級TOP50中,微貸網位居第6名,成交量排名第7,處于行業較領先的地位。截止2018年7月31日,微貸網累計成交額1 984.5億元,交易總筆數超過470萬筆,在整個P2P網貸平臺中表現出較強的綜合實力且有較為良好的后續發展趨勢,具有一定的代表性。因此,本文選取微貸網作為研究P2P網貸公司的例子,即以微貸網平臺作為研究對象,構建P2P網貸個人借款者信用風險評估模型。

(一)微貸網的借款者情況

微貸網的網站呈現借款人信息界面中主要包括但不限于以下有用信息:項目情況下的項目總額、項目期限、預期利率;借款人信息中的性別、年齡、婚姻狀況、籍貫、行業、工作性質、收入及負債情況、還款來源與征信情況;借款車輛信息中的購買價和抵押價、行駛公里數;借款記錄中的歷史還清期數、待還期和歷史逾期次數等。

筆者通過運用網頁數據抓取軟件“爬山虎采集器”,收集了2018年7月的散標借款者的數據,共6 917個有效樣本。其中的借款金額最大值為585 000元,最小借款金額為4 500元,均值為73 562.36元;借款期限最長為36個月,最短為1個月,均值為2.73個月;借款利率,最大值為6.3%,最小值為5.8%,均值為6.03%。

在6 917位借款者中,其年齡分布為18~22歲166位,占比 2.4%;23~25歲 446位,占比 6.45%;26~30 歲為 1 353 位,占比 19.56%;31~42 歲為2 910位,占比 42.08%;43~50歲為 1 535位,占比22.19%;51~60歲為 454位,占比 6.56%;60歲以上為45位,占比0.66%,可見該平臺的借款人員主要集中在26~50歲的人群。借款人的性別方面,女性1 240位,男性借款人5 677位。婚姻狀況,已婚5 647位,占比81.64%,未婚的1 270位,占比18.36%。

汽車購買價格主要分為以下幾檔:100萬元以上汽車 393輛,占比 5.7%;80萬 ~100萬元 325輛,占比4.7%;60萬 ~80萬元181輛,占比 3.6%;40萬 ~60萬元673輛,占比9.73%;20萬 ~40萬元1 580輛,占比22.8%;20萬元以下3 765輛,占比54.4%。

在該平臺的借款人借款歷史還清期數大部分在50期以前,約占據了95%的比例。在該平臺的借款待還期數,待還期為2—4期的占了59%,待還期在5—12期的占了28%,分布主要還是集中在2—4期。借款人中有過逾期情況的占20.95%,沒有歷史逾期的占了79.05%。

(二)評估指標選取

本文首先參考美國的FICO評分系統和國內的芝麻信用評分系統對借款者信用風險評估的方式,借鑒其個人信用風險評估體系的各項指標及評分,同時結合微貸網本身的相關指標,對評估指標做一個初步的選取。

FICO評分系統對個人信用風險評估一級指標分為五類,分別是個人基本信息、不動產信息、擁有信用類型、信用情況和債務情況。個人基本信息包括職業信息和工作年限;不動產信息包括住房和居住年限;擁有信用類型包括信用卡數和銀行賬戶數;信用情況包括了信用檔案年限和逾期記錄;債務情況則是用戶債務比例。

芝麻信用評分系統對個人信用風險評估指標也是分為五類,分別是歷史信用、行為偏好、履約能力、身份特質和人脈關系。歷史信用包括了信用卡張數、信用卡額度和信用卡級別;行為偏好包括了賬戶活躍、消費金額、消費場景和消費層次等;履約能力包貨了賬戶資產、有無住房和有無車輛等信息;身份特質則包括了職業類型、學歷級別、住址穩定和手機穩定程度;人脈關系包含了社交廣度、社交深度和人脈信用度。

通過對上述FICO和芝麻信用的評分指標和分值分級的研究,本文采用FICO評價的分值賦予方式,參考了芝麻信用評估的方法,挑選了微貸網中可用的指標以構建評估指標體系。評估指標分為三類,分別是個人信息、抵押物信息和平臺借貸信息。個人信息包含了性別、年齡和婚姻狀況;抵押物信息包含了購買價格和行駛公里數;平臺借貸信息包含了歷史還清期數、待還期和歷史逾期數。

(三)數據量化

本文決定對微貸網8個指標進行如下的量化:

性別,趙旭等(2016)經過實證研究發現,男性違約的可能性比女性的要高,而且男性借款通過率僅為女性的60%,所以對男性賦值3,女性賦值7。

年齡,經研究發現,年齡在18~22歲的借款人,一般是無收入人群或是低收入人群,年齡在23~30歲的群體,收入相對低,工作較不穩定,而60歲以后的面臨著退休,收入相對在職是要低的,因而31~60歲之間的人群收入是相對穩定的。因此賦值18~22歲之間的為2,23~30歲之間的為4,31~60 歲的為 8,61 歲及以后的為 4。

婚姻狀況,微貸網借款者的婚姻狀況分為已婚和未婚兩種。本文認為已婚的家庭,具備雙收入來源,更加有還款能力,并且有更大的責任感,因此未婚的賦值0,而已婚的賦值5。

抵押物的購買價格,微貸網以車作為抵押物,而不同的車有不一樣的購買價格,購買價格體現了借款者的購買能力。根據不同的購買價格賦不一樣的值。20萬元以下為 2,20萬 ~40萬元為4,40萬~60萬元為6,60萬~80萬元為8,80萬~100萬元為9,100萬元以上為10。

行駛公里數,5萬公里以內為 10,5萬~10萬公里為8,10萬~20萬公里為6,20萬~30萬公里為 4,30萬~40萬公里為 2,40萬 ~50萬公里為1,50萬公里以上為0。

歷史還清次數,還清一次,為2分,之后每增加一筆還款加1分,最高為10分。

待還期,由于微貸網自身原因,只有還款中的借款人有待還期,而申請借款的不存在待還期,待還期數越大說明還款能力越弱,因此0次為10,每增加一次減1,10次及以上為0。

歷史逾期數,不違約為5,逾期每增加一次減1,5次及以上則為0。

以上為8個輸入變量的量化分析,量化后的樣本使用SVM-Logistic模型進行評估。在本文中,先用5 917個樣本進行訓練,訓練后再用1 000個樣本加以測試其準確性。

(四)主成分法處理指標

在使用SVM-Logistic組合模型進行信用風險評估前,先用主成分分析法對指標進行處理,將性別(X1)、年齡(X2)、婚姻狀況(X3)、購買金額(X4)、歷史還清次數(X5)、待還期(X6)、歷史逾期期數(X7)、行駛公里(X8)作為解釋變量,導入 SPSS 軟件中分析降維,進行顯著性檢驗,結果顯示,KMO值為0.76,Bartlett的值在0.05的檢驗標準之下,數據通過檢驗,可以進行主成分分析降維。

提取特征值大于1的主成分使用SPSS軟件,得到以下3個主成分:

由上式所示主成分Y1中年齡和婚姻狀況的權重較大,本文將其命名為基本因子。主成分Y2,歷史還清期數和待還期的系數比較高,命名為網貸因子。主成分Y3的系數中,購買金額的權重較大,因此命名為購買因子。

(五)SVM-Logistic模型在信用風險評估中的應用

使用組合模型進行風險評估,具體操作如下:

第一步:通過各個核函數分類結果比較,選取合適的核函數用于信用評估。

表2 三類核函數模型精度對比

通過比較表2中三種不同核函數的精度發現,三種核函數的預測結果都不相同,多項式核函數的預測結果精確度極高,線性核函數則差強人意,高斯核函數的預測結果也很高,但仍不如多項式核函數,因此本文使用多項式核函數進行分類。

第二步,使用多項式核函數進行樣本分類,并將結果作為一個自變量帶入Logistic模型中參與訓練測試。

(六)SVM-Logistic組合模型的實證結果與檢驗

表3 三類模型訓練集與預測集結果對比

通過表3中的訓練集結果來看,Logistic模型的預測性較差,組合模型與SVM模型的預測結果幾乎相同,說明組合模型和單一模型在訓練集上具有較高的預測精度。而從表4中測試集分類結果看來,組合模型的精度仍高于單一模型,單一模型相較于組合模型而言,兩者的波動相對較大,所以可以得出結論,組合模型精度高,準確性好。

表4 組合模型回歸結果

根據表4可知,這三個主成分的P值都是在0.05標準以下的,都通過了檢驗,因此將以上主要成分代入SVM-Logistic二元回歸模型得到以下模型:

進一步可以求得違約率為:

上述公式(13)中,P越接近于1,借款者逾期違約概率大,反之能按期還款。因此從組合模型的公式中可以看出,待還期X6和歷史逾期期數X7越高,即得分越低的借款者,違約概率越大,而婚姻、年齡、購買金額得分越高的借款者,越不容易違約。

(七)指標修正

在上述結論的基礎上,通過缺失各個變量的方法測度各指標的重要性。結果顯示:組合模型在缺失歷史逾期次數時,預測準確率有較大提升,從76%提升到了86%,說明該指標對信用風險評估產生了干擾;年齡、婚姻狀況、購買金額和行駛里數的缺失對預測準確率沒有影響;性別和歷史還清次數的缺失使預測準確率有了提高,但是波動很小,模型具有較好的穩定性;而待還期的缺失,反而使得預測準確率下降,說明該指標對網貸借款者的信用行為有較大的影響,不可缺失。

綜上所述,選擇剔除歷史逾期次數這個指標,1 000個測試樣本的預測準確率達到了86%,因此得到了修正后的評估指標如表5所示,與最初構建的指標相差了一個歷史逾期次數。

表5 修正后的評估指標表

使用SVM-Logistic模型對微貸網借款人信用風險進行了評估,模型得到準確率從初始的76%提高到了86%。微貸網上的借款者信息中,性別、年齡、婚姻狀況、購買價格、行駛公里、歷史還清期數和待還期這7個指標成為了構建SVM-Logistic組合模型的重要指標,同時SVM-Logistic模型回歸結果為微貸網平臺的借款者信用風險評估提供了參考,減小了投資者的投資風險,適用于網絡借貸中借款者的信用風險評估。

四、結論與建議

本文根據微貸網的特點及相關指標,借助FICO和芝麻信用評分法進行指標選取及量化,建立了借款者信用評估模型,利用該平臺的借款數據進行了SVM-Logistic組合模型的實證分析,進行信用風險評估測試,得出評估結果。在此基礎上,對評估指標進行優化,使評估指標也能適用于其他平臺。根據實證結果,對于微貸網平臺來說,借款者的性別、年齡、婚姻狀況、汽車購買金額、歷史還清期數、待還期和行駛里數等指標都是模型的重要因素,然而指標中包含了微貸網獨有的指標行駛里程數和汽車購買金額。剔除這兩個指標之后的剩余指標,借款者個人的基本信息較多,因此對于P2P網貸平臺來說,借款者的基礎信息對P2P網貸借款者的信用風險評估有很重要的意義。其中性別、年齡、婚姻狀況在模型中的系數都是負的,與預測結論成負相關,表明女性較男性違約風險小,已婚的較未婚的違約風險小,年齡在31~60歲之間的較其他年齡的違約風險小。

為了促進P2P行業的良性發展,結合本文的研究結果,提出以下建議:

第一,加快設立網貸行業統一的信用風險評估標準。信用風險評估是金融網貸方向上的一大熱點,網貸行業由于在我國處于興起階段,還沒有統一的信用風險評估標準。使用一種統一的評估標準,高效精確評估、遴選借款申請者,對P2P網貸行業的發展相當關鍵。P2P網貸是一種全新的線上借貸模式,可以使借貸雙方擺脫空間限制,讓不能正常從銀行借款的借款者籌集資金,也能讓貸出者享有一定的投資收益。通過SVM-Logistic信用評估模型得出的評估結果可以運用于P2P網貸平臺風險評估,有助于提升P2P網貸平臺的風險監控管理能力,進而促使網貸行業良性發展。因此各大平臺應聯手建立統一的P2P網貸信用風險評估標準,使得P2P行業得以健康發展。

第二,政府應主導建立共用的個人信用記錄數據庫,銀行向網貸平臺開放個人用戶的信用記錄以用于平臺的信用管理。現階段,網貸平臺魚龍混雜,各平臺只能在平臺內部進行信用公布和管理,卻不能平臺共享借款人的違約記錄等。建議各大網貸平臺能建立共享的違約人名單機制,從整體上提升平臺借款者信用識別能力。此外,將借款者違約情況納入其個人檔案中,促使其按期如數還款。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产成人精品高清在线| 亚洲av无码人妻| 91精品国产自产在线观看| 99热国产这里只有精品9九 | 国产日韩精品一区在线不卡| 久久精品无码国产一区二区三区| 九色在线视频导航91| 在线观看欧美国产| 四虎国产精品永久在线网址| 99re热精品视频中文字幕不卡| 中国一级特黄视频| 国产人成在线观看| 天天综合色天天综合网| 久久毛片免费基地| 99在线观看精品视频| 亚洲啪啪网| 国产一级做美女做受视频| 天天做天天爱天天爽综合区| 这里只有精品在线| 九九九九热精品视频| 91精品在线视频观看| 在线观看无码a∨| 亚洲天堂免费在线视频| 久久精品视频亚洲| 亚洲欧洲日产国产无码AV| 日本人妻一区二区三区不卡影院 | 国产另类乱子伦精品免费女| 亚洲日韩高清无码| 思思热精品在线8| 一区二区三区成人| 无码高潮喷水在线观看| 97成人在线视频| 亚洲天堂视频在线观看免费| 国产一级妓女av网站| 午夜视频在线观看区二区| 欧美综合区自拍亚洲综合天堂| 国产99精品久久| 国产精品福利尤物youwu| 欧美精品高清| 日本不卡在线| av天堂最新版在线| 国产精品亚洲片在线va| 国产区人妖精品人妖精品视频| www亚洲精品| 国产69精品久久久久孕妇大杂乱| 九月婷婷亚洲综合在线| 激情爆乳一区二区| 国产99视频精品免费视频7| 欧美另类视频一区二区三区| 婷婷午夜影院| 毛片久久网站小视频| 福利在线一区| 91国内视频在线观看| 国产精品无码作爱| 亚洲免费福利视频| 成AV人片一区二区三区久久| 一级片免费网站| 丰满人妻一区二区三区视频| 在线毛片网站| 又爽又大又黄a级毛片在线视频 | 亚洲五月激情网| 97视频精品全国在线观看| 热re99久久精品国99热| 美女扒开下面流白浆在线试听| 久久国产精品电影| 色悠久久综合| 成人国产一区二区三区| 欧美一道本| a国产精品| 亚洲第一网站男人都懂| 婷婷激情亚洲| 成人毛片在线播放| a毛片免费在线观看| 亚洲成人77777| 久久国产精品嫖妓| 午夜日本永久乱码免费播放片| 99ri国产在线| 亚洲男人天堂网址| 欧美有码在线观看| 99ri国产在线| 中文字幕av无码不卡免费| 91国内外精品自在线播放|