舒方媛 趙公民 武勇杰



摘要:P2P網貸在爆發式增長的同時,也面臨著重大的信用風險,對借款人違約風險的預測是降低信用風險的重要方法。以“人人貸”平臺上采取的數據為研究樣本,構建借款人信用評價指標體系,采用二元Logistic回歸模型建立借款人信用風險評估模型。結果表明,借款期限、借款人年齡、信用評級、逾期次數對借款人信用風險影響最為顯著,其次是學歷、成功借款次數、借款利率和房產。
關鍵詞:P2P網貸;信用風險評估;二元Logistic回歸模型
中圖分類號:F830.39? ? ? ? ?文獻標識碼:A
文章編號:0439-8114(2019)04-0103-05
Abstract: While P2P is experiencing explosive growth, it also faces significant credit risks. The prediction of borrower default risk is an important method to reduce credit risk. Taking the data taken on the platform of "Everyone's Loan" as the research sample, the credit evaluation index system of borrowers is constructed, and the dual-logistic regression model is used to establish the credit risk assessment model of borrowers. The results show that the borrowing period, the borrower's age, credit rating and overdue times have the most significant impact on the borrower's credit risk, followed by education, successful borrowings, borrowing rates, and real estate.
Key words: P2P; credit risk assessment; dual-logistic regression model
2013年是中國的互聯網金融元年,互聯網技術與金融行業的深度融合促進了互聯網金融的迅猛發展?;ヂ摼W金融的出現影響了傳統金融業的格局且催生了新的支付方式和融資模式,大大促進了中國經濟的發展。其中,P2P(Peer-to-Peer Lending)網絡借貸是互聯網金融模式的主要代表之一。
P2P網絡借貸作為金融行業的新興產業,將民間借貸與互聯網金融的特點結合起來,這種新的業務模式相較于傳統的金融模式,具有操作便捷、效率更高等優點,縮短了交易距離,提高了交易效率,節省了交易時間,滿足了不同層次的金融需求,彌補了傳統金融業的短板,因而在中國蓬勃發展起來。根據“網貸之家”的數據顯示,截至2016年11月30日,中國的P2P網貸平臺已達5 879家,相比2015年新增744家;年成交額為2.8萬億元,相較于2015年增長137.59%。但是,行業呈現爆發式增長的同時也面臨諸多問題,非法集資、借款人“跑路”現象層出不窮。截至2016年年底,停業及問題平臺數量累計達到1 478家,網貸平臺普遍存在10%~20%的壞賬率,顯著高于傳統的金融借貸。網貸平臺的高風險主要來自兩個方面,一方面是政府加強了對信用監管方面的力度,外在的壓力導致許多網貸平臺難以發展;另一方面,由于網貸屬于無抵押貸款,借款人違約成本較低,若大量客戶違約,將會導致賬款無法催收,平臺資金流停滯、無法正常提取資金,威脅平臺持續穩定經營。因此,個人信用風險已經成為網絡借貸平臺面臨的主要風險之一。在此背景下,對平臺上借款人違約風險的影響因素進行研究顯得格外重要。
本研究采取爬蟲技術從“人人貸”平臺上選取了2014年4月至2017年10月的借款人相關數據作為研究樣本,引入二元Logistic回歸模型作為研究方法,從借款人基本情況、借款產品信息、歷史信用3個方面構建指標體系;為了提高模型準確性,使用WOE值對變量進行處理,將WOE值替代原值代入模型進行回歸,力求找出影響借款人違約風險的主要因素,以提高網貸平臺和投資人通過借款人信息來辨識其違約概率的能力,降低網絡借貸的信用風險。
1? 文獻綜述
網絡借貸的迅速發展,引起了學術界的廣泛關注,國內外學者進行了不少關于網絡借貸信用風險的研究。
關于信用風險揭示的研究,Michels[1]以Prosper網站上的數據為基礎,研究發現網絡借貸平臺責任的確認會導致網絡市場運行有效性下降,進而會帶來較大的風險。Lee等[2]通過韓國最大的網貸平臺上出現的“從眾行為”發現,該行為會導致網絡借貸信用風險加大,網絡借貸市場上的信息不對稱現象非常嚴重,進一步還會導致道德風險。楊宇焰等[3]通過對四川省的11家網貸平臺進行調研,提出網貸中主要風險來自于缺少相關立法和部門監管、借款人違約、操作風險和流動性風險、平臺自身資本實力和管理風險。盧馨等[4]認為網貸平臺上存在的主要風險是因法律和監管缺失而導致的政策法律風險和監管風險,操作上的不規范和技術投入不足而導致的操作風險和網絡風險以及由于借款人道德缺失而引發的信用風險。
關于信用風險影響因素的研究,Lin等[5]研究發現,若借款人P2P平臺上有好友,則容易獲得借款,且借款利率也更低,同時違約率也更低,說明關系網絡能在一定程度上起到識別借款質量的作用。Gonzalez等[6]從借款人的個人特征入手,研究其對網貸決策的影響,研究結果表明,借款人性別、年齡和外貌影響其借款成功率。Emekter等[7]通過研究信用等級對于網貸借貸信用風險的影響,發現借款人信用等級與違約風險發生率呈反比,信用等級越高違約率越低,信用等級越低則違約率越高。董梁等[8]通過分析“人人貸”上的數據,建立新進借款人信用風險評估模型,認為年齡、性別、崗位職位、工作認證、借款用途和實地認證指標應該作為評價個人信用風險的主要根據。肖曼君等[9]采取排序選擇模型從多個P2P網站上截取數據,從借款信息、歷史表現、信用變量以及人口特征4個方面選取影響信用風險的變量,研究發現這4個因素分別對網絡借貸信用風險存在正向影響。王會娟等[10]通過研究描述性信息對網貸行為的影響發現,借款人信用等級越低,越傾向添加描述性信息;另一方面,若借款描述展示的人格數量越多,則更容易獲得借款且借款人違約率越低。
關于信用風險評估方法的研究,主要方法有Logistic回歸模型、BP神經網絡、決策樹、層次分析等方法。Bekhet等[11]分別使用Logistic回歸模型和徑向基函數模型構建信用評分模型,結果表明,Logistic回歸模型比徑向基函數模型更為準確,但徑向基函數模型更能準確地識別出潛在違約者。Oreski等[12]提出了將遺傳算法和神經網絡的混合算法(HGA-NN)相結合來進行信用風險評估,結果發現,HGA-NN算法相較于遺傳算法在信用風險評估中的特征選擇和分類方面具有較大優勢。宋麗平等[13]以平臺借款人個人信用等級作為預測輸出目標,運用BP神經網絡模型研究發現,借款人自身的客觀條件、還款能力、歷史表現都會對P2P網絡借貸個人信用風險產生重要影響。姚鳳閣等[14]采用“拍拍貸”平臺上的經驗數據,聯合采用Logit和Probit回歸模型研究借款人信息與信用風險之間的關系,認為信用等級、投標成功次數、投標失敗次數、借款利率對借款人的信用風險有顯著影響,而借款期限、性別、年齡則對借款人信用風險無顯著影響。
通過對現有文獻的梳理和總結可以發現,由于國外網貸發展相比國內較為成熟,征信體系比較完善,且數據也對外公開,關于網貸的研究成果較為豐富。國外學者不僅進行了如平臺監管、平臺發展模式、平臺面臨風險等定性分析,也有如借款成功率、P2P網貸平臺違約風險影響因素等定量分析。國外學者的研究成果對中國網貸信用風險的研究有重要的參考意義。然而,國內P2P網貸行業目前處于初級階段,關于網貸的研究起步比較晚,沒有完善的征信體系,監管比較滯后,缺少法律約束,學者對網貸行業的研究以定性分析為主,主要集中在網貸平臺的監管、風險控制、平臺運營模式等方面,很少從定量的角度研究網貸的信用風險?;诖耍狙芯繌亩康慕嵌瘸霭l,利用“人人貸”平臺上的真實數據,建立借款人信用風險評估模型,力求找出影響借款人違約風險的主要因素,以幫助網貸平臺和投資者更好地識別借款人的信用風險。
2? 研究方法與指標選取
2.1? 研究方法
選取經典的二元Logistic回歸模型,研究借款人信息與其違約行為之間的關系,因變量為借款人是否違約,為典型的二分變量,定義為“違約=1,未違約=0”,且為非連續變量,因此需要使用非線性回歸。Logistic回歸模型是一種研究二分類被解釋變量與一些影響因素之間關系的一種多變量分析方法,模型中的自變量可以是定性的也可以是定量的。
2.2? 數據來源及說明
“人人貸”作為中國互聯網金融業的領軍企業,對借款人和借款標的的審批比較嚴格,對每一組貸款有詳細的記錄,因此數據的完整性比較好。本研究采取爬蟲技術從“人人貸”平臺中的“散標投資”和“債權轉讓”隨機抽取了2014年4月至2017年10月的相關數據。抽取到的原始樣本數據含有大量與個人信用風險無關的數據,如借款人編號、借款人昵稱等,若加入模型,會干擾模型的準確程度;另外,原始數據有些是字符型格式,回歸模型只能識別數值型格式,需要把數據統一設置為數值型格式。
借款人列表中借款人信息包括借款信息(借款用途、標的總額、借款利率、借款期限、借款性質、還款方式、標的狀態、借款人來源、對借款的描述、墊付金額);借款人個人信息(出生年月、性別、學歷、用戶名、婚姻狀況、戶籍、工作情況、公司情況、房車產情況);借款人信用信息(信用評級、信用分數、信用額度、逾期情況);借款擔保信息(擔保方式)。為了得到干凈且完整的數據,刪除了部分借款人信息缺失和信息無效部分,共獲得有效完整的數據10 863條。需要說明的是,“人人貸”平臺中“墊付金額”表示借款人未還清貸款,平臺為其墊付,表示借款人違約,有墊付金額記錄的為違約客戶。10 863條數據中,有9 270條是未違約客戶,即“好客戶”;有1 593條是違約客戶,即“壞客戶”。
2.3? 變量選取與處理
目前網貸平臺對于個人信用風險評估的指標并沒有統一的標準和規范,指標的選取直接關系到模型預測的準確性。綜合考慮影響信用風險的各項因素,選取借鑒了傳統信用風險評估體系和網貸平臺的特征信息及其實際的業務需求,參考國內外相關文獻所選取的指標,遵循指標能容易獲得、能夠反映借款人的還款能力和意愿,從借款人基本情況、借款產品信息、歷史信用3個方面,構建了定性和定量指標相結合的網貸平臺個人信用評價指標體系。選取13項指標作為借款人信用風險評估的具體指標,具體分組見表1。
選取的樣本數據中,既有序數型(如信用等級)變量,又有區間型(如收入)變量,且每個變量的取值區間和量綱存在較大差別,為了降低變量屬性、平滑變量變化趨勢、提高模型的評估水平,應對變量的取值進行分箱計算證據權重WOE(Weight of Evidence)值。WOE值是對原始自變量的一種編碼形式,用來衡量變量某個屬性的風險指標,WOE值越高,代表著該分組中客戶是“壞客戶”的風險越低。其計算公式如下:
3? 結果與分析
3.1? 多重共線性分析
本研究選取的變量比較多,若不考慮變量之間的線性相關性,盲目地進行回歸分析,往往達不到理想的結果,甚至會導致錯誤的結論。為了判斷變量之間是否線性相關,先用SPSS 17.0軟件進行共線性診斷,結果見表3。
由檢驗結果可知,方差膨脹因子VIF值均小于10,表明變量之間不存在高度多重共線性問題。另外,容差在0.1的標準下,若有變量容差小于0.1,則表明存在多重共線性,結果中的變量無小于0.1的值,也說明了變量之間不存在多重共線性問題。說明選取的指標直接相互獨立,可以用于回歸模型。
3.2? 實證檢驗
由回歸結果可知,在a=0.05的顯著水平下,P≤0.05的變量有借款利率、信用評級、房產、成功借款次數、借款期限、年齡、學歷、逾期次數,說明這8項指標都顯著影響借款人的違約率,其中,借款期限、年齡、信用評級、逾期次數4項指標對借款人違約率影響最為顯著;房產、借款利率、成功借款次數、學歷次之。其他5項指標即工作時間、車產、收入、婚姻、性別則對借款人違約率影響不顯著。
1)借款人基本情況(年齡、學歷、房產)對違約率有顯著影響。年齡與借款人違約率呈顯著正相關關系,借款人年齡越大違約率越大,這可能與年長者相對于年輕人來說工作效率降低,收入不如年輕人;學歷與借款人違約率呈顯著負相關關系,借款人學歷越高違約率越低,可能是學歷較高者工資起點高,且受到的道德約束力相對較強;有房產與借款人違約率呈顯著負相關關系,借款人有房產違約率會降低,這可能與借款人無房貸壓力,經濟較為寬裕,還款能力更強有關。
2)借款產品信息(借款利率、借款期限)對違約率影響顯著。借款利率與違約率呈顯著負相關關系,借款利率越高違約率越高,較高的利息會給借款人帶來更大的壓力,使其不能如期還款;借款期限與違約率呈顯著負相關關系,借款期限越長違約率越低,可能是由于借款期限越長,每月所需還款金額越小,借款人還款壓力越小。
3)歷史信用(信用評級、成功借款次數、逾期次數)對違約率影響顯著。借款人信用評級與違約率呈顯著負相關關系,借款人信用等級越高違約率越低,較高的信用評級說明借款人信用資質較好,違約概率比較小,信用評級可以作為貸款人貸款給借款人的一項重要參考指標;成功借款次數與違約率呈顯著負相關關系,在平臺上借款成功次數越多借款人違約率越低,借款人多次在平臺上借款成功說明個人信用資質較好,平臺愿意貸款,故違約可能性較低;逾期次數與違約率呈顯著負相關關系,借款人違約次數越多違約概率越大,借款人多次違約說明個人信用資質較差,貸款人對這類借款人應持有謹慎態度。
4? 結論與建議
本研究基于“人人貸”網貸平臺上借款人真實數據,根據中國P2P網貸平臺特征,從借款人基本情況、借款產品信息、歷史信用3個方面建立了適合P2P網貸平臺的借款人信用風險評估體系。引入了穩定性較高的Logistic回歸模型,得出影響借款人違約風險的主要因素是借款期限、年齡、信用評級、逾期次數;其次是學歷、成功借款次數、借款利率、房產,可以為P2P網貸平臺和投資人識別借款人違約風險提供一定參考。但研究選取樣本數據及驗證數據規模有限,可能會導致試驗結果有一定的偏差;P2P行業體系本身正在不斷發展,本研究的指標選取僅借鑒了前人的研究成果,存在一定的滯后性,且嚴謹性不足?;谏鲜鼋Y論,結合中國P2P網絡借貸發展實際,分別從P2P網貸平臺內部、之間和外部層面提出以下幾點建議。
1)平臺內部。信用評級對貸款人有重要的參考意義,平臺內部可以建立統一規范的信用評分系統,幫助投資者有效測評借款人的信用信息,更好地規避風險。平臺可以加大線下審核力度,線上信息可能存在造假因素,平臺可以從內部將線上線下審核相結合,派專員進行線下走訪,實地調查借款人經濟情況,力求借款人上傳資料的真實性、有效性。平臺應重視網絡安全的維護,聘請高水平的信息技術人才,確保平臺系統內部網絡不受侵害,保證客戶信息資料不被泄露。平臺可以建立資金池保證投資者資金安全,足夠的資金是P2P平臺得以生存和發展的前提,當貸款人獲得一定收益時,平臺可收取部分資金填充自身資金池,當借款人出現違約情況,平臺能及時補給投資者,保障投資者收益。
2)平臺之間。P2P平臺可以建立信息共享平臺,實現平臺之間的征信信息共享,實現透明公開和黑名單公示機制,互通有無??梢怨餐邪l建立高規格的平臺運營技術、防御技術,發展P2P行業的統一網絡金融服務體系或統一的操作平臺和數據庫,管理和推廣P2P信息技術,實現平臺之間信息數據的交流和信息共享。
3)平臺外部。一方面商業銀行可以加強數據庫的建設力度,作為與公眾接觸最多的社會機構,銀行所掌握的信用信息量最多。銀行可以憑借這種優勢積累借款人的歷史信用數據,加快建設信用信息數據庫,這些數據可以與P2P平臺共享,實現P2P網貸和商業銀行的交互,力求覆蓋更多層次的客戶群體,共同為中國經濟發展作出貢獻。政府方面,應充分發揮政府的規范和引導作用,加快推動對民間借貸的立法規范,盡可能消除P2P平臺中非法集資等亂像,使P2P平臺朝著合理合法合規的方向發展。
參考文獻:
[1] MICHELS J. Do unverifiable disclosures matters?Evidence from peer-to-peer lending[J].Accounting Review,2012,87(4):36-41.
[2] LEE E,LEE B. Herding behaviorin online P2P lending:An empirical investigation[J].Electronic Commerce Research and Applications,2012,11(5):495-503.
[3] 楊宇焰,陳? 倩,田忠成.P2P網絡信貸平臺的主要模式、風險及政策建議[J].西南金融,2014(1):29-31.
[4] 盧? 馨,李慧敏.P2P網絡借貸的運行模式與風險管控[J].改革,2015(2):60-68.
[5] LIN M,NAGPURNANAND R P,VISWANATHAN S. Judging borrowers by the company they keep:Friendship Net-works and information asymmetry in online peer-to-peer lending[J].Management Science,2013,59(1):17-35.
[6] GONZALEZ L,LOUREIRO Y K. When can a photo increasecredit? The impact of lender and borrower profiles online peer-to-peer Loans[J].Journal of Behavioral & Ex-perimental Finance,2014(2):44-58.
[7] EMEKTER R,TU Y,JIRASAKULDECH B. Evaluating credit riskand loan performance in online peer-to-peer(P2P)Lending[J].Applied Economics,2015,47(1):54-70.
[8] 董? 梁,胡明雅.基于Logistic回歸模型的網貸平臺新進借款人信用風險研究[J].江蘇科技大學學報(社會科學版),2016,16(3):102-108.
[9] 肖曼君,歐緣媛,李? 穎.我國P2P網絡借貸信用風險影響因素研究——基于排序選擇模型的實證分析[J].財經理論與實踐,2015(1):2-6.
[10] 王會娟,廖? 理.中國P2P網絡借貸平臺信用認證機制研究——來自“人人貸”的經驗證據[J].中國工業經濟,2014(4):136-147.
[11] BEKHET H A,ELETTER S F K. Credit risk assessment modelfor jordanian commercial banks:Neural scoring approach[J].Review of Development Finance,2014,4(1):20-28.
[12] ORESKI S,ORESKI G. Genetic algorithm-based heuristic for feature selection in credit risk assessment[J].Expert Systems With Applications,2014,41(4):2052-2064.
[13] 宋麗平,張利坤,徐? 瑋.P2P網絡借貸個人信用風險評估[J].財會月刊,2015(35):94-96.
[14] 姚鳳閣,隋? 昕.P2P網絡借貸平臺借款人信用風險影響因素研究——來自“拍拍貸”的經驗依據[J].哈爾濱商業大學學報(社會科學版),2016(1):3-10.