朱益冬,陳玉明*,盧俊文,曾念峰
(1.廈門理工學(xué)院計(jì)算機(jī)與信息工程學(xué)院,福建 廈門 361024;2.易成功(廈門)信息科技有限公司,福建 廈門 361024)
隨著個(gè)人借貸需求的不斷增長,加上互聯(lián)網(wǎng)和金融的優(yōu)勢互補(bǔ)[1],P2P平臺[2-3]應(yīng)運(yùn)而生。2007年8月,中國第一個(gè)P2P網(wǎng)貸平臺拍拍貸誕生[4],此后P2P行業(yè)[5]進(jìn)入飛速發(fā)展階段。但網(wǎng)貸平臺的不規(guī)范經(jīng)營給平臺機(jī)構(gòu)、融資者和投資者等帶來一系列風(fēng)險(xiǎn)。特別是到2018年下半年,多家網(wǎng)絡(luò)借貸平臺集中爆雷,對行業(yè)聲譽(yù)造成了較大負(fù)面影響。如何對借款人的信用進(jìn)行評估[5-6],成為規(guī)范社會和金融穩(wěn)定發(fā)展的關(guān)鍵問題。
眾多學(xué)者應(yīng)用機(jī)器學(xué)習(xí)的方法在信用評估領(lǐng)域作了許多深入研究。普雪飛[7]提出了一種P2P網(wǎng)貸信用風(fēng)險(xiǎn)量化評估模型,基于P2P平臺Lending Club的真實(shí)借款數(shù)據(jù),利用邏輯回歸算法構(gòu)建借款人信用評估方法。劉瀟雅等[8]提出基于支持向量機(jī)集成的個(gè)人信用評估研究,該方法較單一SVM模型和傳統(tǒng)集成方法效能明顯提高。然而這些研究都是將國外數(shù)據(jù)集作為考察對象,并且采用的模型都是傳統(tǒng)的機(jī)器學(xué)習(xí),難以擬合復(fù)雜多變的指標(biāo),使得預(yù)測精確度不高。王冬一等[9]提出基于大數(shù)據(jù)技術(shù)的個(gè)人信用動(dòng)態(tài)評價(jià)指標(biāo)體系研究的方法,選擇較新的算法進(jìn)行實(shí)驗(yàn),然而缺乏對多維度數(shù)據(jù)進(jìn)行算法的優(yōu)化整合和應(yīng)用對比。王重仁等[10]提出融合深度神經(jīng)網(wǎng)絡(luò)的個(gè)人信用評估方法,采用基于注意力機(jī)制的長短期記憶(long short-term memory,LSTM)模型和卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)模型2個(gè)子模型。……