王 燦
(上海郵電設(shè)計(jì)咨詢研究院有限公司,上海 200093)
個人信用實(shí)際是借款人與金融機(jī)構(gòu)或出資方的隱形契約,能降低交易行為的成本[1]。但是當(dāng)信貸交易完成后,借款人未按期履約,將給貸款機(jī)構(gòu)造成損失。美國次貸金融危機(jī)以及國內(nèi)2018年以來多起P2P平臺“暴雷事件”,導(dǎo)致國內(nèi)外對個人信貸業(yè)務(wù)的開展越發(fā)慎重。為了降低信用風(fēng)險(xiǎn),一套有效的個人信用評價(jià)體系及方法顯得尤為重要[2]。
與西方發(fā)達(dá)國家相比,我國個人信用評價(jià)體系、技術(shù)起步較晚,傳統(tǒng)人工經(jīng)驗(yàn)打分法已無法滿足迅猛發(fā)展的信貸業(yè)務(wù)。中辦國辦印發(fā)《關(guān)于推進(jìn)社會信用體系建設(shè)高質(zhì)量發(fā)展促進(jìn)形成新發(fā)展格局的意見》(2022)指出:支持金融、征信和評級等機(jī)構(gòu)運(yùn)用大數(shù)據(jù)等技術(shù)加強(qiáng)跟蹤監(jiān)測預(yù)警。同時,在業(yè)界和學(xué)術(shù)界,構(gòu)建既符合信貸業(yè)務(wù)特點(diǎn)又高效可行的機(jī)器學(xué)習(xí)方法逐漸成為熱門研究課題。
該文以個人貸款業(yè)務(wù)為背景,將信用風(fēng)險(xiǎn)評估抽象為監(jiān)督學(xué)習(xí)下2類分類問題,采用EasyEnsemble方法解決個人信用數(shù)據(jù)普遍存在的數(shù)據(jù)不平衡問題,對多種單一模型集成進(jìn)行模型融合,采用準(zhǔn)確率、召回率等指標(biāo)對模型進(jìn)行評價(jià),以驗(yàn)證集成學(xué)習(xí)方法的有效性。
對監(jiān)督學(xué)習(xí)下的2類分類問題來說,當(dāng)2種類別樣本數(shù)量差別較大時,被稱為“數(shù)據(jù)不平衡”,即某一類樣本數(shù)遠(yuǎn)小于另一類樣本數(shù),可能會導(dǎo)致分類邊界受多數(shù)類樣本的影響[3]。
實(shí)際上……