999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機(jī)器學(xué)習(xí)的信貸逾期檢測(cè)模型研究*

2021-07-10 02:20:44侯浩鑫趙志紅
科技與創(chuàng)新 2021年12期
關(guān)鍵詞:特征檢測(cè)模型

侯浩鑫,趙志紅

(北京理工大學(xué)珠海學(xué)院,廣東 珠海 519088)

1 引言

隨著互聯(lián)網(wǎng)金融行業(yè)的興起,銀行和貸款機(jī)構(gòu)通過互聯(lián)網(wǎng)為有貸款需求的客戶提供線上金融服務(wù)。在帶來更好服務(wù)體驗(yàn)的同時(shí),也存在著諸多信用風(fēng)險(xiǎn)問題,急需建立信貸風(fēng)險(xiǎn)檢測(cè)模型提高風(fēng)控水平。根據(jù)信貸客戶還款的具體情況,將客戶分為正常和逾期兩種類型。以三個(gè)月的時(shí)間作為觀察窗口,還款連續(xù)逾期三個(gè)月的,判定為逾期客戶;其余正常還款情況的,為正常客戶。通過采用機(jī)器學(xué)習(xí)和統(tǒng)計(jì)方法得出的信用檢測(cè)模型,能夠較為準(zhǔn)確地預(yù)測(cè)個(gè)人未來的信用表現(xiàn),估計(jì)每筆信貸是否逾期,方便銀行提前預(yù)知可能存在的風(fēng)險(xiǎn)。

現(xiàn)代治理理論與實(shí)踐表明,多元主體的有效協(xié)作配合,是推進(jìn)國(guó)家治理現(xiàn)代化的有效路徑。在一定意義上可以說,社會(huì)組織發(fā)展與治理現(xiàn)代化之間的關(guān)系,是檢驗(yàn)國(guó)家治理現(xiàn)代化深度、廣度、力度和效力的重要標(biāo)志。

2 數(shù)據(jù)預(yù)處理

分析來自某貸款機(jī)構(gòu)的歷史業(yè)務(wù)數(shù)據(jù),包含貸款基本表、報(bào)告主表、貸款記錄、貸記卡記錄、信用提示、未銷戶貸記卡和未結(jié)清貸款信息匯總、逾期信息匯總、查詢記錄匯總、信貸審批查詢記錄明細(xì)、貸款特殊交易、透支記錄、詐騙記錄等12個(gè)數(shù)據(jù)集,涉及3萬(wàn)名客戶和100多個(gè)特征,數(shù)據(jù)預(yù)處理較復(fù)雜,需盡量減少信息損失。

為了獲得更好的訓(xùn)練數(shù)據(jù)特征,通過特征工程將原始數(shù)據(jù)轉(zhuǎn)換成模型訓(xùn)練數(shù)據(jù),使得機(jī)器學(xué)習(xí)模型逼近這個(gè)上限,提高模型性能。主要運(yùn)用了特征構(gòu)建和特征選擇。例如針對(duì)“數(shù)據(jù)集:信貸審批查詢記錄明細(xì)表”,利用日期函數(shù)計(jì)算查詢間隔月份數(shù),通過總查詢次數(shù)除以查詢間隔月份數(shù)構(gòu)建出新屬性“月查詢次數(shù)”。

通訊模塊電路中S1為撥碼開關(guān),當(dāng)碼位為00時(shí)為固定周期傳輸,即每隔2 min采集一次數(shù)據(jù)并傳輸。當(dāng)碼位選擇01時(shí)為變周期數(shù)據(jù)傳輸。微控制器檢測(cè)當(dāng)前周期環(huán)境數(shù)據(jù)后,與上一周期數(shù)據(jù)進(jìn)行對(duì)比,如果差值小于設(shè)定閥值,則當(dāng)前周期不發(fā)送數(shù)據(jù)。如果超過設(shè)定閥值,則將變化的參數(shù)發(fā)送到路由節(jié)點(diǎn)。上位機(jī)如果未收到本周期某一節(jié)點(diǎn)數(shù)據(jù),則默認(rèn)當(dāng)前周期該節(jié)點(diǎn)環(huán)境參數(shù)未有大的改變,使用上一周期檢測(cè)值為本周期環(huán)境參數(shù)值,減少數(shù)據(jù)傳輸過程中的能耗。檢測(cè)器器變周期數(shù)據(jù)傳輸機(jī)制工作流程圖如圖5所示。

通過特征分箱離散化連續(xù)變量,同時(shí)將離散變量合并成少狀態(tài)。經(jīng)特征分箱后的數(shù)據(jù),具有更易于模型快速迭代和降低模型過擬合風(fēng)險(xiǎn)等優(yōu)勢(shì)。

四種模型的AUC值均低于0.8,預(yù)測(cè)準(zhǔn)確性不是很高,離想要檢測(cè)逾期客戶的目標(biāo)還有一定差距。其中表現(xiàn)較好的模型為邏輯斯蒂和BP神經(jīng)網(wǎng)絡(luò),AUC值為0.71。

表1 特征選擇結(jié)果

基于“smbinning”包對(duì)各特征進(jìn)行最優(yōu)分段,通過分段結(jié)果對(duì)數(shù)據(jù)進(jìn)行封閉性分箱和轉(zhuǎn)換,如特征“信用使用年限”的分段結(jié)果如表4所示。

表2 訓(xùn)練集和測(cè)試集數(shù)據(jù)概況

3 初步建立逾期檢測(cè)模型

將“xgboost”函數(shù)的目標(biāo)設(shè)為邏輯斯蒂模型,由于邏輯斯蒂為廣義線性模型,表達(dá)能力有限,而特征分箱后每個(gè)變量有了權(quán)重,即引入了非線性到模型中,顯著提升了模型的表達(dá)能力和擬合效果。

表3 四種模型結(jié)果對(duì)比

在彈體打擊巖石條件下,彈靶間形成應(yīng)力波并向地下傳播,在沖擊波或接近于沖擊波的短應(yīng)力波中,巖石介質(zhì)壓縮行為是在受限條件下發(fā)生的[7],從物理力學(xué)本質(zhì)上講,巖石介質(zhì)的變形狀態(tài)可以用剛性壁圓筒中的單軸壓縮描述。設(shè)沿圓筒的軸向應(yīng)力σr為垂直于彈靶接觸面的法向應(yīng)力;沿圓筒的徑向應(yīng)力σθ為平行于彈靶接觸面的切向應(yīng)力。由于應(yīng)變僅發(fā)生在軸向,因此,這時(shí),體積應(yīng)變?chǔ)偶s等于軸向應(yīng)變?chǔ)舝,徑向應(yīng)變?chǔ)纽燃s為0。

隨著全球信息技術(shù)主導(dǎo)的技術(shù)革命不斷加快,人類社會(huì)正在逐漸步入信息社會(huì)。隨著信息化、大數(shù)據(jù)等技術(shù)不斷深入,在信息化時(shí)代背景和思維模式下,建立固定資產(chǎn)信息化管理平臺(tái)對(duì)高校固定資產(chǎn)進(jìn)行管理,不斷提高固定資產(chǎn)管理效率,深入優(yōu)化固定資產(chǎn)管理手段,是高校固定資產(chǎn)管理的發(fā)展目標(biāo)和趨勢(shì)。

4 特征分箱

例如針對(duì)“數(shù)據(jù)集:貸款記錄”,由ID將貸款狀態(tài)拆分成“呆賬、結(jié)清和正常”三類屬性的數(shù)據(jù)。最終從100多個(gè)指標(biāo)中初步構(gòu)建了42個(gè)特征。接著,利用R語(yǔ)言“informationvalue”函數(shù)計(jì)算各定性指標(biāo)的IV值,選擇有高預(yù)測(cè)性能的前兩個(gè)顯著特征“工資”和“教育”;再通過廣義交叉驗(yàn)證法得到10個(gè)顯著性指標(biāo),主要包括信用狀況、償還歷史和逾期行為3個(gè)維度的指標(biāo),結(jié)合Boruta算法得出變量對(duì)逾期狀態(tài)影響的顯著性,根據(jù)變量間相關(guān)性圖和現(xiàn)實(shí)意義,篩選出“信用使用年限”和“貸款賬戶數(shù)”;最終,經(jīng)過定性指標(biāo)和定量指標(biāo)的篩選,從42個(gè)初選特征中選擇了重要程度前14的特征。特征選擇結(jié)果如表1所示。

(3) 采用場(chǎng)變量法模擬漿液初凝及硬化過程:①漿液注漿階段,認(rèn)為其有內(nèi)壓,其彈性模量取1 MPa;②漿液硬化階段,經(jīng)過10 h 漿液凝固后,其彈性模量取50 MPa[5]。

處理完缺失值后,采用無(wú)放回隨機(jī)抽樣方式,將總體以7∶3的比例拆分成訓(xùn)練集和測(cè)試集,數(shù)據(jù)基本情況如表2所示。

表4 “信用使用年限”分段結(jié)果

5 逾期檢測(cè)模型探索和優(yōu)化

5.1 基于XGBoost的集成學(xué)習(xí)模型

前面幾種機(jī)器學(xué)習(xí)模型的預(yù)測(cè)精度相對(duì)不高,嘗試基于XGBoost算法的集成學(xué)習(xí)模型以提高預(yù)測(cè)模型的精度。同時(shí),將分別對(duì)原數(shù)據(jù)和特征分箱變換后的數(shù)據(jù)進(jìn)行預(yù)測(cè),以觀察特征分箱是否提升了模型的表達(dá)能力和擬合度。XGBoost模型結(jié)果如表5所示。

表5 XGBoost模型結(jié)果

通過R語(yǔ)言“xgboost”函數(shù)建立模型,經(jīng)參數(shù)調(diào)試后對(duì)原數(shù)據(jù)進(jìn)行預(yù)測(cè),得到預(yù)測(cè)準(zhǔn)確率為84.5%,召回率為37%,AUC值為0.72。

對(duì)特征分箱后數(shù)據(jù)進(jìn)行預(yù)測(cè),預(yù)測(cè)準(zhǔn)確率為91.2%,召回率為52.7%,AUC值為0.82。

分別通過“gbm”函數(shù)建立決策樹逾期檢測(cè)模型(GBDT)、“glm”函數(shù)建立邏輯斯蒂回歸模型,并通過逐步回歸剔除非顯著變量、“nnet”包所得BP神經(jīng)網(wǎng)絡(luò)模型、“randomForest”函數(shù)建立隨機(jī)森林逾期檢測(cè)模型,結(jié)果如表3所示。

5.2 基于CooK距離的多元模型

通過統(tǒng)計(jì)學(xué)方法分析得到離群點(diǎn),觀察離群點(diǎn)與逾期客戶是否有顯著的關(guān)系。一般如果觀測(cè)樣本的Cook距離比平均距離大4倍,則該數(shù)據(jù)點(diǎn)被判定為離群點(diǎn)。通過Cook平均距離的4和24倍分別進(jìn)行離群值檢測(cè),其中顯著離群點(diǎn)和全部離群點(diǎn)如圖1所示。

圖1 異常值檢測(cè)

經(jīng)匹配樣本號(hào)發(fā)現(xiàn),基于Cook距離的多元模型檢測(cè)法所得出的離群點(diǎn)基本為逾期客戶,該模型表現(xiàn)出了較高的檢測(cè)準(zhǔn)確率和召回率。當(dāng)Cook距離為4倍時(shí),99.3%的逾期客戶被檢測(cè)出來,而此時(shí)模型的準(zhǔn)確率仍非常高,為96.7%。具體如表6所示。

表6 基于Cook距離的多元模型

6 結(jié)論

進(jìn)行分析的目的是檢測(cè)出可能存在逾期行為的客戶,基于這個(gè)業(yè)務(wù)背景,主要從模型的準(zhǔn)確率、召回率和AUC值來評(píng)價(jià)模型的優(yōu)劣。

四種機(jī)器學(xué)習(xí)模型的AUC值均低于0.8,預(yù)測(cè)準(zhǔn)確性不是很高。模型優(yōu)化上,通過XGBoost集成學(xué)習(xí)模型對(duì)原數(shù)據(jù)和分箱后數(shù)據(jù)分別建立模型,AUC分別提高到0.72和0.82,說明集成學(xué)習(xí)模型和特征分箱均有優(yōu)勢(shì),且經(jīng)特征分箱后的XGBoost模型預(yù)測(cè)準(zhǔn)確率達(dá)到91.2%,召回率達(dá)到51.7%,模型有很好的預(yù)測(cè)效果。

模型探索上,由于逾期客戶均在數(shù)據(jù)的某些特征取值上較為極端,故通過統(tǒng)計(jì)學(xué)方法,基于Cook距離的多元模型檢測(cè)出來的離群點(diǎn),與逾期客戶有著顯著的關(guān)系。當(dāng)Cook距離為4倍時(shí),99.3%的逾期客戶被檢測(cè)出來,而此時(shí)模型的準(zhǔn)確率仍非常高,為96.7%,該模型表現(xiàn)出了非常高的分類效果。

猜你喜歡
特征檢測(cè)模型
一半模型
“不等式”檢測(cè)題
“一元一次不等式”檢測(cè)題
“一元一次不等式組”檢測(cè)題
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
如何表達(dá)“特征”
不忠誠(chéng)的四個(gè)特征
抓住特征巧觀察
3D打印中的模型分割與打包
主站蜘蛛池模板: 欧美成人亚洲综合精品欧美激情| 青青草国产在线视频| 亚洲综合在线网| 成人综合网址| 人人爱天天做夜夜爽| 伊人91在线| 91精品国产综合久久不国产大片| 亚洲成aⅴ人在线观看| 国产乱码精品一区二区三区中文| 91精品啪在线观看国产91| 区国产精品搜索视频| 无遮挡一级毛片呦女视频| 亚洲一区色| 97精品伊人久久大香线蕉| 亚洲人成影视在线观看| 国国产a国产片免费麻豆| 91青青视频| 国产精品白浆无码流出在线看| 22sihu国产精品视频影视资讯| 精品无码国产一区二区三区AV| a级毛片一区二区免费视频| 国产精品国产三级国产专业不| 国产精品三级专区| 国产亚洲男人的天堂在线观看 | 国产一在线| 超清无码熟妇人妻AV在线绿巨人| 亚洲人成网站观看在线观看| 久久综合一个色综合网| 亚洲成aⅴ人在线观看| 欧美亚洲一二三区 | 久久精品无码国产一区二区三区| 亚洲午夜福利精品无码| 精品三级在线| 国产特一级毛片| 天天爽免费视频| 伊人查蕉在线观看国产精品| 亚洲不卡无码av中文字幕| 国产网站一区二区三区| 精品国产网站| 性网站在线观看| 国产一级无码不卡视频| 色综合五月婷婷| 无套av在线| 亚洲国产成人自拍| 免费一级大毛片a一观看不卡| 亚洲欧美国产视频| 无码电影在线观看| 国产三级视频网站| 永久免费AⅤ无码网站在线观看| 国产成人乱无码视频| 中文字幕亚洲综久久2021| 亚洲三级色| 午夜国产小视频| 99视频在线免费| 啦啦啦网站在线观看a毛片| 国产成人免费| 日本不卡视频在线| 欧美另类图片视频无弹跳第一页| 国产成人一区| 在线视频亚洲欧美| 国内视频精品| 成人国产精品视频频| 欧美性猛交一区二区三区| 亚洲精品午夜天堂网页| 亚洲丝袜中文字幕| 国产精品亚洲日韩AⅤ在线观看| 九九视频在线免费观看| 日韩欧美国产成人| 欧美成人午夜在线全部免费| 无遮挡一级毛片呦女视频| 玩两个丰满老熟女久久网| 毛片网站观看| 国产精品一老牛影视频| 久久国产拍爱| 亚洲无码一区在线观看| 欧美日韩另类国产| 永久免费无码日韩视频| 又污又黄又无遮挡网站| 久久这里只有精品23| 狠狠色综合久久狠狠色综合| 国产亚洲男人的天堂在线观看 | 国产精品亚洲αv天堂无码|