999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

電子商務平臺用戶信用消費風險評估方法

2019-05-22 10:29:16陳浩
商場現代化 2019年3期

摘 要:本文基于國內某電子商務平臺的用戶購買行為數據,分別利用邏輯回歸、支持向量機、隨機森林和Xgboost建立信用評估模型,通過AUC值和F1得分比較各個模型的優劣,最終對表現優異的模型進行再次融合,從而提高電子商務平臺風險評估效率。

關鍵詞:電子商務;信用消費;風險評估;Xgboost;模型融合

一、引言

基于信息技術誕生的電子商務,極大地豐富了人們的消費方式。電子商務平臺的出現打破了傳統商務模式中區域以及國界的各種壁壘,與三方支付平臺的有效結合將傳統商務模式的購買行為變得更加高效便捷,還產生了像“花唄”這樣的信用消費產品。與此同時也產生了一些問題,電子商務的虛擬化雖然令各類信息更加易得,但各種虛假信息摻雜其中,尤其在信用消費中,不少用戶忽視規則使用信用消費導致不能按時還款,甚至給了一些不法分子惡意消費的機會。因此本文基于電子商務平臺用戶消費行為數據構建信用評估模型給用戶提供合理信用消費權限。

二、模型選擇

本文分別利用邏輯回歸、支持向量機、隨機森林建立信用評估模型,通過AUC值和F1得分比較各個模型的優劣,最終對表現優異的模型進行再次融合,從而提高互聯網金融用戶風險評估效率。

三、數據處理和模型評價

1.數據描述

本文選取了國內某電子商務平臺的用戶購買和支付行為數據作為研究目標。數據集包括Master、Log_Info、Userupdate_Info三個部分。Master表中包含了用戶的學歷學籍、社交行為等字段,Log_Info表中主要有用戶終端日常操作行為字段,Userupdate_Info表里存儲了用戶修改相關信息的行為字段,三部分基礎數據集共包含228個特征信息。

2.數據處理

對缺失值的處理,總的來說分為刪除法和插補法。在征信領域,用戶信息的完整程度可能會影響該用戶的評級。本文分別從用戶屬性缺失率(按行)和特征缺失率(按列)兩個角度對缺失數據進行了處理。

特征缺失率是指對于某個特定屬性,缺失樣本數占總樣本數的比率。圖1顯示的是存在缺失的屬性及對應的缺失比率。指標WeblogInfo_3及WeblogInfo_1變量的缺失率為0.967,這兩列屬性能夠提供的信息量極少,可以直接剔除。UserInfor_11、UserInfor_12、UserInfor_13三個變量的缺失率為0.63,這三個變量均為分類變量,這種情況下可以將缺失值用當作分類變量的一個類別處理。

用戶屬性缺失率指的是對于某個具體用戶而言其所有指標中缺失指標數占總指標數的比率。本文統計了訓練樣本及測試樣本中每個用戶的缺失屬性個數,并且按照缺失個數進行排序,以排序序號為橫軸缺失個數為縱軸,畫出圖2,從圖中可以看出,屬性缺失個數呈現階梯裝上升的特點,說明缺失個數這個特征可以有效的將用戶群體區分開。本文將缺失個數作為一個離散變量加入到訓練集中。

其中x是原始數據,μ是x的均值,μ是x的標準差,歸一化之后的數據由于對方差進行了統一,這時候每個維度的量綱其實已經等價了,避免了不同量綱的選取對距離計算產生的巨大影響。本文對分類變量采用獨熱編碼處理。

數據挖掘算法需要基于豐富的特征空間才能發揮良好的性能,單用原始數據的特征空間進行建模往往達不到理想的效果。本文針對Log_Info、Userupdate_Info兩表,從中提取用戶修改個人信息的特征以及登陸狀態特征如:修改次數、修改時間、登陸天數等。特征提取完成之后又對數據特征進行了組合。

3.分類模型評價

精確率、召回率、AUC、F1等都是用來評價二分類模型好壞的指標,參照表1,精確率的計算方式為TP/(TP+FP),即為在預測為壞人的人中,預測正確的人占比。召回率的計算方式為TP/(TP+FN),即為在實際為壞人的人中,預測正確的人占比。F1值是精確率和召回率的調和均值,即F1=2PR/(P+R),相當于精確率和召回率的綜合評價指標。

四、實驗結果和分析

實驗利用python語言實現,模型的表現采用AUC值和F1分數來衡量。其中LR、SVM、RF模型借助Scikit-Learn機器學習庫進行訓練,Xgboost模型是借助xgboost庫進行訓練。其中在訓練Xgboost模型時,先通過網格尋參法確定一組良好的參數得到模型XGB_1,接著結合bagging思想,對這組參數施加一個小范圍的隨機干擾,得到另外兩組模型XGB_2、XGB_3。最終將LR、SVM、RF、XGB_1、XGB_2、XGB_3六組模型進行融合得到Model_all。從下表中模型表現來看,集成學習方法和模型融合方法對信用評估效果有顯著的提高。

五、結束語

本文基于電子商務平臺用戶消費和支付行為數據,使用單個模型、集成模型、模型融合三種方式對訓練數據集進行擬合得到6組模型,并計算了每個模型的AUC值和F1得分,對比實驗結果可以發現:集成學習算法的信用評估效果要優于單個模型;對模型進行再次融合能進一步提高預測的效果。

參考文獻:

[1]朱曉明,劉治國.信用評分模型綜述[J].統計與決策,2007(2):103-105.

[2]Altman E I. Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy[J].The Journal of Finance,1968,23(4):589-609.

[3]WIGINTON J C. A note on the comparison of logic and discriminate models of consumer credit Behavior[J].Journal of Financial & Quantitative Analysis,1980,15(3):757-770.

作者簡介:陳浩(1993- ),男,漢族,江蘇南通人,單位:南京郵電大學經濟學院,2016級研究生,應用統計專業

主站蜘蛛池模板: 91综合色区亚洲熟妇p| 久久亚洲国产视频| 四虎影视8848永久精品| 天天躁狠狠躁| 亚洲中文字幕久久无码精品A| 777国产精品永久免费观看| 中日无码在线观看| 久久久久久久久久国产精品| 欧美综合一区二区三区| 精品久久久无码专区中文字幕| 国产精品久久久久鬼色| 免费黄色国产视频| 欧美一道本| 伊人久久久大香线蕉综合直播| 国产成人久久综合777777麻豆| 国产免费a级片| 手机精品福利在线观看| 亚州AV秘 一区二区三区| 超清无码熟妇人妻AV在线绿巨人| 国产精品视频导航| 天天爽免费视频| 中国黄色一级视频| 五月激情综合网| 欧美日韩精品综合在线一区| 国产日韩AV高潮在线| 久久久久青草大香线综合精品 | 免费看av在线网站网址| 亚洲国产成人久久精品软件| 99草精品视频| 韩日午夜在线资源一区二区| 亚洲婷婷六月| 国产在线小视频| 中文字幕在线看视频一区二区三区| 国产一区二区三区在线精品专区| 老司机aⅴ在线精品导航| 亚国产欧美在线人成| 亚洲国产中文在线二区三区免| 日本不卡在线播放| 亚洲AV永久无码精品古装片| 蜜芽国产尤物av尤物在线看| 国内精品免费| 亚洲国产日韩在线成人蜜芽| 精品国产Av电影无码久久久| 久久久国产精品无码专区| 91福利片| 亚洲精品成人福利在线电影| 色婷婷亚洲综合五月| 亚洲成aⅴ人在线观看| 国产最新无码专区在线| 国产一在线| AV在线天堂进入| 久久精品国产精品一区二区| 亚洲一级毛片在线观播放| 国产福利一区二区在线观看| 啊嗯不日本网站| 欧美成人精品一区二区| 中文字幕天无码久久精品视频免费 | 毛片大全免费观看| 久草性视频| 不卡无码网| 成人午夜视频免费看欧美| 亚洲69视频| 欧美中文字幕在线二区| 美女无遮挡被啪啪到高潮免费| 高清无码不卡视频| 亚洲成肉网| 亚洲人成网站日本片| 91精品啪在线观看国产| 欧美日韩精品在线播放| 国产永久免费视频m3u8| 欧美亚洲国产精品久久蜜芽| 91精品情国产情侣高潮对白蜜| 午夜国产小视频| 欧美一级高清片久久99| 亚洲欧美一区二区三区图片| 亚洲va在线∨a天堂va欧美va| 日韩乱码免费一区二区三区| 欧美日韩高清在线| 噜噜噜久久| 看国产毛片| 黄色网站不卡无码| 国产亚洲精品精品精品|