999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

行為軌跡及社交信息能預測用戶是否再借款嗎?
——基于網絡借貸的實證分析

2019-04-08 09:01:58繆世磊
上海財經大學學報 2019年2期
關鍵詞:特征用戶信息

黃 靜 , 繆世磊

(上海師范大學 商學院,上海 200234)

一、引 言

網絡借貸給借款人和投資人提供了直接進行資金對接的平臺,不僅為資金需求者(個人或小微企業借款人)開啟了新的融資渠道,也為資金所有者(投資人)帶來較為穩定的收益,在提高借貸對接效率的同時,也降低了交易成本。自2006年成立了第一家“宜信”公司以來,我國網絡借貸的平臺數量迅猛增長,交易規模也迅速擴大。根據行業報告的數據顯示①數據來源于融希財網出具的網貸行業月度報告,http://www.csai.cn/p2pzixun/1264720.html,2018年4月20日。,截至2018年3月底,歷史累計成交量為68 027.09億元,3月份行業成交量為1 915.65億元,正常運營平臺數為1 883家。雖然我國網絡借貸發展速度迅猛,但是目前我國網絡借貸市場仍然處于粗放式發展階段,許多借貸平臺的運營效率不高,很多投資也無法準確地找到合適的借款對象,借貸成功率較低。

與傳統線下借貸相比,網絡借貸具有小額化和高頻次的特點。據融360統計,在消費金融領域,70%以上的用戶是二次或多次借款的用戶。也就意味著,用戶在網絡借貸平臺成功借款后,往往會進行第二次或多次借款(本文統稱為“再借款”)。具有再借款意圖的用戶,通常會更在意自身的信用和聲譽,向平臺或投資人揭示其信任信號,其道德風險會更低,往往成為網絡借貸平臺的優質客戶,可為平臺創造更多的價值。因此,對網絡借貸平臺的用戶是否會“再借款”進行建模預測及特征識別,挖掘這部分優質客戶在平臺上的信息,以提取高價值客戶特征,無疑將提高借貸成功率,從而提高網絡借貸平臺的運營效率。

網絡借貸具有借貸雙方互不相識、通過互聯網直接交易以及資金交易無抵押品等特點,如何解決信息不對稱問題以保持平臺平穩、健康及高效運行,是實務界和理論界關注的焦點問題。投資人和借款人信息不對稱,借款人具有信息優勢可能產生道德風險,投資人處于信息劣勢可能產生逆向選擇(Yum等,2012;廖理等,2014)。因此,網絡借貸平臺如何加強對借款人的信息甄別,如何進行審核和篩選成為關鍵。目前,各平臺對借款人的審核方式主要還是采用傳統的認證指標,例如,通過收入認證指標、房產和車產認證指標、工作認證指標等方式(王會娟和廖理,2014)。母庸置疑,傳統的認證機制能夠在一定程度上緩解由于信息不對稱導致的道德風險問題。

然而,互聯網金融與傳統金融相比,其優勢在于互聯網渠道的網絡借貸平臺的運作過程中自動積累了大量的信息。除借貸雙方主動提供的個人信息之外,借貸平臺上記錄了所有的借貸消費信息,以及大量的借貸者的“行動軌跡”大數據,有些網絡借貸平臺給借貸雙方提供了“社會交往”功能,記錄了用戶的社會網絡關系。如何利用這些大數據,對再借款客戶信息進行挖掘分析,以弱化網絡借貸中的信息不對稱問題,提高平臺的運營效率,是值得我們研究的重點問題。國內現有研究側重于網絡借貸的模式介紹、影響因素、風險及其監管問題的研究,沒有區分首次借款用戶和再次借款用戶,忽略了對網絡借貸平臺上自我記錄所形成的大數據進行挖掘研究,特別是再借款人的“行動軌跡”以及平臺社交產生的“社會資本”信息等大數據。

本文首先采用融360網絡借貸平臺提供的千萬量級的用戶行動軌跡和社交信息大數據,利用人工智能中魯棒性非常好并且可解釋性較強的XGBoost算法,建立“是否申請再借款”的評分模型;然后,基于模型結果,對“是否申請再借款”的影響特征進行重要性排序,依據模型打分,提取重要的影響因素,并用可視化方法展示結果,以回答“用戶行為軌跡及社交信息能預測是否再借款嗎?”這一問題。本文首創性地建立“是否申請再借款”評分模型,利用網絡借貸平臺中用戶的“行為軌跡”數據和“社會資本”數據,挖掘網絡借貸平臺用戶再借款的信號揭示行為特征,可以幫助網絡借貸平臺篩選優質客戶,以提高平臺的運營效率及借貸成功率,這將有利于網絡借貸市場的長遠及穩定發展。

二、文獻綜述

既有的網絡借貸研究,按借貸雙方、借貸平臺、監管機制等參與主體可以分為三大類:第一類是關于網絡借貸行為的影響因素研究,包括借款人借款成功的決定因素以及借款利率高低的影響因素分析(Klafft,2008;Herzenstein等,2008;Iyer等,2009),也包括貸款人的風險識別能力的分析(廖理等,2014;蔣翠清等,2017);第二類是網絡借貸平臺的監管問題研究(Davis和Gelpern,2010;Slattery,2013;張國文,2014;楊振能,2014);第三類則集中于介紹網絡借貸平臺的運營模式以及存在的問題(王碩,2015;莫易嫻,2011;王修華等,2016)。

網絡借貸沒有抵押擔保,存在嚴重的信息不對稱問題,平臺或投資者完全依靠信息來判斷貸款人的信用水平以規避道德風險。既有研究中,把網絡借貸中借款人揭示其信任的信息歸為兩類,分別被稱為“硬信息”和“軟信息”。

所謂的“硬信息”是指借款人必須按照平臺要求提供的可確認、可驗證的信息,主要包括基本信息、資產信息和工作信息。例如,基本信息包括身份證號、性別、年齡、學歷以及婚姻狀況等;資產信息包含收入、車產、房產以及貸款等資產和負債情況;工作信息一般包含借款人所從事的行業、公司規模、工作年限以及工作城市等(王會娟和何琳,2014)。“硬信息”是平臺評估借款人信用等級的主要依據,成為網絡借款是否成功的關鍵因素(Herzenstein等,2008;Weiss等,2010;Iyer等,2009)。王會娟和廖理(2014)利用“人人貸”平臺的數據進行分析,結果發現平臺信用認證機制認定的信用級別越高,借款成功概率就越高,并且借款成本也越低。平臺在進行信用級別認證時,收入情況、工作情況、車產和房產等認證指標對信用認證級別影響很大。Freedman和Jin(2008)研究認為借款人在平臺上提供的財務方面的信息越多,則越容易獲取貸款,貸款人的年齡(Pope和Sydnor,2011)、性別、種族(Herzenstein等,2008)等特征都會影響借貸行為。Pope和Sydnor(2011)研究認為,35歲以下的人要比35-60歲的群體借款成功的可能性高出0.4-0.9個百分點,60歲及以上的人借款成功的可能性要比35-60歲群體低1.1-2.3個百分點。孫武軍和樊小瑩(2016)利用“人人貸”數據研究了借款人的從業經歷與教育背景對網絡借貸成功率的影響,結果認為借款人的學歷越高或工作經歷越豐富,其借貸成功率越高。

所謂的“軟信息”是指借款人自愿披露的關于自己個人的品質、經歷、性格、借款原因以及未來希望等方面的描述性信息,通過敘述性的語言由借款人自愿性地表述出來(李焰等,2014)。學者們的研究表明,描述性的軟信息在一定程度上預示著借款人的還款行為,促使投資者建立對其的信任,有助于提高貸款成功率(Herzenstein等,2011;李焰等,2014)。網絡借貸中存在嚴重的信息不對稱,借款人通過“硬信息”和“軟信息”綜合起來揭示其可信任信號,可以提高借貸市場的信息透明度,投資人通過這些信息以判斷借款人的整體信用情況,有助于抑制信息扭曲,在一定程度上可以解決信息不對稱問題(Larrimore等,2011)。

其實,網絡借貸中借助于互聯網平臺的優勢,除積累了用戶主動提供的大量的“硬信息”和“軟信息”之外,還記錄了用戶在平臺上的“行為軌跡”數據和“社會交往”數據。許多網絡借貸平臺給用戶之間提供了相互關注和交互活動的功能,產生了大量的社會關系交互數據,可以作為社會資本分析的數據。Greiner和Wang(2009)研究了借貸交易行為與社會資本之間的關系,研究發現用戶擁有越多的社會資本,其借款的成功率也就越大,借款利率也更低。可以看出,借款人在網絡借貸平臺上的歷史信息、社會資本及其行為特征,共同形成借款人的聲譽,這類似于網絡借貸平臺的無形資產,對此信息的挖掘可降低借貸雙方的談判成本(Lin等,2013),也可以降低平臺對借款人的監督成本(王博等,2017)。

綜上所述,現有研究利用借款人提供的“硬信息”或“軟信息”、用戶平臺上積累的“行為軌跡”和“社會交往”數據,重點研究和識別了網絡借貸中的借貸成功因素、利率高低的決定因素以及違約的影響因素,形成了豐富的研究成果。然而,現有文獻相對忽視了網絡借貸中“頻次高”和“重復借貸”的特點,沒有區分首次借款和再次(或多次)借款者的行為差異,導致現有研究中缺乏針對“再借款”這一類優質和忠實客戶進行信息挖掘的相關研究。本文首創性地采用數據挖掘方法,采用真實的網絡借貸微觀大樣本數據,特別是用戶“行動軌跡”信息和“社會資本”信息的挖掘,探究影響網絡借貸用戶是否會再借款的行為模式,以及所揭示出來的信任信號,以提高借貸成功率和投資者效率,為提高網絡借貸平臺運營效率創造價值。

三、研究方法及數據選擇

(一)研究方法及研究思路

評分模型的開發,一般從可解釋性、模型預測的準確性、模型的穩健性三個重要層面去思考。最常用的算法當屬Logistic回歸,其原理類似于線性回歸,優點在于可解釋性強,模型簡單,不足之處是精度一般。人工智能的相關算法也越來越多地用于評分模型的開發,比如決策樹、Ensemble Method、SVM、神經網絡等,但是這些算法都有自己很強的使用場景。相對于Logistic回歸,決策樹的精度有所提高;基于決策樹基礎之上的Ensemble Method,其開發的模型魯棒性更好;SVM一般適用于小數據集,易過度擬合;神經網絡則是一個完全的黑箱操作,可解釋性較差,而且一般適用于超大數據集。

XGBoost算法采用分布式加載數據、分布式訓練數據,同時對損失函數做了二階的泰勒展開,并在目標函數之外加入正則項整體求最優解,用以權衡目標函數的下降和模型復雜程度,避免過度擬合。XGBoost算法是在GBDT算法基礎之上改進的,是通過構建多棵樹融合的模型,屬于Ensemble Method的一種。Ensemble Methods的目標在于將幾種機器學習的算法結合或者把一種算法的不同參數組合,該算法魯棒性非常好,構建的模型也是基于樹模型的基礎之上,可解釋性較Logistic回歸稍差,但是不像神經網絡完全的黑箱操作。XGBoost算法也屬于Gradient Boost的一種,與傳統Boost的區別是,每一次的計算是為了減少上一次的殘差(residual),而為了消除殘差,我們可以在殘差減少的梯度(Gradient)方向上建立一個新的模型。在Gradient Boost中,每個新模型的建立是為了使之前模型的殘差往梯度方向減少,這與傳統Boost對正確、錯誤的樣本進行加權有著很大的區別。

本文針對網絡借貸中的借款人數據進行數據清洗、特征工程、去共線性,算法選用魯棒性非常好的XGBoost,結合CV進行十折交叉驗證,再通過PSO算法優化參數,以挖掘網絡借貸中再次借款人所具有的特征,為平臺挖掘優質用戶,特別是挖掘再次借款人的行為數據及其在平臺中的交互活動產生的社會關系交互數據,通過網貸平臺上的行動軌跡以揭示其再次借款的信號。最后,基于模型結果,對是否再借款的信息特征進行重要性排序,依據模型的打分,并給出具體的可視化展示。

(二)數據來源與指標說明

本文數據來源于融360平臺提供的26 000個用戶的脫敏數據,其中申請再借款的用戶個數與未申請再借款的用戶個數分別為12 859個和13 141個,本文目標變量為用戶是否再借款。融360是我國最大的網絡貸款平臺,平臺的一端是有借款需求的個人消費者和小微企業,另一端是有投資資金的金融機構及其提供的數百萬種金融產品,包括銀行、小貸、擔保、典當等。融360通過搜索和推薦服務來撮合借款和貸款。通常,借款用戶進入平臺后,會通過搜索和推薦服務找到合適的貸款產品,填寫自己的個人基本資料并提交貸款訂單。金融機構在平臺收到訂單后,對用戶資質進行風控審核,最終決定是否通過用戶的訂單。

詳細的變量信息說明見表1,其中包括基本信息、消費信息、行為標簽和社交關系信息:(1)用戶的基本信息數據:用戶在融360平臺上提交的基本資料,如年齡、性別、職業、教育信息等,包含用戶在平臺上多次修改個人信息的記錄,共253 006條;(2)用戶的行為軌跡數據:用戶在融360平臺的行為軌跡標簽,共687 374條;(3)用戶的借款行為信息數據:用戶在融360平臺上提交的借款申請,包括申請了什么產品、貸款額度及還款情況等記錄,共233 450條;(4)用戶的信用卡消費行為信息數據:用戶向融360平臺上申請的信用卡及信用卡消費行為的信息數據,一個用戶一般有多條信用卡消費記錄,共677 540條;(5)用戶的社會交往信息:融360為用戶提供了社交機制,用戶的“朋友數目”越多代表社會資本較多。用戶在平臺上的社交關系及關系強度通過兩個指標來揭示,用戶社交關系1,是用戶與其他用戶的關注情況,共7 367 375條;用戶社交關系2,是用戶與其他用戶的深層次關系情況,共1 989 230條。

表1 數據說明

表1所列的信息特征基本都是一個用戶存在多條記錄,總共信息維度為55維,其中user_id為用戶唯一標識。我們需要從54個維度提取出特征,這些特征要能說明用戶是否再借款。

(三)特征工程

特征工程是將原始數據轉化為特征,準備和選擇的特征越好,模型預測的結果會越好。本文進行特征工程采用的原則是:盡可能地避免清洗數據,盡量避免構建特征時的信息損失。下面說明對以上信息表進行數據清洗以及構建特征工程的方法。

針對用戶基本信息、用戶借款和信用卡消費信息,利用用戶ID(user_id)進行分組后統計各指標的相關統計量,包括最小值、最大值、求和、均值、標準差、頻數。針對用戶社交關系,將原始的用戶對應關系轉換為圖,并用圖算法,深入統計用戶的“社會資本”關系數據,挖掘第一層直接關注為好朋友的數量,以及第二層間接關注為好朋友的數量,通過程序測試,最終統計了其頻數。最終本文構建的特征工程維度為251維,包含用戶標識變量user_id。

在構建以上特征工程之后,需要進一步剔除具有高相關性的特征,為后續建模提供更高質量的數據集。Logistic回歸模型對特征共線性比較敏感,但XGBoost算法對共線性處理沒有那么強的要求,一般考慮剔除特征工程后存在的相關系數為1的變量。本文通過構建特征工程后的維度為251,去除相關系數為1的變量后,維度為193。檢查數據后發現,存在此現象的原因在于數據集的稀疏性。

四、實證分析

(一)建模步驟

為了更好地模擬實際場景,需要解決兩個問題:第一,構建一個盡可能準確的模型以預測用戶是否會再借款;第二,在模型準確性的基礎上,提取出有意義的特征,對用戶的再借款特征進行挖掘和分析。為了達到以上兩個目的,本文構建了大量的特征工程,再剔除一部分高相關的特征,通過XGBoost算法完成特征尋找的工作,為接下來構建用戶再借款預測模型提供基礎。

本文通過以下兩個步驟構建模型:第一,為了避免過擬合現象找到模型的最優參數組合,采用CV進行十折交叉驗證的方式,通過PSO算法搜索得到XGBoost模型最優參數,其中,對13個參數進行設定,調整的參數包括7個,設置保持不變的參數包括6個,最終得到模型的最優參數見表2;第二,將數據集按照7:3的方式,拆分為訓練集和測試集。

表2 模型的參數設置

表2中的參數num_round是迭代的次數,也是最終構建的樹的個數。一般選擇控制比較小的num_round,再調整其他參數,在num_round比較小的時候,是便于模型解釋的,所以XGBoost算法的可解釋性也很高。

(二)模型結果

模型的準確性評價指標很多,本文采用最常用的指標AUC值來衡量模型的好壞。本文構建的再借款模型的訓練集AUC結果為0.711 2,測試集的AUC結果為0.698 8。是否再借款的預測難度很大,AUC已達到0.7,表明該模型已能為網貸平臺提供很好的預測和決策。

接下來,本文進一步挖掘潛在的用戶特征,即具有怎樣特征的用戶會選擇再借款。通過XGBoost算法,最終進入模型的特征個數為63個,我們進一步給出是否再借款預測模型的特征重要性。依據特征重要性評分排序,圖1繪制了特征重要性的散點圖,橫軸為各特征,縱軸為評分,曲線score_feature代表的是模型給出的變量重要性評分。

圖1 XGBoost模型的特征重要性散點圖

圖1顯示了進入模型的特征評分,評分呈現急劇下降,表明能反映目標的特征很少,也說明預測用戶是否會再借款的難度很大。按重要性評分排在前18的特征主要可以歸為以下四類:第一類為用戶在平臺上對個人信息修改的“行動軌跡”記錄數據,包括排序在第1、3、5、6和9的特征。第二類為用戶在平臺上的社會交往網絡記錄信息,包括排序在第2、13和15的特征。第三類為用戶在平臺上申請貸款歷史的“行動軌跡”數據,包括排序在第4、7和15的特征。第四類為用戶的消費記錄的“行動軌跡”數據信息,包括排序在第8、10、12、14和17的特征。以上信息皆為用戶在網站上留下的“行動軌跡”數據和“社會交往”數據,借款人自身的住房、學歷、性別等“硬信息”在“是否再借款”預測模型中并沒有起到預測作用,僅“工資”特征排在重要性評分的第18項。可能的原因是,本文針對已成功申請過借款的用戶是否“再借款”進行預測,對于已成功申請過借款的用戶來說,其“硬信息”已經獲得網貸平臺和貸款人的認可,對于用戶“是否再借款”顯得不是那么重要了。

進一步地,針對重要性排名前五的特征進行描述性統計分析。如表3所示,與用戶再借款關系非常密切的前五個特征分別是:用戶的個人信息表最近一次修改的時間、用戶第一層朋友個數、用戶應用ID頻次、用戶最大月還款頻次、用戶的個人信息表修改時間的標準差。

表3 模型特征重要性排名前五變量的描述性統計分析

續表 3 模型特征重要性排名前五變量的描述性統計分析

(三)特征結果分析

通過構建XGBoost模型,我們提取了前五個與再借款行為最相關的特征,為了輔助我們理解這些特征,我們借助可視化的方法以展示這些特征與用戶是否會再借款之間的關系。需要說明的是,原始總樣本中未申請再借款與申請再借款的比例為1.022:1。

1. 第一行為特征變量“用戶的個人信息表最近一次修改被記錄的時間”

模型中最顯著的特征是max_tm_encode,該特征是指“用戶的個人信息表最近一次修改的時間”,該值越大表示時間越新,越是“近期”。如圖2所示,橫軸表示該特征值的百分位區間,分位數越大表示時間越“新”,表示用戶越在近期修改了個人信息,縱軸是用戶數量。可以看出,max_tm_encode在20分位點是個明顯的分割點,在低于20分位點以下時,未申請再借款人數與申請再借款的比例大約為4∶1,max_tm_encode在“大于20分位數”時,未申請再借款人數明顯小于申請再借款人數。這表明用戶越久未修改自己的個人信息表,越傾向于不選擇再借款,在最近修改自己的個人信息的用戶越有可能申請再借款。這也意味著,在網貸平臺上用戶越活躍,越在乎平臺上個人信息的準確性,越有可能會再次申請借款。

圖2 用戶最近一次個人信息修改時間分位數與用戶是否再借款統計圖

2. 第二社會交往特征變量“用戶的好友關注度”

用戶的好友關注度是指網絡借貸平臺上與用戶有直接關注關系的好友數量,變量名為1u_friends。如圖3所示,橫軸表示“直接關注的好友數量”的分位點區間,可以看出,數量總額在“小于10分位數”時,未申請再借款與申請再借款的比例大約為1.73:1,而數量總額在“大于90分位數”時,未申請再借款與申請再借款的比例大約為0.88:1。相對于原始數據中未申請再借款與申請再借款的比例1.022:1而言,表現出明顯的反差。該趨勢表明,傾向于再借款的用戶,擁有越多直接相關的朋友。用戶的好友關注度指標,向網絡借貸平臺傳遞一種正能量,即社會資本越多的用戶越傾向于再次申請借款。

圖3 用戶的好友關注度與用戶再借款分位數統計圖

3. 第三行為特征變量“應用ID頻次”

“tag”是融360公司提供的一個組合指標,中文解釋是“應用ID”,表3中的變量名“tag_count”指的就是用戶應用ID出現的頻次。該頻次存在大量的缺失,分位數在前50都是缺失,未申請再借款與申請再借款的比例大約為0.9:1;在后50分位數中,未申請再借款與申請再借款的比例大約為1.17:1,表明應用ID的頻次越高,再次申請借款的可能性越高。這意味著,在網絡借貸平臺上越活躍的用戶,其再次申請借款的概率越大。參見圖4。

圖4 應用ID頻次與用戶再借款分位數統計圖

4. 第四行為特征變量“用戶最大月還款頻次”

“max_month_repay”是“用戶最大月還款”。變量“max_month_repay_count”指的是用戶最大月還款出現的頻次。該頻次存在大量的0,分位數在前80值都是0,未申請再借款與申請再借款的比例大約為1.03:1,非常接近總樣本中未申請再借款與申請再借款的比例為1.022:1。而在大于90分位數時,未申請再借款與申請再借款的比例大約為0.932:1,說明用戶最大月還款的頻次越多,越傾向于申請再借款。用戶欲再次借款,為了保持良好的信用記錄,按時還款的同時,一般還款的頻次也會較多,這些行為是為了進一步向借貸平臺或投資者揭示其良好的信用。參見圖5。

圖5 用戶最大月還款頻次與用戶再借款分位數統計圖

5. 第五行為特征變量“用戶個人信息表修改時間的標準差”

用戶修改個人信息表時間的標準差,反應了用戶修改個人信息表時間的波動情況。標準差越小則數據的波動越小,表明客戶集中在某個時間段修改自己的個人信息。從圖6可以看出,在低于50分位數時,申請再借款的人數比例更高,在高于50分位數之后(90分位數除外),申請再借款人數比例下降,表明申請再借款的客戶修改個人信息表時間的標準差普遍偏小,集中在某個時間段修改自己的個人信息。比較特殊的是,在標準差大于90分位數時,申請再借款的人數比例卻較高,表明這些用戶一直在關注網貸平臺,維護平臺上的個人信息。

圖6 用戶個人信息表修改時間的標準差與用戶再借款分位數統計圖

綜上所述,網絡借貸平臺用戶的行為軌跡數據,可以歸結為兩類:一類是為了減少信息不對稱(保持良好信用)的行為,如還貸款頻次,修改個人信息的時間及其標準差,用戶為了向投資者揭示自己良好的信用而維護自己的信息和聲譽;另一類是平臺上的社會網絡層面,通過維護平臺上的社會網絡以此構建自己的社會資本,在網絡借貸平臺上的朋友關系良好,目的也是為了建立和揭示信任。因此,網絡借貸平臺通過用戶的行為軌跡,特別是能揭示其信任信號的行為信息和平臺社會網絡交流信息,可預測出用戶是否會再借款。

五、結論與建議

網絡借貸通過互聯網模式撮合了被排除在傳統銀行借貸之外的個人或小微企業之間的借貸,平臺自身積累了用戶大量的基本信息,如用戶借貸和消費的“行為軌跡”大數據,以及代表“社會資本”的社交網絡大數據。針對網絡借貸中“高頻次”、“反復借貸”的特征,本文通過數據挖掘技術建立了再借款評估模型,以分析網絡借貸中再次申請借款的用戶具有怎樣的行為軌跡和社交特征,由此挖掘平臺的優質和忠誠用戶,以幫助投資者準確判斷借款人,從而降低借貸風險,提高平臺的運營效率,也便于平臺為用戶提供更好的金融服務。具體而言,本文采用魯棒性非常好的XGBoost算法,利用網絡借貸平臺2.6萬個用戶68萬多條行為軌跡數據和社交網絡數據,首創性地建立了“用戶是否再貸款”預測模型,并對關鍵特征進行可視化分析。得出以下主要結論:(1)通過XGBoost算法構建模型,并進行十折交叉驗證,再通過PSO算法搜索最優參數,使得最終模型的訓練集AUC達到0.71。測試集的AUC將近0.7,表明本文建立的模型能為網絡借貸平臺針對用戶“是否會再次申請借款”提供很好的預測。(2)網絡借貸平臺中用戶是否會申請再借款,與用戶的個人基本信息(“硬信息”)的關系并不是很強,反而是用戶在平臺上的借貸和消費的“行為軌跡”信息,以及在平臺上的社會交往行為的社會資本類信息,更具有信任信號的揭示作用,預測能力更強。(3)在網絡借貸平臺上積極維護個人信息、保持自己良好的還款記錄的用戶,再次申請借款的可能性很高。用戶最近一次修改個人信息的時間越近、用戶應用ID頻次越高、用戶最大月還款的頻次越高,越有可能申請再借款,成為網貸平臺上的忠實用戶。這也意味著,在網絡借貸中想要多次申請借款的用戶更須注重建立和保持自己良好的信用,揭示信任信號,以便在多次借貸博弈中成本最小化。(4)在網絡借貸平臺上關注的朋友數量越多,具有良好社會資本,積極維護自己社會網絡關系的用戶,再次申請貸款的可能性也更高。借款人通過平臺的社交網絡關系構建社會資本,向投資者揭示自身的聲譽信號,這類用戶往往再次申請借款,成為平臺的優質客戶。

綜上所述,網絡借貸平臺可借助自身的互聯網和大數據優勢,通過強化借款人的約束機制、放大借款人的聲譽機制,通過數據挖掘以降低信息不對稱,提高交易效率。一方面,通過構建更豐富的社會網絡交流平臺,或者直接與大型社交網絡(例如微信、QQ等)相聯通,以獲取用戶的社交網絡大數據,通過社會資本數據揭示信任信號;另一方面,網絡借貸平臺應該加大信息的有效挖掘和披露,通過挖掘用戶潛在的行為軌跡和社會網絡關系,利用互聯網渠道和大數據技術來降低信息不對稱,降低投資者的搜尋成本,不僅可提高交易效率還可以吸引更多的投資者。

行業協會可致力于各個網絡平臺打破信息孤島,建立網絡借貸的黑名單制度,構建互聯網金融信用體系,加大對失信借款人的處罰力度和約束機制。這都有助于抑制借款人的短期投機行為,增強借款人維護自身聲譽的動機,放大聲譽的激勵機制,防止網貸市場出現“劣幣驅逐良幣”現角,促進網絡借貸市場的健康良性發展。

猜你喜歡
特征用戶信息
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
線性代數的應用特征
河南科技(2014年23期)2014-02-27 14:19:15
主站蜘蛛池模板: 青青草原国产一区二区| 日本亚洲欧美在线| 国产精品任我爽爆在线播放6080 | 色哟哟国产精品一区二区| 97综合久久| 91青青草视频在线观看的| 免费看黄片一区二区三区| 九色在线观看视频| 自慰网址在线观看| 国产打屁股免费区网站| 国产无码精品在线| 91黄色在线观看| 91欧美在线| 四虎国产精品永久一区| 国产三级国产精品国产普男人| 首页亚洲国产丝袜长腿综合| 毛片国产精品完整版| 9cao视频精品| 国产三级毛片| 国产午夜人做人免费视频中文| 操美女免费网站| 欧美日韩资源| 九九热视频精品在线| 亚洲日韩Av中文字幕无码| 亚洲精品第五页| 国产精品嫩草影院视频| 亚洲人成网站色7799在线播放 | 伊人大杳蕉中文无码| 99re经典视频在线| 欧美色香蕉| 成人综合在线观看| 亚洲精品制服丝袜二区| 动漫精品中文字幕无码| 国产成人久久综合777777麻豆| 欧美一区精品| 九色综合视频网| 欧美区国产区| 久久精品国产一区二区小说| 伊人丁香五月天久久综合| 亚洲精品国产首次亮相| 国产精品精品视频| 在线免费无码视频| 青草免费在线观看| 亚洲天堂成人| 精品国产美女福到在线不卡f| 扒开粉嫩的小缝隙喷白浆视频| 99人体免费视频| 五月婷婷中文字幕| 中字无码av在线电影| jizz亚洲高清在线观看| 精久久久久无码区中文字幕| 久久视精品| 成人福利在线视频| 久久精品嫩草研究院| 手机在线看片不卡中文字幕| 国产真实乱人视频| 亚洲精品日产精品乱码不卡| 手机在线免费不卡一区二| 男女男免费视频网站国产| 欧美啪啪视频免码| 青青草原国产精品啪啪视频| 久久免费视频6| 色老二精品视频在线观看| 成人在线综合| 亚洲成A人V欧美综合天堂| 国产精品无码翘臀在线看纯欲| 亚洲高清在线播放| 四虎影视库国产精品一区| 国产黑丝一区| 国产在线麻豆波多野结衣| 日本精品一在线观看视频| 亚洲色图另类| 福利视频一区| 91精品小视频| 午夜视频免费试看| 亚洲aaa视频| 成人蜜桃网| 波多野结衣无码中文字幕在线观看一区二区 | 久久综合AV免费观看| 久久久噜噜噜久久中文字幕色伊伊 | 欧美亚洲欧美区| 国产精品人成在线播放|