999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

關于金融機構個人貸款的需求預測

2020-09-10 10:37:28陳方圓
商業(yè)2.0-市場與監(jiān)管 2020年2期
關鍵詞:互聯(lián)網(wǎng)金融大數(shù)據(jù)

摘要:金融機構小額信用貸款產(chǎn)品是個人金融業(yè)務的一種,以其方便、快捷的特性深受用戶喜愛。該產(chǎn)品通過預審批機制為用戶提供特定額度的貸款服務,金融機構除了要評估用戶的風險之外,還需要預測用戶的借款需求,以此來準備合適的額度,降低資金占用成本,同時提升用戶使用體驗。本文借助于大數(shù)據(jù)的專業(yè)技術手段,通過引入一些數(shù)據(jù)挖掘算法,嘗試對用戶的信貸需求進行準確的預測,旨在用互聯(lián)網(wǎng)金融的思路為上述問題提供理性地判斷和一種科學解決方案。

關鍵詞:個人貸款;信用貸款;互聯(lián)網(wǎng)金融;大數(shù)據(jù);線性回歸;GBDT

1.研究背景

近年來,針對個人用戶的小額信用貸款已成為一項成熟的業(yè)務,目前發(fā)展勢頭良好。此類業(yè)務多通過手機客戶端來進行操作,一些金融機構,如銀行、互聯(lián)網(wǎng)金融機構利用個人用戶預留的基本信息和一些歷史信息等來對用戶的個人征信及貸款額度進行評估,自動生成貸款方案,多數(shù)情況下不需要人為介入。此項業(yè)務由于辦理快捷、流程簡單,深受廣大用戶特別是年輕用戶的青睞。其業(yè)務規(guī)模不斷擴大,同時競爭亦日益加深。

“某借”是某金融機構旗下的一款小額信用貸款產(chǎn)品,該產(chǎn)品使用起來簡單、快捷,申請人只需要經(jīng)過少量的操作即可進行在線貸款申請。在開展這類信貸業(yè)務的時候,除了要評估用戶的信貸風險之外,還需要預測用戶的借款需求。只有盡可能的給有借款需求的用戶分配合適的額度,才能最大限度的增加資金利用率,降低成本并增加收益。精準的對目標客戶進行匹配,預測用戶的信貸需求是此類產(chǎn)品運營的核心問題之一。

本文將通過對“某借”中用戶的基本信息和歷史操作等信息進行整合,運用線性回歸、決策樹、提升算法等數(shù)據(jù)挖掘方法,建立有效的模型,對未來一個月內(nèi)該平臺用戶的借款總金額進行預測,并將預測結(jié)果同真實值進行比較,確定模型的效果。

2.數(shù)據(jù)描述及特征建立

本文的目的是基于可獲取的客戶信息,如基本信息、歷史信息等,來對未來短時間內(nèi)不確定的需求進行預測。本文的數(shù)據(jù)從某金融平臺獲取,包含用戶的基本信息和部分其他信息。本文的目的是預測下個月每個用戶的借款總額,由于目標是數(shù)量型特征,使用均方誤差(MSE)作為模型效果的評估標準。通過對數(shù)據(jù)的整理,構建了如表1所示的特征。其中用戶ID和次月借款合計不參與模型構建,用戶ID僅用于標識客戶,次月借款合計用于評估模型效果。

3.利用線性回歸構建模型

在本文中,因變量為次月借款合計,由于因變量為數(shù)量型特征,可以考慮從較為簡單的回歸模型入手。線性回歸模型是一種基礎的統(tǒng)計模型,模型要求數(shù)據(jù)必須滿足基本假設,即因變量符合正態(tài)性、等方差性及獨立性。另外線性回歸模型受異常值和多重共線性影響較大,建模之前需要先去掉異常值點及多重共線性變量。

經(jīng)檢查,數(shù)據(jù)基本符合正態(tài)分布鐘形曲線的形狀,可使嘗試使用線性回歸模型進行分析。直接將特征數(shù)據(jù)帶入逐步線性回歸模型。第一次回歸后,去掉性別特征后AIC下降最多,因此去掉該特征繼續(xù)計算回歸系數(shù)。同理依次去掉歷史借款中值、年齡段2項特征,待AIC不再下降時,得到最終的回歸方程。

在結(jié)果中,回歸系數(shù)基本都通過了檢驗,總體p值接近于0,模型效果尚可。其中初始額度、歷史借款合計、歷史消費合計和頁面點擊次數(shù)對因變量是正相關的,其余特征都為負相關。對此的理解是直觀的,用戶的額度越高、歷史借款量越大、歷史消費越多、相關頁面瀏覽次數(shù)越多,可能發(fā)生的借款金額就會越大。

接下來對線性回歸模型的基本假設做一些分析,如圖1所示。數(shù)據(jù)中的異常點幾乎緊靠數(shù)據(jù)的主體部分,因此可以認為這些只是數(shù)據(jù)中的一些極端數(shù)值,并未達到異常的水平。可以看出模型的殘差有一個明顯的旋轉(zhuǎn),若無旋轉(zhuǎn),殘差是基本滿足正態(tài)性、同方差性和獨立性的。這主要是因為數(shù)據(jù)中借款合計為0的用戶比較多,約占總數(shù)據(jù)量的2/3,在建模時這部分數(shù)據(jù)對回歸直線有很明顯的下拉作用,導致回歸直線發(fā)生旋轉(zhuǎn),進而造成殘差旋轉(zhuǎn)。并且模型對這部分用戶的預測值基本上都大于0,因此殘差都為負數(shù),這就造成了其余殘差基本都大于0,形成了圖2中左邊兩幅圖細線條和粗線段帶分離的情況。

通過計算,得到線性回歸模型的MSE=3.343997。處理類似本文中帶偏折的數(shù)據(jù)時,采用分位數(shù)回歸一般可改善效果,但經(jīng)過建模得到分位數(shù)回歸模型的MSE=3.694761,效果不如線性回歸模型。這可能是因為借款總額為0的用戶占更大部分,在分位數(shù)回歸扭正殘差的同時,擴大了這部分用戶預測的殘差。面對如此復雜的數(shù)據(jù),線性回歸模型肯定達不到最好的效果,繼續(xù)嘗試改進模型。

4.利用GBDT建立模型

GBDT模型是此類問題的一個優(yōu)良的解決方案。GBDT模型有迭代次數(shù)和優(yōu)化步長兩個比較重要的參數(shù)。迭代次數(shù)表示模型繼續(xù)計算的最大次數(shù)M,優(yōu)化步長表示模型每次擬合時對殘差擬合的細度。一般情況下先設定一個比較大的迭代次數(shù)和比較小的優(yōu)化步長,通過觀察殘差的變化來選擇最合適的參數(shù)數(shù)值。

無論優(yōu)化步長取何值,殘差都是隨著迭代次數(shù)的增加先下降后上升的,存在最低點。隨著優(yōu)化步長的減少,殘差達到最低點需要的迭代次數(shù)越來越多,并且殘差能達到的最小值也在逐漸下降。隨著模型的迭代次數(shù)繼續(xù)增加及優(yōu)化步長繼續(xù)減少,殘差的最小值會不斷下降,但下降的幅度越來越少,并且計算代價呈平方關系上升。實踐中會選取殘差、迭代次數(shù)和優(yōu)化步長都在可接受范圍內(nèi)的數(shù)值建立模型,使得模型可在有限時間內(nèi)計算出結(jié)果,殘差也較為接近理論最小值。

設定迭代次數(shù)為3000,優(yōu)化步長為0.01建立GBDT模型。當?shù)螖?shù)達到2095次時,模型殘差達到最小。由于優(yōu)化步長已設置為較小的數(shù),且計算時間可以接受,本文就使用2095的迭代次數(shù)和0.01的優(yōu)化步長建立模型。生成模型后,帶入特征數(shù)據(jù)計算所有用戶次月借款合計預測值,與實際值進行比較,計算MSE=3.20099,效果較回歸模型有所提高。

5.總結(jié)

本文從小額信用貸款這樣一個具體的、實際的業(yè)務出發(fā),對產(chǎn)品運營中客戶需求這個核心問題進行研究,目的在于利用已有的基本信息和歷史信息,對用戶將來潛在的需求進行預測。本文根據(jù)數(shù)據(jù)的特征,首先采用了較為簡單的線性回歸模型,并通過GBDT模型進行優(yōu)化,使得預測效果得到提高,取得了良好的效果。

隨著金融市場化的不斷推進,依托大數(shù)據(jù)和互聯(lián)網(wǎng)金融的發(fā)展,傳統(tǒng)的人工作業(yè)模式越來越被市場所淘汰,取而代之的是更精準、更高效的客戶營銷機制。本文通過對一系列數(shù)據(jù)挖掘算法的引入,既考慮到大數(shù)據(jù)的應用,通過智能算法精準定制產(chǎn)品,提升用戶的使用體驗,同時也展現(xiàn)了理論模型在實際數(shù)據(jù)中的表現(xiàn)。更重要的是,本文為金融機構關心的增加資金利用率、降低成本并增加收益等問題,提供了一個解決問題的思路。

參考文獻:

[1]L.I.Breiman,J.H.Friedman,R.A.Olshen,and C.J. Stone. Classification and Regression Trees (CART). Encyclopedia of Ecology,40(3):582-588, 1984.

[2]Mayo Foundation Terry M.Therneau, Elizabeth J. Atkinson.An Introduction to Recursive Partitioning Using the RPART Routines. CRAN, 2018.

[3]Jerome H.Friedman. Greedy Function Approximation: A Gra- dient Boosting Machine. Annals of Statistics, 29(5):1189-1232,2001.

[4]Greg Ridgeway.Generalized Boosted Models:A guide to the gbm package.CRAN,2018.

[5]Tianqi Chen and Carlos Guestrin.XGBoost: A Scalable Tree Boosting System. pages 785-794,2016.

[6]Guolin Ke,Qi Meng,Thomas Finely, Taifeng Wang, Wei Chen, Weidong Ma,Qiwei Ye,and Tie-Yan Liu.LightGBM:A Highly Efficient Gradient Boosting Decision Tree.2017.

[7]張瀟,韋增欣,楊天山.GBDT組合模型在股票預測中的應用. 海南師范大學學報,(1),2018.

[8]馬曉君,沙靖嵐,牛雪琪.基于LightGBM 算法的 P2P 項目信用評級模型的設計及應用.數(shù)量經(jīng)濟技術經(jīng)濟研究,(5), 2018.

作者簡介:陳方圓(1989.6-),女,研究生,研究方向:金融學。

猜你喜歡
互聯(lián)網(wǎng)金融大數(shù)據(jù)
互聯(lián)網(wǎng)金融背景下農(nóng)村手機銀行發(fā)展現(xiàn)狀研究
中國市場(2016年33期)2016-10-18 12:58:55
淺析我國商業(yè)銀行應對互聯(lián)網(wǎng)金融沖擊的對策
商(2016年27期)2016-10-17 05:57:47
大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
新聞世界(2016年10期)2016-10-11 20:13:53
互聯(lián)網(wǎng)金融的風險分析與管理
互聯(lián)網(wǎng)金融理財產(chǎn)品分析
互聯(lián)網(wǎng)金融對傳統(tǒng)金融的影響
基于大數(shù)據(jù)背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉(zhuǎn)型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 欧美中日韩在线| 特级精品毛片免费观看| 久久无码av一区二区三区| 在线观看无码av五月花| 亚亚洲乱码一二三四区| 国产精品伦视频观看免费| 国产高清不卡| 国产综合精品日本亚洲777| 日本午夜精品一本在线观看 | 5388国产亚洲欧美在线观看| 中文字幕啪啪| 婷婷激情亚洲| 亚洲男人天堂网址| 午夜老司机永久免费看片| 亚洲欧洲日产国码无码av喷潮| 亚洲第一极品精品无码| 国产日韩丝袜一二三区| 夜夜爽免费视频| 久久99国产精品成人欧美| 日本黄色a视频| 国产福利拍拍拍| 国产日韩丝袜一二三区| 国产高清国内精品福利| 国禁国产you女视频网站| 欧美特黄一免在线观看| 亚洲伦理一区二区| 乱人伦99久久| 国产在线自揄拍揄视频网站| 国产精品女人呻吟在线观看| 色噜噜综合网| www.91中文字幕| 国产成人亚洲精品蜜芽影院| 免费无码又爽又黄又刺激网站| 91视频99| 中文字幕在线播放不卡| 久久6免费视频| 91精品福利自产拍在线观看| 丁香婷婷综合激情| 亚洲欧美日韩精品专区| 思思热精品在线8| 五月婷婷丁香综合| 丁香婷婷久久| 97超碰精品成人国产| 一级黄色网站在线免费看| 国产高颜值露脸在线观看| 精品无码国产自产野外拍在线| 香蕉视频在线观看www| 成人国产免费| 亚洲欧美在线综合图区| 人妻一区二区三区无码精品一区| 99热这里只有精品在线播放| 青青草国产一区二区三区| 毛片在线播放a| 国产精品网曝门免费视频| 国产福利一区视频| 91精选国产大片| 亚洲免费毛片| 色窝窝免费一区二区三区 | 亚洲精品成人7777在线观看| 一级毛片网| 欧美一区二区三区国产精品| 国产办公室秘书无码精品| 国产黄网永久免费| 成人年鲁鲁在线观看视频| 久久香蕉国产线| 国产99视频免费精品是看6| lhav亚洲精品| julia中文字幕久久亚洲| 99久久精品国产精品亚洲| 欧美在线国产| 五月天久久综合| 99热在线只有精品| 亚洲欧美综合另类图片小说区| 好紧好深好大乳无码中文字幕| 99人体免费视频| 在线观看91香蕉国产免费| 免费人成网站在线高清| 国产99久久亚洲综合精品西瓜tv| 亚洲精品日产精品乱码不卡| 久久五月视频| 美女被躁出白浆视频播放| 中文字幕在线看视频一区二区三区|