999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

住房貸款客戶信用狀況與個人信息的關聯分析

2017-09-05 10:18:48王國柏
大陸橋視野·下 2017年7期
關鍵詞:關聯分析

王國柏

【摘 要】針對我國住房貸款擔保公司信貸資產質量下降和風險加大的客觀情況,本文利用Apriori算法對住房貸款擔保公司個人信貸數據進行了關聯分析,分析和挖掘出客戶數據中屬性的頻繁模式和關聯關系。分析結果表明,收入、教育水平、職業和貸款利率是影響住房貸款客戶信用等級的四個重要依據,擔保公司在評估一個新客戶的信用風險等級時,要重點考慮和評估這四個因素。

【關鍵字】住房貸款;信用等級;風險分析;關聯規則;Apriori算法

一、緒論

近年來,信貸資產質量下降日趨成為住房貸款擔保行業一個亟待解決的重要問題。因而,針對我國住房貸款擔保公司信貸資產質量下降和風險加大的客觀情況,建立完善的信用風險管控機制已成為刻不容緩的任務。大量研究表明,分析影響貸款客戶信用等級的因素,在貸款前對客戶進行信用評估是降低住房貸款擔保公司風險的有效方式。隨著科技的發展,住房置業擔保公司積累了大量的貸款客戶數據,建立了相應的數據倉庫。并基于該數據倉庫,利用數據挖掘、大數據分析和可視化等技術,逐步展開分析,以期挖掘和分析出數據中隱含的、有價值的信息,并基于此建立客戶信用評估指標和模型,以指導對未來貸款客戶信用的風險評估和決策。

關聯規則是數據挖掘技術的一種經典方法,其可用于從大量數據中分析和挖掘出屬性之間的關聯和相關聯系。本文利用關聯規則分析方法:Apriori算法,對某住房貸款擔保公司個人信貸數據進行分析,得出與信用等級最為相關的客戶信息。通過Apriori算法的關聯分析,本文從實際貸款客戶數據集中,挖掘、分析出信用等級和客戶屬性之間的關系特征;然后,基于這些規則建立風險評估模型,并預測新的客戶樣本數據的信用風險。由于規則來源于實際數據,因此挖掘到的規則具有良好的客觀性和準確性,可以作為預測和分析貸款客戶信用等級的決策依據。

二 、Apriori算法

數據挖掘技術中的關聯規則方法,主要是用于挖掘發現大量數據中項集之間的關聯或相關聯系。在現實世界中,一件事情的發生,在很大概率上,也會引起另外一件事情的發生。或者說,這兩件事情是是相互關聯的,在很多時候常常會一起發生。那么人們通過分析,可以發現得到相關兩件事情間的這種關聯規則。可以由一件事情的發生來,來推測另外一件事情的發生,從而更好地了解和掌握事物的發展、動向等等。這種過程就是關聯規則分析。常用的關聯規則的算法有算法、算法等。

本文主要是運用算法實現對數據的分析:算法是一種最為常用的挖掘布爾關聯規則的算法。主要步驟如下:(1)輸入數據集,并計算含有一個元素的項目集出現的頻率,找出那些大于最小支持度的項目集,得到一維最大項目集,生成一維頻繁集。(2)進行連接運算,生成二維候選集;再根據預先給定的最小支持度,生成二維頻繁集。(3)重復上述過程,直到生成M維頻繁集,并且不能再生成滿足最小支持度的項目集。在以上過程中需要注意:若存在維候選集,其中某個元素的子集不是維頻繁集,則該候選集將被刪除。

本文中所涉及的通過算法所建立的住房置業客戶信用關聯模式,是通過對實際用戶的具體數據進行分析,分析和建立客戶各個屬性與信用等級之間的關系,挖掘出對信用最用重要的指標因素,建立貸款用戶信用等級的客觀評價指標模型,以方便的為解決同樣的問題提供快速的分析結果,幫助住房置業擔保企業做出更科學、更合理的決策。

三、基于Apriori算法的客戶信用大數據關聯分析

就目前而言,在金融行業企業中,尤其是住房貸款擔保公司需要成功預測貸款客戶的信用等級。一旦獲得了用戶信用等級的準確信息,住房貸款擔保公司就可以發現信用等級較低的用戶,從而改善自身的決策,拒絕為信用等級較低的客戶做信用擔保。從而規避由于客戶延期還款、惡意欠款而帶來的擔保公司的經濟損失。目前市場上同類型的系統缺乏,應用還不廣泛,住房擔保公司還是通過經驗來判斷客戶的信用等級,十分不科學。需要能夠判斷用戶信用等級的軟件來幫助住房貸款擔保公司來做出正確的決策。

(一)數據預處理

住房擔保數據挖掘系統需要實際應用在住房置業擔保公司中,因此,本文所采用的數據集為擔保公司近十年來在經營過程中所積累的用戶數據。該數據集的數據量規模較大,能夠真實的體現住房置業擔保公司客戶的實際信用情況。但是,由于實際經營中獲取的數據存在一定程度的冗余信息,不是全部內容都對關聯分析有意義,因此,一開始需要對數據集進行數據預處理操作。數據預處理是一個關鍵而繁瑣的過程,處理結果的好壞直接影響后續關聯分析的運行速度和準確性。本文的數據預處理操作主要從以下幾個方面進行。

1.去掉無關的屬性。現有數據庫中客戶的屬性多達數十個,本文通過深入分析發現,部分屬性與個人信用評估關系不大。例如,姓名、現住地址、購房地址、手機號碼、單位名稱、合同編號等屬性明顯對于數據分析意義不大。因此,為提高關聯分析的效率,本文把這些屬性直接從數據表中刪除。

2.選取屬性。根據用戶屬性與用戶信用等級的相關性,本文選取了性別、月收入、學歷、房屋價格、房源、貸款利息、還款方式、貸款時間、客戶級別八個屬性進行關聯分析。

3.屬性量化。為減少計算的復雜程度,簡化系統的結果,要對有關屬性進行量化處理。在上述八個屬性中,五個屬性為量化屬性,包括性別、學歷、房源、貸款利息、還款方式、客戶級別。為了方便進一步分析,本文對月收入、房屋價格、貸款時間三個屬性根據以下條件進行量化,具體如下:①月收入的量化。如果“月收入>=5000”,則量化結果為高;如果“月收入<5000”,則量化結果為低。②房屋價格量化。如果“房屋價格>200萬”,則量化結果為高;如果“100萬<房屋價格<200萬”,則量化結果為中;如果“房屋價格<100萬”,則量化結果為低。③貸款時間量化。如果“貸款時間>5年”,則量化結果為長;如果“1年<貸款時間<5年”量化結果為中;如果 “貸款時間<1年”,量化結果為短。endprint

4.數據抽取。本文進行關聯分析所用的數據集,是住房置業擔保公司所提供的真實數據,共包含65536條數據。每條數據包含多個屬性,具體如下:gender代表住房貸款擔保客戶的性別;monthly_income2代表客戶的月收入;education代表客戶的受教育程度;house_totle_cost代表房屋的總花費,jf代表購買房源的類型;bank_loan_interest_rate代表銀行貸款利率;repayment_type代表還款方式;loan_duration代表貸款期限;kehujibie2代表客戶的信用級別。

(二)關聯分析

本文采用weka軟件系統,對貸款客戶信用數據進行關聯分析,運行結果如圖1所示:

圖1關聯分析結果

從關聯分析結果可以得出以下結論。

1.貸款客戶的信用等級狀況與其收入狀況(主要是指收入水平、和收入穩定性)密切相關。貸款人的收入水平越高、收入來源越穩定,其所具有的信用等級越高。可以說,收入穩定性和收入水平是衡量貸款客戶還款信用的最重要指標。顯然,本文衡量客戶信用狀況的收入是指其合法的收入。

2.貸款客戶所受到的教育水平也是衡量其信用狀況的一個重要指標。這時因為,在一般情況下,一個人的道德素養在很大程度上取決于其所受到的教育水平。教育程度良好的人會非常注重維護個人的信譽,更加遵守法律和道德規范。也就是說,這些人具備較高的自我約束能力,具有更好的信用度。相反,教育程度低的人往往會意識不到信用的重要性,繼而比較缺乏信用意識,其違約還款的可能性會比較大。

3.就職狀況與客戶的信用相關。一方面,貸款客戶所從事的職業的種類,直接決定著其收入的高低和收入的穩定性。另一方面,從事職業也在很大程度上影響著一個人的誠信。從事不同的職業,意味著其在住房公積金、福利、醫療失業保險、退休金等方面的待遇是不同的。因此,在客戶還款信用評估中,職業狀況也是一個重要指標。在評估過程中,公務員、教師、事業單位的優先級會比其它職業要高,這時因為這些行業的工資、待遇和工作穩定性更加有保障。并且,從事這些行業的人會更加重視誠實和信譽,具備更好的信用等級。除以上職業外,一般來說,從事壟斷行業和成長期行業職工的也屬于高收入水平且工作性質也相對穩定,因此在信用評估過程中,這些行業職工的信用等級也較高,

4.銀行利率與還款信用相關。從以上的關聯分析還可以看出,客戶的還款信用等級與住房貸款的利率成反比。貸款利率越高,貸款客戶的還款信用等級越低。反之,住房貸款的利率越低,貸款客戶的還款信用等級就越高。這是因為,當貸款利率增加時,客戶在貸款期間需要償還的金額就越多,其償還能力有可能不能滿足償還的要求。然而銀行利率較低時,貸款客戶所需要償還的金額就比較少,信用等級會更高一些。

除上述的四個因素外,貸款客戶的還款信用等級還受到以下多個指標的影響:總房價的高低、年齡、婚姻狀況、以及個人所處社會環境、信用履歷等。這些指標也為住房貸款擔保公司做出決策起到一定的作用,在建立風險模式時要給予考慮。

四、 結論

針對住房貸款風險問題,本文利用算法對住房貸款擔保公司個人信貸數據進行了分析,分析和挖掘出客戶數據中屬性的頻繁模式和關聯關系。分析結果表明:影響住房置業擔保企業客戶信用的最重要因素是貸款客戶收入狀況,主要是包括收入水平和收入穩定性兩個指標。收入越高、穩定性越好的客戶,其違約的風險越小,還款的信用等級會越高;其次,教育水平的高低是評估客戶信用狀況的一個重要因素,這是因為所受教育的水平,不僅決定了客戶收入狀況,還影響著其所具備的個人誠信觀念。貸款客戶所從事的職業也是評估貸款客戶信用等級的一個重要因素。另外,銀行的貸款利率水平也在一定程度上影響著客戶償還貸款的信用。可以說,收入、教育水平、職業和貸款利率是影響住房貸款客戶信用等級的四個重要依據,擔保公司在評估一個新客戶的信用風險等級時,要重點考慮和評估這四個因素。本文的數據關聯規則來源于實際數據分析,具有良好的客觀性和準確性,可以作為預測和分析貸款客戶信用等級的決策依據。

參考文獻:

[1]于卓. 應用決策樹構建個人住房貸款風險評估模型[D]. 東北財經大學, 2007.

[2]劉順挺. 基于數據挖掘技術的個人信用評估模型[D]. 南京理工大學, 2007.

[3]金豆. 數據挖掘技術在資產管理系統中的應用[D]. 長春理工大學, 2010.

[4]張翠翠, 阮樹驊. 用于短頻繁項的隱私保護關聯規則挖掘方法[J]. 電子科技, 2016(5):88-92.

[5]許麗莉, XuLili. 基于信用等級遷移和違約損失的貸款定價[J]. 湘南學院學報, 2016, 37(2):7-11.endprint

猜你喜歡
關聯分析
不懼于新,不困于形——一道函數“關聯”題的剖析與拓展
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
隱蔽失效適航要求符合性驗證分析
“一帶一路”遞進,關聯民生更緊
當代陜西(2019年15期)2019-09-02 01:52:00
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
奇趣搭配
智趣
讀者(2017年5期)2017-02-15 18:04:18
電力系統及其自動化發展趨勢分析
中西醫結合治療抑郁癥100例分析
在線教育與MOOC的比較分析
主站蜘蛛池模板: 国产又粗又猛又爽| 国产精品分类视频分类一区| 青青青国产在线播放| 日韩国产精品无码一区二区三区| 国产欧美精品一区二区| 亚洲AV无码一区二区三区牲色| 欧美第二区| 97在线公开视频| 亚洲综合专区| 最新国产成人剧情在线播放| 日韩美一区二区| 99久久成人国产精品免费| 国产精品自在在线午夜| 国产精品久久久久久影院| 欧美在线伊人| 怡红院美国分院一区二区| 精久久久久无码区中文字幕| 欧亚日韩Av| 91欧美亚洲国产五月天| 国产麻豆精品久久一二三| 自拍欧美亚洲| 国产精品主播| 无遮挡国产高潮视频免费观看| 中文无码精品A∨在线观看不卡 | 精品人妻一区无码视频| 白浆视频在线观看| 亚洲欧美在线精品一区二区| 不卡视频国产| 亚洲精品无码抽插日韩| 久久国产精品夜色| 国产成人91精品| 婷婷五月在线| 2021国产精品自产拍在线| 欧美成人区| a级毛片免费在线观看| 五月丁香伊人啪啪手机免费观看| 国产在线98福利播放视频免费| 欧美综合中文字幕久久| 国产丝袜无码精品| 91亚洲免费| 日韩欧美中文| 日本高清免费不卡视频| 99热精品久久| 欧美曰批视频免费播放免费| 久久精品嫩草研究院| 亚洲男人的天堂久久精品| 真实国产精品vr专区| 天天综合天天综合| 欧美日本二区| 视频二区国产精品职场同事| 婷婷色中文| 爆乳熟妇一区二区三区| 亚洲综合网在线观看| 狠狠色狠狠色综合久久第一次| 久久精品女人天堂aaa| 97超级碰碰碰碰精品| 亚洲欧洲自拍拍偷午夜色| 亚洲精品第一在线观看视频| 伊人久久婷婷五月综合97色| 久久精品中文字幕少妇| 麻豆国产在线观看一区二区| 国产亚洲现在一区二区中文| 午夜日b视频| 乱系列中文字幕在线视频| 亚洲娇小与黑人巨大交| 国产精品自在在线午夜| 国产区精品高清在线观看| 69av在线| 精品视频91| 国产精品人成在线播放| 88av在线播放| 国产高清不卡| 香蕉伊思人视频| 亚洲一区毛片| 福利在线不卡| 欧美国产日韩在线| 欧美日韩精品在线播放| 色妞www精品视频一级下载| 日本精品αv中文字幕| 亚洲国产亚综合在线区| 精品黑人一区二区三区| 无码精品国产VA在线观看DVD |