吳燁
【摘 要】近些年來,在人工智能快速發展的背景下,深入研究機器學習以及將其放在不同的領域內進行研究已經變得愈發重要,其中機器學習在風險評估領域中的研究,已經越來越受到國家和社會各行各業的重視。在信用風險里,信用評估毫無疑問是信用貸款過程里最重要的一環,它是指使用一些方法對借款人信用狀況進行評估的一種活動。信用評估作為風險管理中的核心評估工具,在過去幾十年中被廣泛應用于金融行業中。當有人申請信用、抵押貸款等信貸產品時,金融機構需要區分“好”客戶和“壞”客戶。信用評分系統會對客戶的特征進行評估,并將其分配為“信用評分”,這與授予信用后客戶未來違約的概率密切相關。其中風險分析作為非常關鍵的一步,是提高信貸安全性的源頭。本文將詳細介紹風險分析的概念、基本過程,為學習機器學習的風險評估研究人員提供指導。
【關鍵詞】機器學習;風險評估
互聯網時代,人們制造、收集了大量的數據,如何從這些數據中抽取出有價值的信息是一個非常值得研究的課題。現在也是個“數據為王”的年代,各個公司都在瘋狂得搜集用戶數據,個人信息、使用習慣、搜索記錄、觀看記錄甚至電子郵件內容希望能從中發現用戶的喜好,挖掘用戶的需求。可謂誰擁有數據,誰就有下一個機會。然而光有這些數據是不夠的,海量的數據已經超出了直接計算的可行性,想要從中高效地提取信息就需要專門的學習算法,這就是機器學習的作用所在。我們需要機器學習算法,避免我們"迷失"在數據中,而找到更多的可用信息。在互聯網金融繁榮發展的今天,消費信貸業務的橫生,央行征信數據在時效、全面、層次等方面的不足日益凸顯,深度挖掘分析互聯網行為數據,利用現代機器學習技術,開發大數據信用風險評估模型顯得尤為重要。
一、機器學習
機器學習就是通過各種算法對海量的歷史數據進行有人監督或無人監督的學習分析,總結規律,并利用分析結果對未來數據進行預測的一種技術。機器學習具有很好的處理非線性分類問題的能力,基于機器學習的風險評估模式能有效提高風險評估的精確度與適用性。機器學習目前有很多的應用方向,包括模式識別、圖像識別、智能決策等。機器學習是人工智能的一個分支,它可以在不進行詳盡編程的情況下,自行學習數據中的規律,以了解數據中的本質,并對于新的數據作出準確的預測。該領域的研究還包括自然語言處理、圖像識別等。在各學科領域都擁有海量數據的背景下,機器學習算法能夠很好地從數據中找到人工無法找到的普遍規律,其預測能力一般超出了人類智能運用過往經驗來預測的表現。在企業管理層面上,目前在智能決策方面的應用較多。但個人認為,機器學習更適用的領域是風險識別。在互聯網金融、消費金融的蓬勃發展的當下,央行征信在數據時效性、全面性和層次性上的短板日益凸顯。深度挖掘互聯網大數據信息是十分重要的。
二、機器學習在企業風險評估中的研究
(一)研究意義
信用風險評估在近年來已顯示出其經濟重要性,不僅因為個人無擔保貸款的數量每年都在增加,而且違約風險的概率也在快速增長。2008年的次貸危機造成的巨大損失引起了金融專業人士的國際恐慌。不良貸款率高是一個普遍存在的問題,以中國為例,根據中國銀行業監督管理委員會(銀監會)的報告,截至2018年第四季度末,不良貸款數量呈上升趨勢,為1.68%。如何準確有效地評估貸款人的信用風險,一直是所有相關研究人員和從業人員的一個重要課題.雖然我國的信貸業務開展時間不長,信用評級制度存在著諸多不足,譬如部分評估機構素質偏低、相應法律法規不夠完善,但是這個制度對于信用風險控制管理有著十分重大的意義。
(二)實施途徑
1、信用評估的主要關注點是如何將申請人分為兩類:違約和非違約。然后,評估人員可以決定拒絕或批準貸款申請。在個人信用風險評估領域,從業人員和研究人員使用申請人的個人社會人口信息,如年齡、性別、工作和收入,以及貸款申請信息,如貸款用途、貸款金額和貸款類型等,以區分哪些人會拖欠或未能償還貸款。個人社會人口信息和貸款申請信息對評估一個人的信用風險狀況非常重要。動態交易歷史也是人們金融行為的一個非常有意義的指標,申請人的交易歷史記錄,可以從申請人的借記卡、信用卡、存折和其他賬戶等獲取,顯示申請人的動態財務狀況和個人交易行為。
2、制定措施,運用一些機器學習的方法。在發放最多貸款數量的銀行中,信用評估可以被分為兩種形式:1.銀行派想要內部調查人員對借款者進行調查。2.銀行委托一些專業評估機構對借款者進行評估調查。信用評估的級別我國一般分為A(最優)、B(良好)、C(一般)或者A、B、C、D,對應的字母越靠前,信用情況越好,反之信用情況則越糟糕。
3、操作流程,首先對與機器學習在個人風險評估的文獻進行歸納整理,提取思路。然后選取內容符合且數量相對合適的數據。后一步選用多項式Logistic回歸、決策樹、神經網絡、隨機森林這四種機器學習算法分別構建四種算法對應的模型。對于四種不同的模型,選用不同的參數估計法進行參數估計。最后利用相應的軟件,操作得到模型的估計結果。當無法通過設計消除相關風險時,也可以通過設置信貸標準的安全操作流程,來約束借方和貸方的行為,提高安全意識,以保證機器學習的安全運行。風險再評估,對于以上預采取的措施,分析人員應對其效果進行再評估,以判斷相關風險是否已經被控制到可接受的范圍內,如果沒有,則應繼續采取控制措施,直至風險已被降低到可接受范圍內。另外,要注意的是以上控制措施應按照從上往下的順序優先使用,即是只有上面的無法達到效果時,才能使用下面的措施。因為任何措施都有失效的可能,只有從最根本上解決風險,才能真正的保證信貸的安全。風險分析作為信貸設計過程中至關重要的一步,對于提高信貸的安全性具有重大的意義。只有將其作為信用評估中不可或缺的的一部分,才能設計出相對安全的風險評估體系,才能使借方和貸方的權益都得到保障。
【參考文獻】
[1]張瀟元.基于BP算法的金融信用風險仿真研究[J].現代商貿工業,2015.
[2]田家俊.基于機器學習的人機博弈的研究與實現[D].東華大學學報,2007.
[3]符永順.基于機器學習的移動應用推薦系統的研究與實現[D].通訊世界,2014.
[4]李航.統計學習方法[M].北京:清華大學出版社,2012.
[5]夏潤海,王開顏;機器學習與智能決策支持系統[J];濰坊學院學報;2016年02期.
[6]張明玉,倪志偉;基于機器學習的智能決策支持系統[J];淮南師范學院學報;2017年03期.