文 / 劉芹,安徽師范大學(xué)
目前大數(shù)據(jù)的發(fā)展已經(jīng)取得了一定的成就,在技術(shù)方面也日漸成熟,并且已經(jīng)形成了一套特有的架構(gòu)體系,但在銀行風(fēng)險控制與管理方面的應(yīng)用,始終處在摸索的階段。對于如何把大數(shù)據(jù)技術(shù)與銀行風(fēng)險管理結(jié)合起來,構(gòu)建一個基于自身業(yè)務(wù)特點的風(fēng)險管理體系是當(dāng)前亟需解決的問題。在大數(shù)據(jù)逐漸升溫的背景下,就大數(shù)據(jù)在銀行風(fēng)險管理的應(yīng)用等相關(guān)問題進行了分析研究,希望能對大數(shù)據(jù)在銀行風(fēng)險管理方面的運用起到一定的借鑒意義。
2011年,大數(shù)據(jù)技術(shù)開始盛行,但是國內(nèi)的各企業(yè)、機構(gòu)較晚接觸到大數(shù)據(jù),所以它們對大數(shù)據(jù)技術(shù)的應(yīng)用了解還不夠深。在國內(nèi)金融領(lǐng)域,大數(shù)據(jù)技術(shù)主要應(yīng)用在以下幾方面:
信貸領(lǐng)域:大數(shù)據(jù)技術(shù)的興起引發(fā)了大量互聯(lián)網(wǎng)信用評估機構(gòu)誕生,銀行可以通過這些評估機構(gòu)來完善對個人信貸風(fēng)險的評估。
征信領(lǐng)域:以大數(shù)據(jù)技術(shù)為基礎(chǔ),商業(yè)銀行可以記錄客戶的信息數(shù)據(jù)和評估他們的行為,將這些數(shù)據(jù)進行分析和還原,可以全面評估客戶的風(fēng)險狀況,完善市場征信體系。
金融安全領(lǐng)域:隨著大數(shù)據(jù)技術(shù)在各個領(lǐng)域的廣泛應(yīng)用,利用大數(shù)據(jù)技術(shù)做違法的事也就屢見不鮮,所以維護金融領(lǐng)域安全就逐漸受到了重視。
現(xiàn)在,國內(nèi)銀行已經(jīng)在信用風(fēng)險管理應(yīng)用中取得了相不小的成就。但是由于外部環(huán)境的不斷變化,商業(yè)銀行風(fēng)險管理體系仍然面臨著兩個主要的問題:一是風(fēng)險識別和管理方面的技術(shù)手段比較落后,進而就會讓風(fēng)險防控滯后。二是管理層大多會將風(fēng)險管理重點側(cè)重于操作風(fēng)險、合規(guī)風(fēng)險,沒有全面風(fēng)險防范的理念。
2.1.1 業(yè)務(wù)相匹配;系統(tǒng)設(shè)計要滿足信用風(fēng)險識別、計量、監(jiān)測和控制的要求,確保可以實現(xiàn)數(shù)據(jù)采集、存儲、計量、風(fēng)險監(jiān)測、風(fēng)險控制等功能,要具有靈活性,在一定程度上可以保持銀行的自主性。
2.1.2 模塊與分層;在技術(shù)層面,大數(shù)據(jù)框架里會包含數(shù)據(jù)采集、存儲、處理、分析、應(yīng)用等層次;在業(yè)務(wù)需求方面,信用風(fēng)險管理又囊括了風(fēng)險識別、計量、監(jiān)測與控制等程序。不管從哪個角度去看都對系統(tǒng)分了層,在分層架構(gòu)中,每層都是相互獨立的,這樣應(yīng)用起來比較靈活,如果各層間接口不變,整個過程幾乎就不會互相影響,這樣對系統(tǒng)的維護也是有利的。
2.1.3 數(shù)據(jù)要可靠;本文所設(shè)計的系統(tǒng)不是業(yè)務(wù)系統(tǒng),不能從源頭上收集到數(shù)據(jù),更多的數(shù)據(jù)是來自于銀行內(nèi)部其他業(yè)務(wù)系統(tǒng)和外部系統(tǒng)。在采集過程中,對相關(guān)數(shù)據(jù)標記它的來源,從而提高數(shù)據(jù)的可靠性,盡可能對數(shù)據(jù)進行預(yù)處理,最大限度保證數(shù)據(jù)的質(zhì)量。
2.1.4 職責(zé)相分離;在系統(tǒng)設(shè)計中體現(xiàn)為,參與風(fēng)險計量模型開發(fā)的人員,就不能進行風(fēng)險計量、風(fēng)險監(jiān)測、風(fēng)險預(yù)警、風(fēng)險控制以及其他方面的控制;有訪問計量模型訓(xùn)練數(shù)據(jù)權(quán)利的人員,不能對計量模型應(yīng)用數(shù)據(jù)進行訪問;對推翻和更新進行評級的人員,不能進行風(fēng)險監(jiān)測、預(yù)警、控制等等。職責(zé)分離可以把業(yè)務(wù)任務(wù)真正落實到幾個特定人員身上,這樣就可以提高效率的同時也降低了操作風(fēng)險。
2.2.1 采集接口層;這個層次的設(shè)計主要以 Flume 為例,闡明系統(tǒng)的采集及預(yù)處理是如何進行的。Flume是由各個Flume 代理(Agent)組成的,它們分布運行在不同主機系統(tǒng)中,F(xiàn)lume 代理是由 source(數(shù)據(jù)來源)、channel(內(nèi)存存儲傳輸數(shù)據(jù))以及 sink(數(shù)據(jù)目標)三部分組成的。靠近邊緣的Flume代理主要是負責(zé)采集數(shù)據(jù),緊接著就是將數(shù)據(jù)轉(zhuǎn)發(fā)給負責(zé)匯總的 Flume 代理,最后儲存到本系統(tǒng)存儲層,數(shù)據(jù)預(yù)處理模塊,在負責(zé)匯總的Flume代理中執(zhí)行。
2.2.2 數(shù)據(jù)存儲層;通過采集接口層采集到的數(shù)據(jù)將它們存儲在分布式文件系統(tǒng)中,No SQL數(shù)據(jù)庫對其進行管理,這樣就能夠?qū)崿F(xiàn)大規(guī)模、多類型數(shù)據(jù)的存儲與管理。這個存儲系統(tǒng)采用的是Hadoop集群下的HDFS分布式文件系統(tǒng)與HBase列式存儲數(shù)據(jù)庫。HDFS和HBase都是運用主從節(jié)點的設(shè)計方式。
2.2.3 風(fēng)險計量層;大數(shù)據(jù)系統(tǒng)不僅要采集內(nèi)部數(shù)據(jù)也要采集外部數(shù)據(jù),因為數(shù)據(jù)具有稀疏的特征,采用分布式結(jié)構(gòu)對數(shù)據(jù)進行存儲計算,方便分層,所以可以采用母子結(jié)構(gòu)方式去設(shè)計計量模型,母模型的輸入就是子模型的輸出,這樣可以把數(shù)據(jù)逐層加工。子模型中有運行與備用兩個模型,一旦運行下降,備用模型就可以進行替補。在這個模型的學(xué)習(xí)過程中,要開發(fā)合適的算法。計量模型的開發(fā)是一個監(jiān)督學(xué)習(xí)的過程,Logistic回歸算法就比較適合概率決策,解釋性較好,所以可以選取其作為母模型算法,決策樹、神經(jīng)網(wǎng)絡(luò)、支持向量機可以較好地處理稀疏數(shù)據(jù),所以就將其選做子模型算法
2.2.4 應(yīng)用接口層;應(yīng)用接口層的作用主要是將其他業(yè)務(wù)系統(tǒng)與綜合風(fēng)險應(yīng)用平臺進行銜接,可以把信用風(fēng)險計量的結(jié)果、風(fēng)險監(jiān)測的結(jié)果和業(yè)務(wù)控制的結(jié)果導(dǎo)出來。在這個層面設(shè)計上,要注意協(xié)調(diào)與配合其他系統(tǒng),這樣可以讓數(shù)據(jù)結(jié)構(gòu)和傳輸方案保持一致。
總結(jié)全文,大數(shù)據(jù)技術(shù)的應(yīng)用,對商業(yè)銀行的全面風(fēng)險管理來說無疑既是機遇又是挑戰(zhàn),所以銀行應(yīng)該要掌握技術(shù)的重點,通過對數(shù)據(jù)整理體系進一步完善,對數(shù)據(jù)存儲設(shè)備進一步研發(fā)等措施來提升自身風(fēng)險管控水平,這樣才能夠促進我國商業(yè)銀行健康有序發(fā)展。