

【摘要】本文介紹了數據挖掘技術定義以及常用的數據挖掘技術,研究了數據挖掘技術應用于銀行信貸業務中風險控制的可行性,并闡述了具體實施步驟。
【關鍵詞】數據挖掘技術 銀行信貸 風險控制
一、引言
利率市場化的加快和金融體制改革的深入進一步加大了銀行的信貸風險[1]。然而銀行對信貸風險控制重視不足,普遍只重視貸前評估,而對企業貸后跟蹤評估嚴重缺乏,就是貸前評估體系也建立在利率市場化以前的金融體制上,沒有能隨著利率市場化和金融體系改革進程做出與時俱進的調整[2]。持續上升的不良貸款率要求銀行改進目前的信貸風險評價體系,正視目前信貸風險控制中存在的問題,特別是加強貸后對企業跟蹤評估,增強信貸風險控制水平,實現銀行對信貸全過程監控,努力降低信貸風險。
銀行信貸風險就是貸款到期后,借貸方無法還本付息的可能性。信貸風險是一種銀行不可避免的必須面臨的,同時又是難以徹底消除一個問題。如何通過各種措施控制風險在一個可承受的范圍之內是每一個商業銀行必須回答的問題。銀行信貸風險產生原因既有國家宏觀經濟增長放緩、產業結構調整、淘汰落后產能等客觀因素,也有銀行自身風險管理的內在原因,尤其是銀行在長期順周期環境下建立的較為粗放的信貸評價體系和事后補救的管理模式[3]。這種評價體系和管理模式導致銀行對抵御經濟波動帶來的風險準備嚴重不足,貸后風險管理嚴重缺失。目前,銀行對信貸資產質量要標本兼治,重點需強化前瞻性的信貸戰略布局,建立適應利率市場化和金融體制改革后的評價體系、加強貸后的跟蹤評價、夯實風險管理基礎,走出一條穩健發展的銀行信貸新路子。
經濟活動表現為資金流動,企業償還債務能力、資產經營狀況、獲取利潤、成長情況、融資、股權結構以及企業規模都是通過資金的運動表現出來。而資金運動需要支付系統平臺的支撐。隨著我國社會經濟的加速發展和金融體制改革的不斷深入,尤其是信息科學技術的急速發展,如何利用這個覆蓋廣泛、功能齊全、效率極高、參與規模日益激增、沉淀有大量資金匯劃的支付系統平臺,進行數據挖掘加工、預測企業的資金運行狀況、建立新的信貸評價跟蹤體系、防范信貸風險、維護商業銀行效益和國家金融的穩定,具有十分重要的意義。
二、數據挖掘技術
數據倉對于很多人、企業來說還屬于一個相對抽象的概念,目前普遍接受的觀點認為數據倉是由科學儀器、傳感設備以及電子郵件等多種數據源構成的一個海量的、多元化分布的數據集。其主要特征表現為規模宏大數據、數據種類繁多、有價值數據極少、極快速的數據處理。這四大特征是劃分數據倉與傳統數據的標識,也顯示我們數據的應用研究日趨成熟。面對著日益膨脹的數據,銀行如何能從種類繁多、海量的數據倉中提取到對銀行有價值的信息,為銀行本身服務,特別是用于銀行的信貸風險控制,才是每個銀行職工多關心的,而且這一點也必將在不久的將來為銀行業所接收。
數據挖掘技術,又稱為數據庫中知識發現(Knowledge Discovery from Database,縮寫KDD),它是一個從數據倉中進行抽取、轉換、分析,從中提取有價值的可以用于輔助決策的關鍵性數據,并對數據進行模式處理、發現其內在規律,深入研究這些規律發生作用的表現形式,以及主客觀因素對這些規律的影響,并且以一定的置信度對未來進行預測,用來為決策行為提供有利的支持[5]。在數據挖掘過程中集成并提高數據的價值,將數據從數據源轉換為目標數據,是實施數據挖掘的前體和基礎。數據挖掘的核心是通過算法或其他分析方法對目標數據源模式處理、獲取目標數據隱藏的規律。模式化處理的作用就是驗證數據挖掘的結果正確有效性,獲取的規律是否經得起實踐的檢驗,其置信度的高低,以及該規律是否可以作為該事件領域內的一個準則。
數據挖掘常用的技術有[6]:
(一)傳統統計分析
主要包括相關性分析、回歸分析及因子分析等,一般先由用戶提供假設,再由系統利用數據進行驗證。
(二)神經元網絡
主要用于解決具有上百個參數的問題,包括分類和回歸,諸多數據挖掘工具和軟件都包含了該技術。如PolyAnalyst,BrainMaket,Neurosell和OWL等,它也是金融領域中常用的挖掘技術。
(三)決策樹
主要用于分析主客觀條件對得到的規律所起的作用大小,該方法是應用最為廣泛的分類方法。
(四)基于事例的推理方法
該推理方法的主要思想是在預測未來情況或進行正確決策時,系統查找與現有情況相類似的案例,運用最佳的與案例相同的解決方案直接解決問題。
(五)遺傳算法
遺傳算法是計算數學中用于解決最佳化的搜索算法,是借鑒了進化生物學中的一些現象而發展起來的。其基本思路是通過計算機模擬,并對數據模型進行優化獲得最佳模型。
(六)非線性回歸方法
這種方法的基礎是在獲得了大量觀察數據的基礎上,利用數理統計方法和預定的函數模型,擬合因變量與自變量之間的回歸模型
(七)基于貝葉斯網絡結構算法
貝葉斯網絡(Bayesian network),是一種概率因果網絡、信任網絡、知識圖等,是一種基于概率推理的貝葉斯網絡(Bayesian network)是為了解決不定性和不完整性問題而提出的,廣泛應用于多個學科領域。
三、數據挖掘技術的主要步驟
從經濟活動中產生的海量數據進行數據挖掘得到有價值的數據是一件比較困難的事,它包括目標定義、數據收集、數據整理、數據挖掘、結果評估和分析決策幾個步驟:
(一)目標定義
對挖掘數據的目標有一個清晰、明確的定義,也就是挖掘數據是為了解決什么問題,制定的目標應是可行的、可以通過數據能夠進行操作與評價。
(二)數據收集
大量的有價值的真實而又完整的數據是數據挖掘的前提和基礎,沒有數據、數據價值不高或者數據真實度、完整性差,數據挖掘也就無從做起或者從數據挖掘中得到的規律置信度不高。因此,收集大量有價值的數據是數據挖掘的首要步驟。
(三)數據清理
數據清理是數據挖掘的必要環節。對原始數據進行描述和初步探索,檢查數據的質量等,通過數據清理,可以對數據做簡單的泛化處理,對數據進行抽取、轉換和裝載,將數據轉換成模型,然后對得到的各個模型進行初步評估,從而在原始數據的基礎之上得到更為豐富的數據信息,進而便于下一步數據挖掘的順利進行。
(四)數據挖掘
利用人工智能、數理統計等各種數據挖掘方法對所得到的數據進行挖掘,選用合適的數據挖掘工具,對選擇算法作適當的調整和修改,發現有用的知識與模式,這是一個迭代循環的過程,也是整個數據挖掘過程的核心步驟。
(五)數據挖掘結果的評估
數據挖掘的結果存在有實際意義的、沒有實際意義的和與實際情況相違背的三種狀況,需要進行可視化應用分析,按照數據挖掘的操作方法評估挖掘的結果,然后不斷調整挖掘方案和預處理原始數據等。
(六)知識的應用
將最終得到的知識轉換成業務的應用才是挖掘的精髓,只有數據或者圖像的結果不是數據挖掘的目的,只有通過數據挖掘獲得的知識得以應用、輔助決策才是數據挖掘的歸宿和目的所在。而作為銀行利用數據挖掘技術一個主要目的就是利用數據挖掘降低信貸風險。
四、用數據挖掘技術在分析行業景氣指數、企業績效中的應用可行性分析
信貸是銀行常見的一種經濟活動,信貸風險是指商業銀行在經營信貸業務時,由于企業內部或外部各種不確定因素的共同作用下,遭受損失的概率。信貸風險根源于不確定的市場經濟活動本身和企業的經營狀況。當下商業銀行的貸款管理規定,一般是按季結息,貸款期限大都是6~12個月或1年期以上。不良貸款就是貸款出現欠息或到期后超過90天不能償還。對于一些不良貸款,銀行為保全資產通常還會采取再融資、延期、簽補充協議調整原合同要素等方式來使貸款風險延期暴露。此外,很多潛在風險貸款還要受其它多種因素的影響或觸發才會暴露[3]。這種貸款方式和事后補救的做法已經遠遠不能適應當下利率市場化和金融體制改革后的要求,如果仍采用這種貸款方式也必將使銀行蒙受更大的損失。因此,在當下利率市場化的加快和金融體制改革的深入的背景下,銀行如何發放貸款,如何確定發放貸款的額度、貸款時間就必須根據企業產品所屬行業的背景和企業的經營績效來確定。
企業經營績效是衡量企業經營狀況的重要指標。1999年財政部、2006年國資委分別在《國有資本金績效評價指標體系》、《國有資本金績效評價操作細則》、《中央企業綜合績效評價管理暫行辦法》及《中央企業綜合績效評價實施細則》四個文件中提到企業的經營績效應該包含至少四個方面的指標:企業的盈利能力、資產質量、財務風險和成長能力[7]。
企業的盈利能力是指企業獲取利潤的能力,是企業資本增值能力,通常以一定時期內企業收益數額的多少及其水平的高低表示。盈利能力指標主要包括營業利潤率、成本費用利潤率、盈余現金保障倍數、總資產報酬率、凈資產收益率和資本收益率六項;企業的資產質量是指特定資產在企業管理的系統中發揮作用的質量,具體表現為變現質量、被利用質量、與其他資產組合增值的質量以及為企業發展目標做出貢獻的質量等方面,它包括流動資產、長期投資、固定資產、其他資產(含無形資產、遞延資產)等四個部分;企業的財務風險指在各項財務活動過程中,由于各種難以預料或控制的因素影響,財務狀況具有不確定性,從而使企業有蒙受損失的可能性,企業的財務風險可以分為流動性風險、信用風險、籌資風險、投資風險;企業的發展能力是指企業擴大規模、壯大實力的潛在能力,主要包括營業利潤同比增長率、營業總收入同比增長率和每股凈資產相對年初增長率等多項指標。
因此為了準確的評價企業的績效和企業產品對市場的適應性,必須數據倉中收集大量的不同行業、不同企業在特定時間段(通常近10年或更長)這四個方面能力的財務數據。然后對這些數據進行整理,剔除一些資料不全、信息不完整或者經營跨行業產品的企業。根據不同行業的企業產品特點設定不同的績效參數Ai,采用主成分提取的方法,對反映篩選企業的盈利能力、資產質量、財務風險和成長能力的數據進行挖掘,構建不同行業的企業綜合績效指數和不同行業績效參數Ai,并用logistic等動態模型擬合分析各行業的績效發展狀況(圖1)。
行業績效參數Ai極高的行業,這些行業可能為將要淘汰的行業,銀行應該杜絕貸款;對于那些行業績效參數Ai較高,但是績效逐年降低的行業,這些行業不久就可能淪為將要淘汰的行業,銀行應該謹慎貸款;對于那些行業績效參數較低或很低,績效指數穩定或逐年增加的行業,說明這些行業投入產出比較高,銀行應適當增加這些行業的貸款,增加銀行的盈業利潤。
上述是從宏觀上進行分析,為銀行貸款提供指導。但是具體到每一個企業,如何提供貸款,貸款數量多少,貸款周期多長,貸款過程中如何監控企業資本運行狀況,則必須進一步進行數據挖掘,分析這類企業的經營狀況與績效的關系。
五、用數據挖掘技術在分析企業信貸風險中的應用可行性分析
銀行貸款的對象是企業,因此銀行發放貸款給企業,不僅根據企業所在行業的績效參數,以及企業的績效,而且要依據企業經營狀況來確定貸款的數量和時間。企業的經營狀況是決定企業績效高低的主要因素,而企業的經營狀況主要由企業的融資結構、所有權結構和企業規模等確定。為了降低銀行信貸風險,就必須在上述績效數據挖掘的基礎上,進一步對不同行業的各個企業的融資結構、所有權結構和企業規模等數據,以及它們與績效關系進行深度挖掘,確定各種融資結構、所有權結構最適合以及比較適合比例關系和有利于提高企業績效相適應的企業規模。
企業的融資結構是指企業全部融資來源及其比例關系,因此企業的融資結構涵蓋了企業的融資方式(內源融資和外源融資)、資產負債率水平、企業不同債務(流動債務和長期債務)之間、債務來源(銀行貸款和商業信用)之間的比例關系等信息。
企業通過負債能夠獲取納稅收益,促使企業提高財務水平,縮減代理成本,盡可能的使企業價值最大化,但負債也導致企業各種費用和債務風險的增加。企業負債分為流動負債和長期負債流動負債具有周期短,利率低等特點。企業流動負債率越高,債權人越有保證,但流動負債率過高,就會使一部分資金滯留在流動資產形態上,影響企業的獲利能力。因此企業應將流動負債率測定一個較為合理的界限,低于這個界限,說明資產負債率有可能會高,企業信用受到損害;高于這個界限,說明一部分資金被閑置,資金使用效率不高,造成資金浪費。長期負債具有期限長、利息相對高、絕對數可能負債大等特點。企業如果能夠正確有效地利用長期負債,它就會為企業提供更多的獲利機會。但是如果企業經營不善,它又可能形成籌資風險,從而加劇企業經營風險,造成高負債高風險,也是影響資產負債率高低的一個重要因素。
企業融資可以分為內源融資和外源融資。內源融資由企業留存收益和折舊構成,外源融資依據其融資方式又分為股權融資和負債融資。融資結構是一個動態的結構,不同的企業以及同一企業的不同階段其構成不同。融資結構不僅反映了企業的融資風險和融資成本,而且影響企業的資源、金融資產在全社會市場中的配置和企業的經營策略,決定著企業的融資能力和經營績效。由此融資結構已經成為企業、金融機構和監管部門共同關注的課題。
企業的所有權結構表現為股權結構,它包括第一大股東持股比例(OC1)、前五大股東持股比例(OC5)、前十大股東持股比例(OC10)和股權制衡度(Z值)。第一大股東持股比例、前五大股東持股比例和前十大股東持股比例可以反映企業股權集中的程度,股權集中度對公司績效的影響表現為積極和抑制兩個方面的作用。對公司績效的積極作用表現為:首先,與股權分散相比,股權集中使股東與公司的利益更加趨于一致。“利益趨同效應”認為股權集中度高的公司,大股東更有動力追求公司價值最大化,減緩代理問題;其次,股權集中能夠促進對企業管理層的監督,“監督效應”認為股權集中的大股東為了自身利益會加強對管理層的監督,不斷的優化管理層的結構。股權集中的抑制作用表現為一種“侵占效應”,是指大股東利用控制權侵占中小股東的利益。當股權集中程度的提高表現出“利益趨同效應”+“監督效應”>“侵占效應”,則股權集中度的提高有利于提高公司績效;而當“利益趨同效應”+“監督效應”<“侵占效應”,抑制公司績效的提高。由此可見,企業股權集中度與績效緊密相關關系。
企業規模是指勞動力、生產資料和產品在企業集中的程度。公司規模并非越大越好。公司在提高公司規模的同時,公司投入和產出都在不斷的提高,但是單位投入所帶來的產出可能是下降的。此時,企業規模擴大不利于企業績效的提高。
因此上述這些因素對企業績效存在顯著作用,通過挖掘不同行業相應企業與融資結構、所有權結構和企業規模相關的數據,對所有數據進行整理,以企業績效作為因變量,以反映企業績效這些相關數據作為自變量,采用非線性模型擬合,挖掘不同行業這些因素與績效之間的非線性模型(圖2),通過對模型求解進一步挖掘不同行業的企業取得較好績效這些因素的取值范圍,為銀行對企業發放貸款具有顯著的指導價值[8]。
六、結論與建議
銀行充分利用上述數據挖掘結果確定對不同行業的企業是否放貸。
第一,績效參數Ai極高的行業,這些行業可能為將要淘汰的行業,銀行應該杜絕貸款;
第二,對于那些行業績效參數Ai較低,但是績效逐年降低的行業,因此這些行業不久就可能淪為將要淘汰的行業,銀行應該謹慎貸款;
第三,對于那些行業績效參數較低或很低,績效穩定或逐年提高的行業,說明這些行業投入產出比較高,銀行應適當根據下列情況采取不同的貸款策略:
一是企業績效極高,企業的融資結構、所有權結構和企業規模均處于最佳狀態,銀行在提供一定量的貸款后,仍處在最佳狀態,銀行應放心貸款給這類企業;
二是企業績效較好,但是企業的融資結構、所有權結構和企業規模處于較為適合狀態,在提供貸款后,企業的融資規模仍然處于較為適合狀態,對于這類企業,銀行可以貸款給他們,但是貸款后銀行要密切注意這類企業的融資狀況和所有權變化,一旦出現異常情況,立即中斷貸款,或督促企業糾正一些不良行為;
三是企業績效較好,但是企業的融資結構、所有權結構和企業規模有一項或兩項不在較為適合的范圍,銀行應督促企業糾正這些問題后,才能貸款給這類企業,如果這類企業資產負債水平極高,銀行應杜絕貸款給這類企業;
四是企業績效不好,但是企業的融資結構、所有權結構和企業規模都處于比較好的狀態,這些企業可能存在其他問題,銀行應督促企業找出影響企業績效的因素,在解決這些不利因素后可以貸款給他們,并在貸款后要注意跟蹤這些企業運營狀況,一旦出現問題,應立即督促企業歸還貸款,更不能采取過去的事后補救辦法,給銀行帶來更大的損失;
五是企業績效不好,同時企業融資結構、所有權結構和企業規模都不合理的企業,盡管企業所在行業績效參數低,但是企業管理自身存在多方面的問題,銀行也不能貸款給這類企業。
無論是績效好的企業還是績效一般的企業,一旦銀行發放貸款給這些企業,一定密切關注這些企業的融資結構、所有權結構和企業規模的變化,一旦這些變化嚴重影響企業績效,為了降低信貸風險,銀行應終止對這些企業的放貸,絕不能采取事后補救的方式。
參考文獻
[1]吳炳輝,何建敏.中國利率市場化下的金融風險理論[J].財經科學,2014(3):1-10.
[2]婁馨月.商業銀行信貸管理問題與對策探析[D].西南財經大學,2012.
[3]魏國雄.商業銀行的信貸戰略風險管理[J].金融論壇, 2015,239(11):10-17.
[4]中國人民銀行南昌中心清算中心課題組.數據挖掘技術應用于支付系統業務數據分析探討[J].金融與經濟,2014,11:78-80.
[5]David H.,Heikki,M.數據挖掘原理[M].北京:機械工業出版社,2006:15-19.
[6]李麗.基于數據挖掘的用戶繳費信用風險評估研究[D].哈爾濱工業大學,2010.
[7]趙順娣,周姣.國有資本金績效評價指標體系完善研究.財會通訊,2009,20,29-30.
[8]張姌.科技型企業融資結構與經營績效關系研究[D].華東師范大學,2016.
作者簡介:張姌(1991-),女,漢族,江蘇揚州,上海農商銀行閔行支行,碩士,主要研究方向:互聯網金融。