劉翔鵬 中國人民銀行永州市中心支行
金融是現代經濟的核心,銀行市現代金融的核心,現代商業銀行在經營和發展過程中,因為籌集融通資金,中間環節會積累大量不良資產。由于歷史上和現實上的原因,我國農信系統的地方法人金融機構累積了大量的不良資產,雖然經過央行票據置換和農商行改革已經置換、清收了大量的不良資產,但是由于地方法人銀行機構信用風險管理能力較差,人才隊伍培養滯后,故對不良資產的事前識別能力極弱。
目前國內銀行業對不良資產信用風險評估方法主要是采用古典分析法和多元統計法。古典分析法是指銀行經營者依賴一批訓練有素的專家主觀判斷,對信貸項目進行判斷打分,審貸會以此決策。多元統計分析的基本思路是根據歷史積累的樣本建立統計模型,對新樣本發生的某種事件的可能性進行預測的方法,包括線性概率和判別分析法等。
以上所述方法雖然被廣泛應用,但是他們只是針對某一方面如財務進行分析和統計,不能充分利用銀行搜集的全面信息,尤其是一些邊緣信息。大量的數據挖掘研究結果表明,很多邊緣信息和側面指標可以很好地補充單一財務指標的缺陷,使借款項目的特征更加鮮明,故本文引入人工神經網絡模型,試圖用新辦法解決信用風險識別、評估的舊問題。
類似于人腦結構,人工神經網絡ANN由一組相互連接的結點和有向信息鏈組成。本神經網絡是運用了BP原理的神經網絡分類器,信息向前傳遞,誤差向后傳遞。模型可以簡潔地寫成如下形式:,其中w是權值向量,x是輸入向量,t是閾值向量。
模型運算步驟如下:
(2)用隨機數給初始權值向量W賦值。
(3)對每個輸入向量、權值向量和閾值向量有一個輸出y.(4)對權值向量進行更新和調整,權值調整公式:
根據模型的實際訓練效果,設置一個合理的訓練次數,并用隨機數種子的辦法將其固定下來,便于結果可以重現。
本文選取湖南永州境內S農商行和B農商行全部信貸數據作為實證樣本。首先對數據進行處理,對缺損數據和重復數據進行了清洗,選取12450個樣本,13個特征值作為有效數據。將數據庫的英文字符和中文字符全部轉化為雙精度浮點型數據,然后利用虛擬變量函數對雙精度浮點型數據全部進行編碼,使之符合神經網絡輸入規則,樣本屬性標簽正常貸款和不良貸款分別用0和1表示。
在實證環節,隨機選取40%的樣本作為測試樣本,共進行40次交叉驗證。40次交叉驗證預測標簽為1的不良貸款結果如下表:

序號 迭 代次準確率1 200 0.914 2 200 0.888 3 200 0.879 4 200 0.886 5 200 0.910 6 200 0.841 7 200 0.927 8 200 0.916 9 200 0.909 10 200 0.866 11 200 0.880 12 200 0.910 13 200 0.918 14 200 0.865 15 200 0.866 16 200 0.854 17 200 0.844 18 200 0.904 19 200 0.926 20 200 0.927 21 200 0.920 22 200 0.844 23 200 0.900 24 200 0.869 25 200 0.875 26 200 0.894 27 200 0.914 28 200 0.880 29 200 0.843 30 200 0.925 31 200 0.894 32 200 0.867 33 200 0.924 34 200 0.912 35 200 0.888 36 200 0.812 37 200 0.849 38 200 0.908 39 200 0.848 40 200 0.910準確率序號迭代次準確率序號迭代次
全部40次隨機交叉驗證的準確率均值為0.8877,標準誤差為0.030。模型中,不管交叉驗證數據如何變化,最終ANN模型均有足夠的內部空間容納,并能夠選擇合適的拓撲結構防止模型過度擬合。ANN可以自動處理冗余權值,因模型可以自動學習,冗余權值非常小。神經網絡模型對噪音非常敏感,處理噪音問題的辦法是用確認集確定模型的泛化誤差,雖然準確性上ANN模型超過樸素貝葉斯模型,但是穩定性則不如樸素貝葉斯模型。為避免出現局部極小值,應在權值更新公式上加上一個動量項。神經網絡訓練非常耗時,如數據足夠多,模型足夠復雜,在效率上比不上KNN模型和樸素貝葉斯模型。
人工神經網絡模型(ANN)的準確率很高,穩定性一般,在多次交叉驗證后,得到較為穩定的準確率和較小的標準誤差,故模型實用價值很高。但法人銀行機構的關聯交易和流動性狀況是該模型不能識別的,股東的高額關聯貸款給法人銀行帶來的信用風險是極大的,極端情況的流動性短缺會讓法人銀行機構經營困難,結合聲譽風險,可能會被處置當局警告、早糾甚至接管。