白 羽, 三郎斯基, 王曉妍, 孫少飛, 王恒友
(1.北京建筑大學 理學院, 北京 100044; 2.北京建筑大學 測繪與城市空間信息學院, 北京 100044;3.北京建筑大學 城市經濟與管理學院, 北京 100044;4.北京建筑大學 建筑結構與環境修復功能材料北京市重點實驗室, 北京 100044)
在實際生活中,由于中小微企業規模相對較小,缺少抵押資產,因此銀行通常是依據信貸政策、企業的交易票據信息和上下游企業的影響力,向實力強、供求關系穩定的企業提供貸款,并可以對信譽高、信貸風險小的企業給予利率優惠。銀行會根據中小微企業的實力、信譽對其信貸風險做出評估,然后依據信貸風險等因素確定是否放貸及貸款額度、利率和期限等信貸策略。因此對企業進行信貸風險量化分析是關鍵性的一步,是保障商業銀行貸款安全、提升銀行利潤的前提和基礎[1]。關于信貸風險評估的研究此前已有大量研究,馮怡茗等[2]建立雙目標模型前數據預處理不恰當,丟失有效數據,使結果產生一定程度誤差;陳家峰等[3]使用的BP神經網絡中每項參數所占權重相同,并不能準確反映實際情況。在前人研究基礎上,本文采用了層次分析法對有信貸記錄的企業進行了信貸風險量化,得到了企業的信用評分;對無信貸記錄的企業建立神經網絡模型,預測其未違約率,量化分析了信貸風險。
在2020年全國大學生數學建模競賽C題“中小微企業的信貸決策問題”[4]中,提出了下面的問題:請利用123家有信貸記錄企業的相關數據、302家無信貸記錄企業的相關數據和貸款利率與客戶流失率關系的2019統計數據,通過建立數學模型對這123家企業和302家企業的信貸風險進行量化分析。這一問題是競賽題目的一部分,也是銀行制定對信貸策略的重要基礎。為便于分析,假設給定的數據足夠反映企業真實的運營狀況,且其誤差在合理范圍內。
材料中給定了123家有信貸記錄企業的相關數據,并根據企業內部情況人工分為4種信用等級,這樣表面上似乎對信用等級進行了量化,但實際上只是一種分類和排序,并不能真正反映信貸風險的大小和信貸質量的全貌。事實上企業的進貨總額可以反映企業的規模大小;企業的實際利潤可以反映企業目前的市場價值資本;企業的違約記錄代表著企業的市場運營情況;有效發票占比可以代表企業的信譽程度、是否誠信經營,而且在很大程度上側面反映了企業的還貸能力,也決定著銀行是否要為企業提供貸款,提供多少貸款。因此將有效發票占比E、實際利潤P、進貨總額I、未違約率D這4個參數作為分析要素,對企業進行信用評分,實現量化123家企業的信貸風險。
123家企業的有效發票占比E由有效發票總數與發票總數之比得到;未違約率D為未違約企業所占比例。計算每家企業的進貨總額,也就是進貨發票價稅之和Mn(n=1,2,…,123),那么全部進貨總額I是將123家企業的進貨總額求和,得到:
(1)
然后,計算全部銷售總額S,即將123家企業數據中每家企業的銷售發票合計An(n=1,2,…,123)進行求和,得到:
(2)
下一步,計算全部實際銷售總額SR,即從銷售總額S中去除作廢發票總額V,也就是123家企業數據中每家企業的作廢發票合計Vn(n=1,2,…,123)的和,得到:
(3)
其中,SRn(n=1,2,…,123)為每家企業的實際銷售總額。所以全部企業的實際利潤P就是從實際銷售總額SR中減去進貨總額I,得到:
SR-I=P
(4)
顯然,每家企業的實際利潤Pn(n=1,2,…,123)也可以類似計算出來,即:
Pn=An-Vn-Mn(n=1,2,…,123)
(5)
根據層次分析法[5],將決策對象(企業)、決策考慮的因素(有效發票占比E、實際利潤P、進貨總額I、未違約率D)和決策目標(信用評分)按它們之間的相互關系分為最高層、中間層和最低層,具體的層次結構如圖1所示。
在層次分析法中以上一層次某因素為準,它對下一層次因素有支配關系, 兩兩比較下一層次因素對它的相對重要性,并賦予一定分值。采用薩蒂教授提出的1~9標度法[6],根據有效發票占比E、實際利潤P、進貨總額I、未違約率D4個元素的重要性大小,確定了判斷矩陣,見表1。比如,實際利潤P和有效發票占比E2個因素相比,實際利潤P比有效發票占比E明顯重要,因而判斷矩陣的第二行第一列取為5。

圖1 信貸量化層次結構Fig.1 Hierarchical structure of qualifying credit

表1 判斷矩陣
接下來,用特征值法求4個要素的權重,即先求出判斷矩陣的最大特征值λmax及其對應的特征向量umax,然后對求出的特征向量進行歸一化。通過計算得到:
λmax=4.140 8,
umax=(0.238 2 0.938 1 0.080 6 0.238 2)T
從而可得到有效發票占比E、實際利潤P、進貨總額I、未違約率D4個元素的相對權重,結果見表2。

表2 4個要素對于信用評分的權重值
在層次分析法中由于判斷矩陣是主觀賦予的,故需進行一致性檢驗, 即評價矩陣的可靠性,具體的一致性檢驗步驟[7]如下。
第一步,計算一致性指標CI,其計算公式為:
(6)
其中,n為判斷矩陣的階數,這里為4。如果CI=0,則有完全的一致性;如果CI接近于0,有滿意的一致性;CI越大,不一致越嚴重。
第二步,查找相應的平均隨機一致性指標RI。隨機一致性指標RI和判斷矩陣的階數有關,一般情況下,矩陣的階數越大,則出現一致性隨機偏離的可能性也越大。對于4階矩陣,RI=0.900 0。
第三步,計算一致性比率CR=CI/RI。一般如果CR小于0.1,則認為該判斷矩陣通過一致性檢驗,否則就不具有滿意一致性。
按照上述步驟,將判斷矩陣的最大特征值λmax及n代入,得到CI=0.046 9,從而CR=0.052 7,小于0.1,因而可以通過一致性檢驗。
根據123家企業數據得到了有效發票占比E、實際利潤P、進貨總額I和未違約比率D這4個參數的權重,并通過了一致性檢驗,這樣就可以使用這4個權重對每家企業進行信用評分。對于每家企業來說,每家企業有效發票占比En(n=1,2,…,123)由該企業的有效發票總數與發票總數之比得到,每家企業的進貨總額Mn和企業的實際利潤Pn(n=1,2,…,123)已經得到,未違約率Dn為:
(7)
則每家企業的信用評分Gn計算公式為:
Gn=0.159 3En+0.627 4Pn+0.053 9Mn+
0.159 3Dn(n=1,2,…,123)
(8)
基于層次分析法的企業信貸風險已量化,經過計算,發現每家企業的信用評分都在區間[0, 0.5]內,為便于處理數據,將所得信用分值放大20倍,這樣評分區間就擴展為[0,10]。從而常用的信用評級方法[8]可以劃分5個信譽等級,其詳細描述及所對應企業的經營情況見表3。
根據表3得到了123家企業的信貸風險量化表,見表4。由表4可知,處于中高風險的企業是最多的,有89家;處于低風險的企業只有1家。說明大多數企業的信用狀況較弱,存在一定信貸風險。
對于302家無信貸記錄的企業,根據已知數據可計算出有效發票占比En、實際利潤Pn和進貨總額Mn,為了利用基于層次分析法的企業信貸風險量化模型,見式(8),需要建立神經網絡模型預測每家企業的未違約率Dn,從而對其信貸風險進行量化分析。

表3 企業信用評分所對應的企業情況

表4 不同信用等級對應的企業數量(123家)
利用神經網絡[9]工具箱建立神經網絡模型,將已計算出的123家企業的銷售總額SRn、進貨總額Mn、實際利潤Pn和未違約率Dn(n=1,2,…,123)4個參數作為訓練數據輸入,將302家企業的未違約率作為預測目標輸出,如圖2所示。

圖2 神經網絡模型Fig.2 Neural network
上述神經網絡模型的均方誤差變化情況如圖3所示,可以看出,均方誤差在持續下降,當迭代次數到達4 991次時停止訓練,此時均方誤差為1.848 1×10-3。

圖3 網絡模型訓練過程中的均方誤差變化Fig.3 Variation of mean square error during network model training

圖4 網絡輸出值和目標值之間的線性回歸關系Fig.4 Linear regression relationship between network output value and target value
同時,該神經網絡模型的網絡輸出值和目標值之間的線性回歸圖如圖4所示,其網絡輸出與目標輸出相關系數為0.998 7,說明模型能夠高度擬合樣本特征。
基于神經網絡模型所預測的302家企業的未違約率,利用基于層次分析法的企業信貸風險量化模型,計算每家企業的信用評分,在不同等級對應的企業數量見表5。顯然,302家企業信用等級基本服從正態分布,處于中度風險的企業最多,可能面對一些影響其償債能力和履約意愿的不利因素。

表5 不同信用等級對應的企業數量(302家)
本文主要研究了中小微企業的信貸風險量化問題。一方面,對于有信貸記錄的企業,選取有效發票占比、實際利潤、進貨總額、未違約率4個重要參數,建立基于層次分析法的企業信貸風險量化模型,得到了企業的信用評分。另一方面,對于無信貸記錄的企業,建立神經網絡模型預測企業的未違約率,量化分析了信貸風險。這樣,銀行可根據企業的信用等級制定對企業的是否放貸及貸款額度、利率和期限等信貸策略,有助于金融市場的穩定和繁榮。