邵永運, 惠 丹
(沈陽師范大學 軟件學院, 沈陽 110034)
隨著我國市場經濟體制的日益完善,市場競爭也越來越激烈。第四次全國經濟普查系列報告顯示,2018年末我國中小微企業法人單位約1 807萬家,較2013年末增長115%,占全部規模企業法人單位的99.8%[1]。中小微企業在經濟發展、科技創新、吸納就業方面發揮著重要作用[2],但較之大企業而言,中小微企業在融資成本、融資渠道、信貸支持等方面望塵莫及,這些因素嚴重阻礙了中小微企業的發展[3]。習近平總書記多次指出,為實體經濟服務是金融的天職,是金融的宗旨,也是防范金融風險的根本舉措[4]。銀行與企業之間存在著信息不對稱的問題,致使雙方難以實現共贏[5-7]。因此,銀行對中小微企業信貸業務的關鍵就在于對信貸風險的預測[8-9]。本文將結合主成分分析和logistic回歸對中小微企業信貸決策問題進行建模并求解。
本研究所采用的數據為2020年全國大學生數學建模競賽中C組題目所提供的123家有信貸記錄企業的相關數據。
根據企業規模、企業信譽及供求關系穩定性,從企業進銷項發票信息中提取10個可用指標[10]。影響信譽評級的指標見表1。

表1 影響信譽評級的指標Table 1 Indicators affecting reputation rating
數據預處理工作主要是要將源數據處理成計算機可以識別的數據[11-13]。在該數據源基礎上需要做的處理工作包括:
1) 對數據進行去空值與去重處理;
2) 將發票狀態以及是否違約分別使用0,1進行標記;
3) 將上述10個指標通過計算得到其數據形式。
經過處理的數據見表2,后續的分析工作將在此數據基礎上展開。

表2 預處理后的數據Table 2 Preprocessed data
首先,對所提取的10個指標進行皮爾遜相關性分析,其結果見表3。

表3 各指標間皮爾遜相關系數Table 3 Pearson’s correlation coefficient among various indicators
由表3可知,指標X1與X2之間的皮爾遜相關系數為0.899 7,X3與X6的相關系數為0.889 1。該結果表明,所提取的10個指標之間獨立性較差,需要進行降維處理,降維后使得后續的數據分析工作更加簡潔明了[14-15]。
其次,考慮到各指標間數據范圍差異較大,所以在進行主成分分析之前對數據進行標準化處理。標準化公式為

(1)
式中:μ為均值;σ為標準差。
最后,利用Pathon語言sklearn包中的PCA類對標準化處理后的數據進行主成分分析。由圖1可知,前6個主成分反映了原始變量的87%的信息。

圖1 主成分分析可視化結果Fig.1 Principal component analysis visualization results
經主成分分析后得到6個主成分,因此logistic回歸模型中的自變量為降維后的前6個主成分,記作F1,F2,…,F6,因變量為企業是否違約(是為“1”,否為“0”)。通過logistic回歸計算出回歸系數(見表4)和企業違約概率Pi(見表5,i代表第i個企業)。logistic回歸模型如下(β為違約損失系數):


表5 企業違約概率Table 5 Probability of enterprise default
通過logistic回歸得到企業違約概率后,可通過目標規劃確定銀行對中小微企業的具體信貸決策,主要包括是否貸款、貸款額度以及貸款利率。
1) 決策變量
設銀行對企業Ei放貸的金額為xi,貸款年利率為ri,i代表第i個企業(i=1,2,3,…,123 )。
2) 目標函數
銀行的目標為總貸款利潤即收益最大并且要求年總體風險最小,所以目標函數如下所示:
其中:xi為放貸金額;ri為貸款利率;FTP為銀行內部資金調動利率,取0.027;α為違約系數,一般取0.2;Pi為違約概率,已通過logistic回歸求出;β為違約損失系數,A,B,C類企業分別對應0.09,0.18,0.27;Li為客戶流失率。
3) 約束條件
① 銀行對每個企業的放貸額為10萬~100萬元:10≤xi≤100;
③ 貸款年利率約束:4%≤ri≤15%;
4) 信貸決策
運用pandas對上述模型進行求解,則可得到該信貸問題的最優決策(見表6)。

表6 銀行對123家企業的信貸決策Table 6 Bank’s credit decision on 123 companies
信貸風險的預測與信貸決策的實現使得企業和銀行雙方可以實現共贏,進而推動經濟發展。本文通過主成分分析與logistic回歸的結合,可以有效衡量企業的違約風險,再通過目標規劃進行信貸決策,最終得出銀行對123家有信貸記錄的中小微企業的信貸決策。該預測模型對有信貸記錄的中小微企業的信貸問題提供了一種解決思路,同時也可將其延伸到無信貸記錄的信貸決策問題中。