摘要:在過去的幾十年中,人們一直在深入研究企業(yè)危機預(yù)測問題。從傳統(tǒng)的統(tǒng)計模型到智能的機器學(xué)習(xí)模型,已經(jīng)構(gòu)建各種預(yù)測模型應(yīng)用于不同數(shù)據(jù)集,尤其是人工智能技術(shù)的發(fā)展為該類問題提供了更多方法,因此本文首先以電子商務(wù)環(huán)境下的ST公司為研究樣本,構(gòu)建基于卷積神經(jīng)網(wǎng)絡(luò)的財務(wù)危機預(yù)測模型,對電子商務(wù)企業(yè)財務(wù)狀態(tài)分類進行實證研究。研究結(jié)果表明,相比于傳統(tǒng)類預(yù)測方法,基于CNN的分類模型對ST公司的預(yù)測準(zhǔn)確率明顯高于其他幾種模型,具有較好的預(yù)測性能。
關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò);財務(wù)危機;電子商務(wù);ST公司
引言
風(fēng)險水平是銀行和投資者進行投資決策的主要關(guān)注點,它可以衡量公司經(jīng)營狀況的潛在不確定性并評價日常的經(jīng)營活動。因此,非常需要能夠預(yù)測投資者愿意投資的公司破產(chǎn)的可能性。電子商務(wù)企業(yè)財務(wù)危機是指企業(yè)運營管理失效,致使企業(yè)無法適應(yīng)經(jīng)營環(huán)境的變化和做出管理策略的改變,出現(xiàn)到期不能清償債務(wù)的情況,最終使得企業(yè)生存發(fā)展陷入困境。根據(jù)中國證券市場的規(guī)定,一般將財務(wù)報表中連續(xù)兩年出現(xiàn)負(fù)盈利的的企業(yè)做出警示,在企業(yè)名稱前添加“ST”標(biāo)記,從企業(yè)的角度來看對未來經(jīng)營、投融資活動會產(chǎn)生不利的影響,為了避免這種情況需要提前識別財務(wù)風(fēng)險,積極采取措施解決問題。
1、文獻綜述
通過國內(nèi)外財務(wù)危機研究的梳理,主要的關(guān)注點是預(yù)測變量選擇和預(yù)測模型構(gòu)建。徐安(2016)認(rèn)為應(yīng)該減少變量的個數(shù),一是太多變量會導(dǎo)致數(shù)據(jù)不完整。二是如果有很多變量,很難解釋變量與分類結(jié)果之間的關(guān)系。Tadaaki Hosaka(2018)認(rèn)為從模型性能角度看減少變量個數(shù)會使得信息丟失,降低預(yù)測的準(zhǔn)確性。因此結(jié)合主成分分析對數(shù)據(jù)預(yù)處理提高效率,既可以減少輸入變量個數(shù),又最大限度保證了數(shù)據(jù)量。危機預(yù)測問題關(guān)鍵是衡量公司償債能力,初始模型主要是基于統(tǒng)計學(xué),F(xiàn)itzpatrick最早構(gòu)建單變量模型,Altman引入多變量產(chǎn)生經(jīng)典Z分?jǐn)?shù)模型,Meyer等(1970)在前者的研究基礎(chǔ)上引入邏輯回歸預(yù)測財務(wù)危機發(fā)生的概率,包括logistic和probit模型。
雖然這些模型已廣泛應(yīng)用于學(xué)術(shù)界和工業(yè)界,但統(tǒng)計模型在提高預(yù)測能力方面受到限制,為了克服統(tǒng)計模型的局限性,在機器學(xué)習(xí)領(lǐng)域積極開發(fā)了使用模式識別方法的研究,如支持向量機(SVM),遺傳算法、神經(jīng)網(wǎng)絡(luò)(NN)和Adboost模型之類的機器學(xué)習(xí)技術(shù)方法,研究表明確實比傳統(tǒng)的統(tǒng)計方法有更高的準(zhǔn)確率。趙冠華(2009)的研究結(jié)論表明,遺傳算法能自動尋優(yōu)到最佳參數(shù),顯著提高了模型預(yù)測的正確率。Bredart(2014)研究神經(jīng)網(wǎng)絡(luò)與Logistic的預(yù)測效率表明前者有更高的準(zhǔn)確性。Flavio Barboza等(2017)使用新的變量,例如以經(jīng)營利潤率、股本回報率、銷售收入、資產(chǎn)、員工數(shù)量相關(guān)的增長指標(biāo)作為預(yù)測變量。結(jié)果表明與傳統(tǒng)模型相比,機器學(xué)習(xí)模型平均顯示出超過10%的準(zhǔn)確度。將所提出模型與所有預(yù)測變量進行比較,與隨機森林相關(guān)的機器學(xué)習(xí)技術(shù)貢獻87%的準(zhǔn)確度,而邏輯回歸和線性判別分析在測試樣本中分別產(chǎn)生69%和50%的準(zhǔn)確率。Marcantonio M等(2014)基于遺傳算法和Gregorio(2016)基于案例推理而建立的財務(wù)危機預(yù)測模型,已被應(yīng)用于獲得決策破產(chǎn)規(guī)則。A.Chaudhuri,K.DeFuzzy (2012)應(yīng)用模糊SVM來解決破產(chǎn)分類問題。這種增強的方法結(jié)合了機器學(xué)習(xí)和模糊集的優(yōu)點,在聚類能力方面優(yōu)于概率神經(jīng)網(wǎng)絡(luò)。
最近的研究表明,卷積神經(jīng)網(wǎng)絡(luò)正被應(yīng)用于各種領(lǐng)域的識別問題,某些領(lǐng)域已有的研究顯示出它有比于統(tǒng)計模型具有更高的識別精度和更低的誤差頻率,這為電子商務(wù)環(huán)境下的企業(yè)財務(wù)危機預(yù)測研究開闊了新的思路,提供了新的理論和技術(shù)支持。
2、實證研究
2.1 樣本選擇
互聯(lián)網(wǎng)電子商務(wù)的發(fā)展是從1999年B2C網(wǎng)站開通,網(wǎng)上在線納稅、教育、購物等應(yīng)用開始,伴隨互聯(lián)網(wǎng)技術(shù)的發(fā)展和移動通信工具的普及應(yīng)運而生,電子商務(wù)利用信息網(wǎng)絡(luò)技術(shù),在互聯(lián)網(wǎng)、局部網(wǎng)和增值網(wǎng)上以電子交易方式進行交易行為和相關(guān)服務(wù)的活動,現(xiàn)如今互聯(lián)網(wǎng)行業(yè)產(chǎn)值已超5000千億,對該領(lǐng)域中的財務(wù)危機研究具有重要意義。因此從軟件和信息技術(shù)服務(wù)業(yè)和電子商務(wù)中心2018年公布的500強電商企業(yè)中選取120家公司做為研究樣本。
2.2 數(shù)據(jù)收集與預(yù)處理
電子商務(wù)ST企業(yè)樣本的財務(wù)指標(biāo)數(shù)據(jù)來源于深圳國泰安數(shù)據(jù)庫、金融數(shù)據(jù)庫以及各類財經(jīng)數(shù)據(jù)網(wǎng)站,按照1:2的比例選取了2016-2019年電子商務(wù)行業(yè)中120家首次被ST與財務(wù)健康的A股公司。并按照時間將樣本分為訓(xùn)練組和測試組,訓(xùn)練樣本由2016-2018年75家財務(wù)異常和財務(wù)正常公司組成,作為訓(xùn)練樣本用來訓(xùn)練模型,其中財務(wù)異常的公司有25家,由0,1編碼區(qū)分兩組變量類別,ST公司所屬類別的變量被定義為1,財務(wù)健康的企業(yè)被定義為變量0,剩下的2019年45家以1:2對比的財務(wù)異常和財務(wù)正常公司作為測試樣本用來檢驗?zāi)P偷木_度。
2.3 財務(wù)危機預(yù)測指標(biāo)
財務(wù)危機預(yù)測領(lǐng)域?qū)τ谪攧?wù)指標(biāo)選取的研究還沒有統(tǒng)一的標(biāo)準(zhǔn),但大部分研究集中是從財務(wù)指標(biāo)角度出發(fā),因此為了使本文研究結(jié)果與一般方法具有可比性,財務(wù)危機預(yù)測領(lǐng)域?qū)τ谪攧?wù)指標(biāo)選取的研究還沒有統(tǒng)一的標(biāo)準(zhǔn),但大部分研究集中是從財務(wù)指標(biāo)角度出發(fā),因此為了使本文研究結(jié)果與一般方法具有可比性,初步選取由盈利能力、創(chuàng)新成長能力、營運能力、償債能力組成的12個財務(wù)指標(biāo),其中盈利能力包括總資產(chǎn)、主營業(yè)務(wù)利潤率、凈資產(chǎn)收益率,銷售成長能力包括收入、凈資產(chǎn)增長率和研發(fā)人員占比,營運能力包括應(yīng)收帳款、總資產(chǎn)、股東權(quán)益周轉(zhuǎn)率;償債能力包括流動、速動比率和資產(chǎn)負(fù)債率。運用SPSS對數(shù)據(jù)進行主成分分析。結(jié)果如表1。
表1是利用SPSS對總體樣本進行描述性統(tǒng)計的結(jié)果,其中營收賬款周轉(zhuǎn)率、存貨周轉(zhuǎn)率和產(chǎn)權(quán)比率的均值和標(biāo)準(zhǔn)差數(shù)值偏大,沒有通過三倍標(biāo)準(zhǔn)差交叉檢驗,于是在PCA分析中,選取剩余的12個指標(biāo)作為自變量,確定5個主成分因子并保存為變量,結(jié)合旋轉(zhuǎn)成份矩陣將變量命名為盈利能力、償債能力、成長能力、財務(wù)杠桿、經(jīng)營能力,做為卷積神經(jīng)網(wǎng)絡(luò)的輸入。
2.4 基于卷積神經(jīng)網(wǎng)絡(luò)的分類預(yù)測
卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)包括2個卷積層、2個池化層和一個完全連接層,主要結(jié)構(gòu)如圖1下。
如圖2所示,它是由PCA確定的5個變量在卷積神經(jīng)網(wǎng)絡(luò)上的實驗結(jié)果。圖中training acc表示訓(xùn)練準(zhǔn)確率,train loss表示訓(xùn)練損失函數(shù),val acc為測試準(zhǔn)確率,val loss為測試損失函數(shù)。在實驗中,輸入數(shù)據(jù)的大小為9000×1,樣本個數(shù)為45個。
通過不斷訓(xùn)練和調(diào)整參數(shù)可知,當(dāng)epoch為100時,準(zhǔn)確率和損失值的震蕩幅度最小。由圖3觀察可知,測試樣本上的損失值普遍要比訓(xùn)練樣本中小,而準(zhǔn)確率普遍要高,其中測試準(zhǔn)確率和損失值曲線的波動度要比訓(xùn)練樣本強烈,這代表訓(xùn)練樣本的學(xué)習(xí)率和擬合度比較高。測試準(zhǔn)確率曲線中準(zhǔn)確率主要在0.7~0.9之間,其中最高值為89.31%,最小值為74.24%,平均準(zhǔn)確率大概為85%。損失值函數(shù)曲線是紅色曲線,變動范圍在0.3至0.5之間,平均值為45%。統(tǒng)計結(jié)果如表2。

卷積網(wǎng)絡(luò)財務(wù)危機預(yù)測模型的實證研究統(tǒng)計結(jié)果如表4所示,在對財務(wù)指標(biāo)的研究中可知,判斷正確率達到91.67%。其中,在對檢測樣本的統(tǒng)計結(jié)果中,財務(wù)危機公司誤判成健康公司的個數(shù)為4;而將健康公司誤判成財務(wù)危機公司的個數(shù)是2。這顯示了卷積神經(jīng)網(wǎng)絡(luò)在分類預(yù)警中的優(yōu)勢,降低了將危機公司判斷成健康公司的概率。
3、結(jié)論
以電子商務(wù)環(huán)境下上市公司的財務(wù)危機具有持續(xù)性和累積性為出發(fā)點,綜合運用卷積神經(jīng)、財務(wù)危機預(yù)測理論以及SPSS和Python編程技術(shù),構(gòu)建了以盈利能力、償債能力、成長能力、財務(wù)杠桿、經(jīng)營能力為主的指標(biāo)體系,提出了基于卷積神經(jīng)網(wǎng)絡(luò)的財務(wù)危機預(yù)測模型,通過對120家樣本公司的實證研究表明該方法在誤差率和識別正確率上顯示了優(yōu)越的性能,研究顯示預(yù)測準(zhǔn)確率達到91%,相比于統(tǒng)計類預(yù)測模型有很大的改善。這對于財務(wù)危機預(yù)測模型是一個巨大的進步,具有廣闊的應(yīng)用前景。
參考文獻:
[1] Tadaaki Hosaka.Bankruptcy prediction using imaged financial ratios and convolutional neural networks[J]. Expert Systems with Applications ,2019.117(1):287-299.
[2] A.Chaudhuri,K.DeFuzzy.support vector machine for bankruptcy prediction[J].Appl.Soft Comput,2012(2): 2472-2486.
[3] Marcantonio M D,Dellepiane U,Laghi E. Bankruptcy Prediction Using Support Vector Machines and Feature Selection During the Recent Financial Crisis[J]. International Journal of Economics and Finance,2015, 7(8):182-195.
作者簡介:黃麗霞,研究生,上海工程技術(shù)大學(xué)會計學(xué)專業(yè)。