趙雪峰 ,吳偉偉 ,吳德林 ,國(guó) 旭 ,時(shí)輝凝
(1.哈爾濱工業(yè)大學(xué)(深圳)經(jīng)濟(jì)管理學(xué)院,廣東 深圳 518006;2.哈爾濱工業(yè)大學(xué) 經(jīng)濟(jì)與管理學(xué)院,哈爾濱 150001;3.華為技術(shù)有限公司財(cái)經(jīng)財(cái)務(wù)管理部,廣東 深圳 523808;4.中國(guó)工商銀行集約運(yùn)營(yíng)中心,廣東 佛山 528010)
十三屆全國(guó)人大三次會(huì)議中,李克強(qiáng)總理指出,伴隨疫情爆發(fā),我國(guó)近6 億人民月收入不足千元。可見(jiàn),在疫情導(dǎo)致經(jīng)濟(jì)面臨較大下行壓力的背景下,一方面需采取紓困政策保障基本民生,另一方面需穩(wěn)住市場(chǎng),防止惡性事件沖擊市場(chǎng)帶來(lái)經(jīng)濟(jì)驟速下滑[1-2]。其中,惡性事件以公司危機(jī)而進(jìn)行財(cái)務(wù)造假為突出代表,由于財(cái)務(wù)造假不僅給債權(quán)人、投資人帶來(lái)巨大投資風(fēng)險(xiǎn)[3-5],而且會(huì)發(fā)生多米諾骨牌效應(yīng),造成我國(guó)經(jīng)濟(jì)雪上加霜[6-7]。因此,及時(shí)有效地對(duì)財(cái)務(wù)危機(jī)進(jìn)行預(yù)警預(yù)測(cè),可為扭轉(zhuǎn)財(cái)務(wù)危機(jī)局面的公司提供充足的操作空間[8],降低破產(chǎn)可能性,也可及時(shí)規(guī)避投資風(fēng)險(xiǎn),保護(hù)各利益相關(guān)方權(quán)益[9]。另外,在我國(guó)乃至全球經(jīng)濟(jì)下滑的環(huán)境中,對(duì)重塑人民信心也起到積極作用[10-11]。
目前,國(guó)內(nèi)外涌現(xiàn)出很多以財(cái)務(wù)特征為基礎(chǔ)構(gòu)建的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)測(cè)模型,有效地推動(dòng)了財(cái)務(wù)危機(jī)的智能預(yù)警,且每個(gè)學(xué)者的研究側(cè)重點(diǎn)也不盡相同,但可主要分為模型構(gòu)建及特征選取兩個(gè)方面。
從模型構(gòu)建上而言,逐漸從傳統(tǒng)機(jī)器學(xué)習(xí)延伸至深度學(xué)習(xí)及集成學(xué)習(xí)中。在以傳統(tǒng)機(jī)器學(xué)習(xí)為基礎(chǔ)的構(gòu)建中,Altman 等[12]構(gòu)建優(yōu)化Zeta 評(píng)判模型,提高了財(cái)務(wù)風(fēng)險(xiǎn)預(yù)測(cè)的準(zhǔn)確率。Beaver[13]基于控制變量原則,利用單變量方法預(yù)測(cè)企業(yè)財(cái)務(wù)危機(jī)。張茂軍等[14]基于Aalen可加模型,實(shí)證分析出上市公司違約概率與財(cái)務(wù)預(yù)警指標(biāo)間的關(guān)系,結(jié)果表明,總資產(chǎn)規(guī)模、營(yíng)業(yè)利潤(rùn)率、運(yùn)營(yíng)資金/資產(chǎn)總金額以及留存收益/資產(chǎn)總金額4個(gè)指標(biāo)均影響上市公司陷入財(cái)務(wù)困境的強(qiáng)度。鮑新中等[15]構(gòu)建了基于面板Logit模型的財(cái)務(wù)困境預(yù)警模型,并分別檢驗(yàn)了非財(cái)務(wù)指標(biāo)對(duì)財(cái)務(wù)預(yù)警模型的影響、行業(yè)差異對(duì)財(cái)務(wù)預(yù)警模型的影響以及預(yù)警臨界點(diǎn)的選擇對(duì)模型的影響。顧曉安等[16]將應(yīng)計(jì)盈余管理變量與真實(shí)盈余管理變量引入至Logistic財(cái)務(wù)預(yù)警模型中,并對(duì)由盈余管理行為導(dǎo)致的財(cái)務(wù)信息偏差進(jìn)行糾正,減少了因財(cái)務(wù)信息失真造成的預(yù)警模型誤判。鮑新中等[17]從32個(gè)財(cái)務(wù)與非財(cái)務(wù)指標(biāo)中選取11個(gè)指標(biāo)作為財(cái)務(wù)預(yù)警典型指標(biāo),在此基礎(chǔ)上,建立COX 比例風(fēng)險(xiǎn)模型。Kumar等[18]利用Logistic回歸、隨機(jī)森林和支持向量機(jī),可對(duì)不均衡預(yù)警財(cái)務(wù)數(shù)據(jù)進(jìn)行修正。黃超等[19]基于雙正交小波在非線性信號(hào)處理方面的良好性能,構(gòu)造基于雙正交小波混合核函數(shù)的KPCA-SVM 財(cái)務(wù)危機(jī)預(yù)警模型。王威[20]將Lasso和Logistic兩種模型進(jìn)行結(jié)合,提高財(cái)務(wù)風(fēng)險(xiǎn)預(yù)測(cè)的魯棒性。石先兵[21]結(jié)合降維算法和支持向量機(jī)的優(yōu)勢(shì),創(chuàng)建PCA-SVM 預(yù)警模型,有效提高模型泛化能力。
在以深度學(xué)習(xí)及集成學(xué)習(xí)為基礎(chǔ)的構(gòu)建中,王玉冬等[22]采用果蠅算法和粒子群算法構(gòu)建神經(jīng)網(wǎng)絡(luò)預(yù)警模型,解決了財(cái)務(wù)危機(jī)預(yù)警時(shí)收斂速度慢,易導(dǎo)致局部最優(yōu)解無(wú)解的缺陷。Niu 等[23]提出一種基于兩階段特征選擇的深度學(xué)習(xí)模型,在有效地捕捉多元金融時(shí)間序列非線性的同時(shí),采用誤差修正模型對(duì)預(yù)測(cè)結(jié)果進(jìn)行校正,提高了模型泛化性及預(yù)測(cè)準(zhǔn)確率。吳沖等[24]利用可動(dòng)態(tài)調(diào)整參數(shù)的粒子群算法,優(yōu)化概率神經(jīng)網(wǎng)絡(luò)的平滑參數(shù),進(jìn)而解決概率神經(jīng)網(wǎng)絡(luò)平滑參數(shù)確定及空間結(jié)構(gòu)復(fù)雜的問(wèn)題。肖毅等[25]集成文本挖掘和深度學(xué)習(xí)構(gòu)建企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型,提出融合卷積神經(jīng)網(wǎng)絡(luò)和長(zhǎng)短期記憶網(wǎng)絡(luò)的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警動(dòng)態(tài)建模方法,并以中國(guó)信息服務(wù)業(yè)上市公司為樣本開(kāi)展實(shí)證研究。劉小萌等[26]分別利用傳統(tǒng)多變量區(qū)別分析方法及基因類神經(jīng)網(wǎng)絡(luò)建立預(yù)測(cè)模型,以檢驗(yàn)兩者中何者具有更高的預(yù)測(cè)能力,表示基因類神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)效果有更佳的一般性,更能讓外部關(guān)系人將模型應(yīng)用于樣本外的企業(yè)風(fēng)險(xiǎn)預(yù)測(cè)。
從特征選擇上而言,從影響公司財(cái)務(wù)狀況的角度,可將特征分為財(cái)務(wù)特征和非財(cái)務(wù)特征,不同研究人員對(duì)于特征研究的側(cè)重點(diǎn)也不同。李江宇等[27]從證券公司對(duì)上市公司財(cái)務(wù)指標(biāo)的預(yù)期差角度分析,定量考察財(cái)務(wù)數(shù)據(jù)預(yù)期差的價(jià)值發(fā)現(xiàn)能力,分析驗(yàn)證了財(cái)務(wù)預(yù)期差因子對(duì)于超額收益的解釋力度。Huang等[28]選取加權(quán)平均利率、全國(guó)房地產(chǎn)繁榮指數(shù)、貨幣供應(yīng)量M2、宣布有效匯率、深圳成分指數(shù)等18個(gè)替代指標(biāo),建立金融狀況指數(shù),分析表明,利率、房地產(chǎn)價(jià)格、貨幣供應(yīng)量、匯率和股票價(jià)格,可有效地反映我國(guó)實(shí)際金融狀況,同時(shí)證明在財(cái)政緊縮時(shí),可通過(guò)金融指標(biāo)的變化實(shí)現(xiàn)預(yù)警。王昱等[29]從經(jīng)營(yíng)效率、財(cái)務(wù)效率、融資效率和人力資本效率4個(gè)維度的效率特征出發(fā),分別提出相對(duì)應(yīng)的投入產(chǎn)出指標(biāo)體系,并采用數(shù)據(jù)包絡(luò)法評(píng)價(jià)上市公司對(duì)各個(gè)維度的相對(duì)有效性,并在此基礎(chǔ)上,將得到的多維效率指標(biāo)與財(cái)務(wù)指標(biāo)相融合。Yan等[30]利用無(wú)約束分布滯后模型和支持向量機(jī)(SVM),引入3~5個(gè)周期滯后的財(cái)務(wù)比率和宏觀經(jīng)濟(jì)因素,從而檢測(cè)出公司內(nèi)外部的早期變化對(duì)其財(cái)務(wù)狀況的影響。王蓮喬等[31]發(fā)現(xiàn),融資強(qiáng)度對(duì)PPP 項(xiàng)目財(cái)務(wù)風(fēng)險(xiǎn)有正向影響,私營(yíng)部門投資比例負(fù)向調(diào)節(jié)了這一影響,且該調(diào)節(jié)作用依賴于國(guó)家宏觀環(huán)境的財(cái)務(wù)風(fēng)險(xiǎn)結(jié)論。尹建華等[32]發(fā)現(xiàn),重污染企業(yè)往往選擇犧牲環(huán)境績(jī)效來(lái)提高財(cái)務(wù)績(jī)效,企業(yè)規(guī)模越大,環(huán)境績(jī)效對(duì)財(cái)務(wù)績(jī)效的負(fù)向影響越小,而企業(yè)所有制形式對(duì)兩者關(guān)系的調(diào)節(jié)效應(yīng)不顯著,另外也發(fā)現(xiàn),企業(yè)客觀特征對(duì)環(huán)境績(jī)效和財(cái)務(wù)績(jī)效之間的調(diào)節(jié)作用還依賴于積極的環(huán)境信息披露。劉端等[33]研究得出客戶關(guān)系越集中,重要程度越大,則企業(yè)的財(cái)務(wù)績(jī)效水平越高,客戶關(guān)系集中度對(duì)存貨資源效率、營(yíng)銷資源效率以及應(yīng)收賬款資源效率具有顯著的正向影響,企業(yè)的這三大有形資源效率是客戶關(guān)系集中度作用于企業(yè)財(cái)務(wù)績(jī)效。
根據(jù)文獻(xiàn)內(nèi)容綜合分析,相比于深度學(xué)習(xí)預(yù)警模型而言,傳統(tǒng)機(jī)器學(xué)習(xí)預(yù)警模型主要圍繞控制特征或修正特征偏差等作為研究切入點(diǎn),如通過(guò)控制變量原則,研究單變量下的企業(yè)財(cái)務(wù)危機(jī)[13]、將盈余管理變量引入至Logistic財(cái)務(wù)預(yù)警模型中,并對(duì)由盈余管理行為導(dǎo)致的財(cái)務(wù)信息偏差進(jìn)行糾正,減少預(yù)警模型誤判[16]等。而深度學(xué)習(xí)預(yù)警模型相比于傳統(tǒng)機(jī)器學(xué)習(xí)預(yù)警模型,由于深度學(xué)習(xí)內(nèi)部參數(shù)眾多、結(jié)構(gòu)更復(fù)雜,故更傾向于研究模型組合及模型結(jié)構(gòu)優(yōu)化,如將卷積神經(jīng)網(wǎng)絡(luò)和長(zhǎng)短期記憶網(wǎng)絡(luò)融合[25]、利用可動(dòng)態(tài)調(diào)整參數(shù)的粒子群算法,優(yōu)化概率預(yù)警神經(jīng)網(wǎng)絡(luò)的平滑參數(shù)[24]等。但通常而言,傳統(tǒng)機(jī)器學(xué)習(xí)預(yù)警模型受限于結(jié)構(gòu)較為簡(jiǎn)單,難以適應(yīng)復(fù)雜企業(yè)場(chǎng)景下的預(yù)警分析,同時(shí),通過(guò)特征控制、修正等方案也可能存在主觀因素,因而在一般情況下預(yù)警表現(xiàn)不如深度學(xué)習(xí)預(yù)警模型。但深度學(xué)習(xí)預(yù)警模型也因結(jié)構(gòu)復(fù)雜、內(nèi)部參數(shù)多等因素,在預(yù)警分析之前,需在訓(xùn)練階段利用大量準(zhǔn)確無(wú)誤的訓(xùn)練數(shù)據(jù)集調(diào)整優(yōu)化內(nèi)部參數(shù),一方面,收集大量準(zhǔn)確無(wú)誤的訓(xùn)練數(shù)據(jù)集難度高;另一方面,當(dāng)訓(xùn)練數(shù)據(jù)集數(shù)量或純潔度不滿足模型要求時(shí),又容易出現(xiàn)預(yù)警表現(xiàn)差的現(xiàn)象[41]。因此,為了解決因模型結(jié)構(gòu)簡(jiǎn)單或訓(xùn)練數(shù)據(jù)集缺失而導(dǎo)致的傳統(tǒng)機(jī)器學(xué)習(xí)或深度學(xué)習(xí)預(yù)警表現(xiàn)下滑問(wèn)題,本文在CART 樹對(duì)訓(xùn)練數(shù)據(jù)集不敏感的前提下,集成多棵CART 樹得到集成分類器,從而達(dá)到提高模型復(fù)雜度的同時(shí),規(guī)避訓(xùn)練數(shù)據(jù)集缺失的問(wèn)題,從而整體優(yōu)化預(yù)警表現(xiàn)。
在影響企業(yè)財(cái)務(wù)危機(jī)的特征研究中,目前多數(shù)僅以某一類特征為前提,分析該類特征對(duì)財(cái)務(wù)造假的影響,由于考慮特征單一,而實(shí)際企業(yè)財(cái)務(wù)出現(xiàn)危機(jī),也歸咎于眾多因素的綜合影響,從而導(dǎo)致該方法運(yùn)用至實(shí)際場(chǎng)景有限;少數(shù)研究方法雖綜合多種可能影響企業(yè)財(cái)務(wù)危機(jī)的特征因素,但缺乏對(duì)不同特征之間的因果關(guān)系分析,從而造成企業(yè)預(yù)警分析時(shí),因特征維度過(guò)大,造成特征冗余現(xiàn)象,又因特征冗余容易造成模型過(guò)擬合,導(dǎo)致模型預(yù)警表現(xiàn)下滑的現(xiàn)象[27]。因此,為了解決因特征單一導(dǎo)致財(cái)務(wù)預(yù)警應(yīng)用場(chǎng)景受限,或因特征維度過(guò)大造成模型過(guò)擬合的問(wèn)題,本文對(duì)所收集的高維特征執(zhí)行因果分析,從而優(yōu)化出合理維度范圍的特征集合,并基于上述集成分類器和已優(yōu)化的特征集合完成企業(yè)預(yù)警,從而有效規(guī)避因財(cái)務(wù)特征影響預(yù)警表現(xiàn)的現(xiàn)象。
目前預(yù)警模型構(gòu)建及預(yù)警特征選擇相對(duì)獨(dú)立,從模型構(gòu)建角度而言,機(jī)器學(xué)習(xí)多以變量控制法,深度學(xué)習(xí)多以訓(xùn)練調(diào)參法預(yù)測(cè)企業(yè)財(cái)務(wù)危機(jī),并沒(méi)有考慮不同企業(yè)特征對(duì)預(yù)警模型的影響;從預(yù)警特征選擇角度而言,利用特征選擇法實(shí)現(xiàn)特征選擇,并通過(guò)實(shí)證數(shù)據(jù)研究特征選擇法的有效性。可見(jiàn),在企業(yè)財(cái)務(wù)預(yù)警研究中,特征選擇與模型構(gòu)建相對(duì)獨(dú)立且割裂,缺乏一種可有效從海量特征中選擇出價(jià)值特征,并直接實(shí)現(xiàn)企業(yè)預(yù)警的端到端方法。
除此之外,關(guān)于預(yù)警模型的應(yīng)用價(jià)值,主流方向還是通過(guò)實(shí)證數(shù)據(jù)或仿真數(shù)據(jù),驗(yàn)證其預(yù)警準(zhǔn)確率,客觀而言,準(zhǔn)確率確實(shí)在某種程度上可衡量出模型實(shí)用價(jià)值,但不同預(yù)警模型在不同特征維度范圍內(nèi),其預(yù)警效果是否也各不相同? 即不同財(cái)務(wù)預(yù)警模型可能具有不同的特征最優(yōu)維度,當(dāng)在特征最優(yōu)維度下,其預(yù)警表現(xiàn)最優(yōu)。然而,目前研究中,缺乏對(duì)預(yù)警模型與特征維度的實(shí)證探討,從而無(wú)法得到更具指導(dǎo)意義的研究?jī)r(jià)值。
綜上所述,本文結(jié)合現(xiàn)有研究成果,以克服機(jī)器學(xué)習(xí)及深度學(xué)習(xí)構(gòu)建預(yù)警模型的弊端、特征維度造成預(yù)警場(chǎng)景受限、預(yù)警表現(xiàn)不佳為目的,構(gòu)建出以特征因果關(guān)系分析為基礎(chǔ)的集成財(cái)務(wù)預(yù)警模型(An boosted model of corporate financial early warning based on characteristic causality analysis,簡(jiǎn)稱CFW-Boost模型),從而完成特征優(yōu)化與企業(yè)預(yù)警端到端的實(shí)現(xiàn),并通過(guò)中國(guó)A 股上市公司實(shí)證數(shù)據(jù)訓(xùn)練CFW-Boost后,進(jìn)一步探究CFW-Boost模型與其他預(yù)警模型在不同特征維度的預(yù)警表現(xiàn),在確定存在特征最優(yōu)維度的結(jié)論下,對(duì)比分析與其他模型的異同點(diǎn),進(jìn)一步體現(xiàn)CFW-Boost的優(yōu)勢(shì)性,進(jìn)而得出管理結(jié)論。
根據(jù)財(cái)務(wù)預(yù)警要求和CFW-Boost模型特征,財(cái)務(wù)預(yù)警中的CFW-Boost模型分為3個(gè)模塊,分別為平穩(wěn)性檢驗(yàn)、特征因果分析及集成分類器預(yù)測(cè),3個(gè)模塊的主要構(gòu)建過(guò)程如圖1所示。
其中,CFW-Boost模型的核心在于特征因果分析及集成分類器預(yù)測(cè),其中特征因果分析主要基于高維特征集X與低維特征集的映射關(guān)系,將高維特征集X降維至低維特征集,進(jìn)而利用集成分類器,構(gòu)建低維特征集的目標(biāo)函數(shù),并優(yōu)化目標(biāo)函數(shù)得到財(cái)務(wù)預(yù)警結(jié)果。
X——高維特征集,且X=,…,表示公司在t時(shí)刻下可能影響公司財(cái)務(wù)狀況的第i個(gè)特征
——低維特征集,利用X求解得到的,,且n≥m,T≥R
q——高維特征集的樣本總量
p——低維特征集的樣本總量,且p≤q
——表示低維特征集中第j樣本對(duì)應(yīng)的公司財(cái)務(wù)真實(shí)標(biāo)簽,j=1,2,…,p
——表示低維特征集中第j樣本對(duì)應(yīng)的公司財(cái)務(wù)預(yù)測(cè)標(biāo)簽,j=1,2,…,p
fk)——表示編號(hào)為k的CART樹根據(jù)第j個(gè)樣本生成的目標(biāo)函數(shù),k=1,2,…,K
Tun?[34]指出,公司財(cái)務(wù)狀況應(yīng)綜合多個(gè)維度多個(gè)指標(biāo)進(jìn)行分析,故本文所述的高維特征集的特征數(shù)量不少于上百個(gè),但如何從上百個(gè)特征中選擇與公司財(cái)務(wù)狀況息息相關(guān)的特征,是CFW-Boost模型首先需要做的工作。
一般情況下,影響公司財(cái)務(wù)特征均是平穩(wěn)隨機(jī)過(guò)程生成的時(shí)間序列數(shù)據(jù),根據(jù)Song等[35]所述,以平穩(wěn)時(shí)間序列數(shù)據(jù)為基礎(chǔ)的經(jīng)濟(jì)分析具有有效性,故先構(gòu)建平穩(wěn)性檢驗(yàn)方程,檢查高維特征集的平穩(wěn)性,且僅保留具有平穩(wěn)性的特征。平穩(wěn)性檢驗(yàn)方程為
當(dāng)利用平穩(wěn)性剔除部分高維特征后,進(jìn)一步利用高維特征集構(gòu)建映射到低維特征集的期望函數(shù),并最優(yōu)化期望函數(shù)的參數(shù)值,反向求解得到低維特征集。
綜上可知,首先構(gòu)建高維特征集X映射到低維特征集的映射關(guān)系:
在式(2)中,Λ是變化矩陣,維度為n×m,在低維特征集的每個(gè)特征,均滿足標(biāo)準(zhǔn)正態(tài)分布(0,I)的假設(shè)下,變化矩陣的作用是將的維度從m變?yōu)閚,將的均值由0變?yōu)棣?同樣地,噪點(diǎn)ò滿足高斯分布ò~N(0,φ)。根據(jù)多元高斯分布求解式(2)的聯(lián)合分布為
根據(jù)協(xié)方差公式分別計(jì)算式(4)的方差:
結(jié)合式(6)~(10),得出方差為
進(jìn)一步,當(dāng)最優(yōu)化出參數(shù)μ,Λ,φ,即可計(jì)算出。根據(jù)最大似然估計(jì)法與p的概率分布,構(gòu)建包括μ、Λ、φ的似然函數(shù):
由Jensen不等式知,若函數(shù)f(x)為凸函數(shù),則f(x)的期望函數(shù)大于或等于函數(shù)的期望,對(duì)應(yīng)的數(shù)學(xué)表達(dá)式為f(E[x])≤E[f(x)],因此,似然函數(shù)為
當(dāng)Jensen不等式等號(hào)成立時(shí),當(dāng)且僅當(dāng)x為常量時(shí),f(E[x])=E[f(x)],故式(13)的值為
在式(2)中,在假設(shè)每個(gè)特征均滿足標(biāo)準(zhǔn)正態(tài)分布(0,I)時(shí),聯(lián)立式(12)、(14)得出:
結(jié)合式(11)、(15)和式(16),分別求得μ、Λ、φ、原始樣本X和低維特征集的關(guān)系表達(dá)式為:
進(jìn)一步,迭代出μ、Λ、φ參數(shù)的最優(yōu)解,并聯(lián)立μ、Λ、φ的最優(yōu)解和式(2),求解得到低維特征集,從而將高維特征集中n個(gè)特征降低至低維特征集的m個(gè)特征。
當(dāng)完成降維操作后,根據(jù)集成分類器可處理多種特征,并依然保持較高準(zhǔn)確度的優(yōu)點(diǎn)[36],將CART 決策樹作為集成分類器中的最小單元,并在不同的企業(yè)預(yù)警場(chǎng)景中,集成不同數(shù)量的CART 決策樹,當(dāng)利用低維特征集集成多棵CART 樹得到集成分類器時(shí),假設(shè)集成分類器生成公司財(cái)務(wù)預(yù)測(cè)標(biāo)簽的分類函數(shù)為
當(dāng)集成K棵CART 樹的分類函數(shù)為
集成CART 樹的數(shù)量K與分類準(zhǔn)確度并非是正比關(guān)系,即并非K值越大,預(yù)測(cè)標(biāo)簽越接近真實(shí)標(biāo)簽[37],因此,在集成每棵CART 樹時(shí),需要利用目標(biāo)函數(shù)衡量集成后的分類器,是否比集成前的分類器在分類效果上更優(yōu)異。其中,目標(biāo)函數(shù)為
式中:objectK為集成了K棵CART 樹時(shí)的目標(biāo)函數(shù);為公司財(cái)務(wù)真實(shí)標(biāo)簽與預(yù)測(cè)標(biāo)簽的誤差函數(shù)。
進(jìn)一步,在集成分類函數(shù)中引入正則化項(xiàng)Ω(fk),當(dāng)在集成CART 樹過(guò)程時(shí),正則化項(xiàng)會(huì)依賴CART 樹葉子節(jié)點(diǎn)個(gè)數(shù)、每個(gè)葉子節(jié)點(diǎn)的輸出值,從而防止集成分類器在預(yù)警過(guò)程中特征過(guò)擬合現(xiàn)象的發(fā)生。另外,本文在構(gòu)建集成分類器時(shí),不同CART 樹的不同葉子節(jié)點(diǎn)對(duì)應(yīng)不同的權(quán)重系數(shù),從而規(guī)避僅依賴于單棵或少部分CART 樹時(shí),造成預(yù)警泛化能力差的問(wèn)題。進(jìn)一步,懲罰項(xiàng)Ω(fk)為
式中:S為CART 樹的葉子結(jié)點(diǎn)數(shù);ωj為CART 樹葉子結(jié)點(diǎn)的權(quán)重,結(jié)合式(22)、(23),得到目標(biāo)函數(shù):
constant表示常數(shù)項(xiàng),基于泰勒展開(kāi)法則進(jìn)一步展開(kāi)目標(biāo)函數(shù),得到
式中,gj、hj分別為的一階和二階偏導(dǎo):
聯(lián)立式(25)~(27)得
進(jìn)一步求解權(quán)重的一階偏導(dǎo),可得
結(jié)合式(30)、(31),可得最終的目標(biāo)函數(shù)為
進(jìn)一步,利用基尼指數(shù)衡量每次增加CART 樹后的集成分類器,比未增加CART 樹時(shí)的分類器,在預(yù)測(cè)標(biāo)簽上的表現(xiàn)是否更優(yōu)異,直至增加CART樹后的集成分類器,無(wú)法比未增加時(shí)的分類器表現(xiàn)得更優(yōu)異,則得到適用于企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警的多層CART 數(shù)集成模型,即CFW-Boost模型。
利用國(guó)泰安證數(shù)據(jù)庫(kù)、各類企業(yè)網(wǎng)站等,獲取上市公司對(duì)應(yīng)的特征集,并根據(jù)CFW-Boost模型的理論構(gòu)建過(guò)程,將研究分為訓(xùn)練階段和測(cè)試階段,其中訓(xùn)練階段流程如圖2所示。
步驟1從公開(kāi)數(shù)據(jù)庫(kù)、各類企業(yè)網(wǎng)站等爬取企業(yè)特征數(shù)據(jù)集及對(duì)應(yīng)的公司財(cái)務(wù)真實(shí)標(biāo)簽集,將企業(yè)特征數(shù)據(jù)集分為模型訓(xùn)練集和模型測(cè)試集。進(jìn)一步,參照王昱等[29]以經(jīng)營(yíng)、財(cái)務(wù)、融資和人力資本等維度拆分指標(biāo),以及葛興浪等[38]所研究出的企業(yè)信息指標(biāo)體系,將模型訓(xùn)練集劃分為非財(cái)務(wù)高維特征集和財(cái)務(wù)高維特征集,利用CFW-Boost對(duì)非財(cái)務(wù)高維特征集和財(cái)務(wù)高維特征集進(jìn)行平穩(wěn)性檢驗(yàn),剔除少量非平穩(wěn)性數(shù)據(jù)得到平穩(wěn)性的高維特征集。
另外,本文所述公開(kāi)數(shù)據(jù)包括國(guó)泰安等數(shù)據(jù)庫(kù),而爬蟲手段主要是構(gòu)建爬蟲程序進(jìn)入佰騰網(wǎng)(https://www.baiten.cn/),并搜索目標(biāo)公司的專利申請(qǐng),并獲取對(duì)應(yīng)的專利指標(biāo),特別是公司專利申請(qǐng)的申請(qǐng)類別(發(fā)明、實(shí)用新型和外觀設(shè)計(jì))、專利所涉及的技術(shù)領(lǐng)域及主要核心技術(shù)三部分指標(biāo)。
步驟2構(gòu)建μ、Λ、φ與高維特征集的關(guān)系表達(dá)式及最優(yōu)化關(guān)系表達(dá)式,將高維特征集降維成低維特征集,其中,低維特征集包括非財(cái)務(wù)低維特征集及財(cái)務(wù)低維特征集。
步驟3利用低維特征集訓(xùn)練集成分類器,得到公司財(cái)務(wù)預(yù)測(cè)標(biāo)簽集。
步驟4利用公司財(cái)務(wù)預(yù)測(cè)標(biāo)簽集和步驟1中的公司財(cái)務(wù)真實(shí)標(biāo)簽集,計(jì)算出預(yù)測(cè)準(zhǔn)確率,若預(yù)測(cè)準(zhǔn)確率小于預(yù)設(shè)的準(zhǔn)確率閾值,調(diào)整集成分類器的內(nèi)部參數(shù)并返回步驟3,重新計(jì)算公司財(cái)務(wù)預(yù)測(cè)標(biāo)簽集,直至預(yù)測(cè)準(zhǔn)確率大于或等于預(yù)設(shè)的準(zhǔn)確率閾值時(shí),組合平穩(wěn)性檢驗(yàn)、降維及集成分類器,得到CFW-Boost模型。
步驟5利用步驟1 中的模型測(cè)試集測(cè)試CFW-Boost模型的準(zhǔn)確率,從而得到相關(guān)結(jié)論。
從國(guó)泰安等數(shù)據(jù)庫(kù)中提取2000~2020 年共3 812份上市公司的企業(yè)數(shù)據(jù)集,在數(shù)據(jù)清洗后,以是否處于ST(特別處理,Special Treatment)狀態(tài)劃分企業(yè)數(shù)據(jù)集,得到472份ST 企業(yè)數(shù)據(jù)集及3 167份正常企業(yè)數(shù)據(jù)集。另外,根據(jù)數(shù)據(jù)集中所記錄的公司信息,整理出以財(cái)務(wù)特征及非財(cái)務(wù)特征為分類原則的高維特征集。
根據(jù)表1知,本文以財(cái)務(wù)指標(biāo)和非財(cái)務(wù)指標(biāo)劃分企業(yè)特征,并基于經(jīng)營(yíng)能力、盈利能力、成長(zhǎng)能力以及管理層結(jié)構(gòu)進(jìn)行多級(jí)劃分,從而得到訓(xùn)練集和測(cè)試集。

表1 高維特征部分展示
在ST 企業(yè)數(shù)據(jù)集中,假設(shè)公司在本文研究時(shí)間范圍內(nèi)屢次被ST,則以首次被ST 的時(shí)間線為準(zhǔn),并根據(jù)首次被ST 的時(shí)間線或正常數(shù)據(jù)集中所記錄的時(shí)間線,對(duì)ST 數(shù)據(jù)集及正常數(shù)據(jù)集進(jìn)行平穩(wěn)性檢驗(yàn),當(dāng)完成平穩(wěn)性檢驗(yàn)后,按照CFW-Boost的降維步驟構(gòu)建代碼,迭代訓(xùn)練得到與高維特征表對(duì)應(yīng)的低維特征集。
按照?qǐng)D2將低維特征集(包括非財(cái)務(wù)低維特征集、財(cái)務(wù)低維特征集)作為第一訓(xùn)練數(shù)據(jù)集訓(xùn)練集成分類器,通過(guò)監(jiān)視目標(biāo)函數(shù)的函數(shù)值objectK,構(gòu)建出函數(shù)值與訓(xùn)練次數(shù)的曲線圖。同時(shí),為了對(duì)比低維特征相比于高維特征集,在集成分類器訓(xùn)練過(guò)程中的優(yōu)異性,將高維特征集(包括非財(cái)務(wù)高維特征集、財(cái)務(wù)高維特征集)作為第二訓(xùn)練數(shù)據(jù)集,訓(xùn)練集成分類器,得到低維特征集與高維特征集在集成分類器的訓(xùn)練對(duì)比圖(見(jiàn)圖3)。
根據(jù)圖3可得出,利用低維特征集訓(xùn)練集成分類器時(shí),當(dāng)訓(xùn)練次數(shù)達(dá)到700次后,目標(biāo)值變化幅度趨于穩(wěn)定,目標(biāo)值的平均值為0.051 9,集成分類器訓(xùn)練完成。利用高維特征集訓(xùn)練集成分類器時(shí),在訓(xùn)練次數(shù)達(dá)到900次后,目標(biāo)值變化幅度才趨于穩(wěn)定,且目標(biāo)值的平均值為0.063 6。可見(jiàn),利用CFW-Boost模型中的特征因果分析后得到的低維特征集,不管從訓(xùn)練次數(shù)還是目標(biāo)值大小及穩(wěn)定性上,都更有利于集成分類器的訓(xùn)練。
進(jìn)一步,Lasso 和Logistic 結(jié)合得到Lasso-Logistic[20],與利用降維算法和支持向量機(jī)創(chuàng)建得到的PCA-SVM[21]都是較為典型的具有特征分析及財(cái)務(wù)預(yù)警作用的模型。為了探究CFW-Boost相比于Lasso-Logistic、PCA-SVM 的優(yōu)劣勢(shì),對(duì)上述第二訓(xùn)練數(shù)據(jù)集進(jìn)行數(shù)據(jù)豐富得到第三訓(xùn)練數(shù)據(jù)集,依次訓(xùn)練CFW-Boost、Lasso-Logistic及PCASVM,得到對(duì)比圖(見(jiàn)圖4)。
根據(jù)圖4 可得出,在訓(xùn)練周期上,CFW-Boost周期最長(zhǎng),需達(dá)到1 500次左右目標(biāo)函數(shù)值才趨于穩(wěn)定,PCA-SVM 次之,目標(biāo)函數(shù)值趨于穩(wěn)定需約1 000次訓(xùn)練,Lasso-Logistic最少僅需1 000次;在目標(biāo)函數(shù)值上,當(dāng)各模型訓(xùn)練完成后,CFW-Boost的目標(biāo)函數(shù)值最小,平均值0.055,PCA-SVM 目標(biāo)函數(shù)值均值為0.081,Lasso-Logistic為0.067。可見(jiàn),CFW-Boost對(duì)第三訓(xùn)練數(shù)據(jù)集的適應(yīng)力最好,預(yù)警準(zhǔn)確率最高。
當(dāng)CFW-Boost訓(xùn)練完成后,參照2.1所述測(cè)試階段,本文以機(jī)器學(xué)習(xí)及深度學(xué)習(xí)為劃分依據(jù)選擇對(duì)比模型,其中,機(jī)器學(xué)習(xí)模型,依次選擇模型結(jié)構(gòu)簡(jiǎn)單、訓(xùn)練速度較快的Logistic,添加平穩(wěn)性檢驗(yàn)以提高模型魯棒性的Lasso-Logistic,低維特征集下表現(xiàn)優(yōu)異的支持向量機(jī)(SVN)、添加降維操作的PCA-SVM、高維特征集下表現(xiàn)優(yōu)異的隨機(jī)森林;而深度學(xué)習(xí)模型選擇典型代表的卷積神經(jīng)網(wǎng)絡(luò)及長(zhǎng)短期記憶網(wǎng)絡(luò),進(jìn)一步評(píng)估CFW-Boost的實(shí)際預(yù)警表現(xiàn)。
首先將包括83個(gè)維度的測(cè)試數(shù)據(jù)集平均分為3組,利用各模型分別測(cè)試在每組的準(zhǔn)確率,如表2所示。

表2 各模型測(cè)試準(zhǔn)確率
結(jié)合表2各模型表現(xiàn),以機(jī)器學(xué)習(xí)和深度學(xué)習(xí)區(qū)別點(diǎn)的角度:①深度學(xué)習(xí)相比于機(jī)器學(xué)習(xí),雖然在圖像及自然語(yǔ)言方向具有較為明顯的優(yōu)勢(shì)[39-40],但在公司財(cái)務(wù)預(yù)警方向上,以機(jī)器學(xué)習(xí)為基礎(chǔ)構(gòu)建的預(yù)警模型,預(yù)警表現(xiàn)并不一定比深度學(xué)習(xí)差,如PCA-SVM,其訓(xùn)練準(zhǔn)確率及測(cè)試準(zhǔn)確率,都明顯優(yōu)異于卷積神經(jīng)網(wǎng)絡(luò)及長(zhǎng)短期記憶網(wǎng)絡(luò);②單個(gè)機(jī)器學(xué)習(xí)算法構(gòu)建的預(yù)警模型,一般不具有特征篩選功能,如Logistic、支持向量機(jī)等,但可通過(guò)組合模型的方式,克服不具有特征篩選的缺點(diǎn),如Lasso-Logistic、PCA-SVM 等,且組合后的模型,預(yù)警表現(xiàn)一般可進(jìn)一步提高。
結(jié)合①、②所述,在公司財(cái)務(wù)預(yù)警上,相比于深度學(xué)習(xí)模型,合適的組合多個(gè)機(jī)器學(xué)習(xí)會(huì)得到更優(yōu)異的預(yù)警表現(xiàn)。因此,本文以該思想,集成多棵CART 得到CFW-Boost。
從每個(gè)模型具體表現(xiàn)的角度看,8組模型都可實(shí)現(xiàn)財(cái)務(wù)預(yù)警的作用,但CFW-Boost模型相比于其他7組模型,準(zhǔn)確率更高,在本文設(shè)定每組模型均訓(xùn)練2 000次的前提下,CFW-Boost訓(xùn)練準(zhǔn)確率達(dá)到最高的95.77%,優(yōu)異于表現(xiàn)次好的PCA-SVM。另外,CFW-Boost也具有更優(yōu)秀的特征篩選能力,與卷積神經(jīng)網(wǎng)絡(luò)、長(zhǎng)短期記憶網(wǎng)絡(luò)、PCA-SVM 以及Lasso-Logistic等,同樣具有特征篩選的其他模型對(duì)比,CFW-Boost測(cè)試準(zhǔn)確率領(lǐng)先于其他組模型,達(dá)到85.56%。因此,綜合來(lái)講,CFW-Boost具備較強(qiáng)的特征篩選能力,且有效提高公司財(cái)務(wù)預(yù)警準(zhǔn)確率。
為了進(jìn)一步探究企業(yè)數(shù)據(jù)集中,特征維度變化對(duì)CFW-Boost預(yù)警表現(xiàn)的影響,通過(guò)按比例去除特征的原則,對(duì)上述測(cè)試數(shù)據(jù)集共83組特征執(zhí)行去除操作,如依次去除測(cè)試數(shù)據(jù)集中25%特征、50%特征及75%特征,分別得到25%測(cè)試數(shù)據(jù)集、50%測(cè)試數(shù)據(jù)集和75%測(cè)試數(shù)據(jù)集,對(duì)應(yīng)的原測(cè)試數(shù)據(jù)集簡(jiǎn)稱0%測(cè)試數(shù)據(jù)集,表示未執(zhí)行特征去除操作。之后依次用0%、25%、50%及75%共4組測(cè)試數(shù)據(jù)集,評(píng)估上述8組模型的預(yù)警表現(xiàn),如表3所示。

表3 比例去除特征下各模型測(cè)試準(zhǔn)確率
可見(jiàn),隨著測(cè)試數(shù)據(jù)集中特征維度的不斷變少,不同模型的準(zhǔn)確率變化幅度也有較大差異。其中,特征維度變化對(duì)PCA-SVM 及Lasso-Logistic的測(cè)試準(zhǔn)確率影響最小,變化幅度值不大于2.5%,對(duì)CFW-Boost、卷積神經(jīng)網(wǎng)絡(luò)及長(zhǎng)短期記憶網(wǎng)絡(luò)的準(zhǔn)確率影響最大,且隨著特征維度的不斷變少,卷積神經(jīng)網(wǎng)絡(luò)及長(zhǎng)短期記憶網(wǎng)絡(luò)的準(zhǔn)確率不斷降低。
為進(jìn)一步探究特征維度變化對(duì)CFW-Boost預(yù)警表現(xiàn)的影響,按照每組測(cè)試數(shù)據(jù)集依次遞減5%的方法,得到0%,5%,10%,…,80%,85%,共18組測(cè)試數(shù)據(jù)集。其中,0%測(cè)試數(shù)據(jù)集依然表示未剔除特征,85%測(cè)試數(shù)據(jù)集表示已剔除85%特征數(shù)后的數(shù)據(jù)集。
匯總每個(gè)模型在上述18組測(cè)試數(shù)據(jù)集的準(zhǔn)確率,構(gòu)建得到準(zhǔn)確率與特征去除比例的點(diǎn)線圖(見(jiàn)圖5)。
進(jìn)一步,利用4階多項(xiàng)式擬合圖5中每條點(diǎn)線,得到準(zhǔn)確率與特征去除比例的擬合曲線圖(見(jiàn)圖6)。
由圖6 各擬合曲線的總體表現(xiàn)可見(jiàn),CFWBoost及Logistic、PCA-SVM、隨機(jī)森林等機(jī)器學(xué)習(xí)類模型,在伴隨企業(yè)特征維度減少時(shí),準(zhǔn)確率會(huì)呈現(xiàn)小范圍內(nèi)波動(dòng),總體趨于平緩下降的現(xiàn)象;而以深度學(xué)習(xí)為代表的長(zhǎng)短期記憶網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò),準(zhǔn)確率則會(huì)出現(xiàn)無(wú)波動(dòng)的急劇下降現(xiàn)象。因此,CFW-Boost及機(jī)器學(xué)習(xí)類模型,相比于長(zhǎng)短期記憶網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò),具有更強(qiáng)的模型穩(wěn)定性和魯棒性。
重要地,每組模型都對(duì)應(yīng)特征最優(yōu)維度,即相比于模型在非最優(yōu)維度的表現(xiàn)來(lái)看,在最優(yōu)維度數(shù)下的預(yù)警表現(xiàn)往往最好。其中,CFW-Boost的特征最優(yōu)維度約為[63,82](對(duì)應(yīng)圖6中X軸[0,23]),此時(shí)測(cè)試準(zhǔn)確率高達(dá)87.26%,明顯優(yōu)于其他模型;而當(dāng)特征數(shù)去除比例大于23%后,CFW-Boost的預(yù)警表現(xiàn)逐漸下滑,在[47,63]區(qū)間內(nèi)(對(duì)應(yīng)圖6中X軸[23,42]),CFW-Boost的預(yù)警表現(xiàn)被PCA-SVM反超,即[47,63]變?yōu)镻CA-SVM 的特征最優(yōu)維度。換言之,CFW-Boost相比于其他模型,其特征最優(yōu)維度較大(如本文所給定的測(cè)試數(shù)據(jù)集,其財(cái)務(wù)特征最優(yōu)維度數(shù)為[63,82]),進(jìn)而得到CFW-Boost對(duì)低維特征的財(cái)務(wù)預(yù)警表現(xiàn)力一般,但在高維特征中具有明顯優(yōu)勢(shì),預(yù)警準(zhǔn)確率較大幅度高于其他模型。
本文在多數(shù)模型執(zhí)行企業(yè)財(cái)務(wù)預(yù)警時(shí),由于考慮特征維度單一,進(jìn)而影響預(yù)警準(zhǔn)確率的背景下,以分析特征因果關(guān)系為基礎(chǔ),集成多棵CART 樹構(gòu)建得到CFW-Boost,并利用實(shí)證數(shù)據(jù)進(jìn)行訓(xùn)練,進(jìn)一步分析CFW-Boost相比于其他預(yù)警模型在實(shí)證數(shù)據(jù)中的預(yù)警表現(xiàn),進(jìn)而得出:
(1)企業(yè)財(cái)務(wù)受多種因素影響,因此,根據(jù)財(cái)務(wù)指標(biāo)及非財(cái)務(wù)指標(biāo)識(shí)別出多類財(cái)務(wù)特征,并通過(guò)特征因果分析降低多類財(cái)務(wù)特征的特征維度后,基于CFW-Boost內(nèi)的CART 樹分析每種財(cái)務(wù)特征對(duì)企業(yè)風(fēng)險(xiǎn)的影響,構(gòu)建面向特征因果分析的CFWBoost企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型。經(jīng)過(guò)數(shù)值分析及與其他財(cái)務(wù)預(yù)警模型的對(duì)比分析發(fā)現(xiàn),本文構(gòu)建的模型在提高預(yù)警準(zhǔn)確率的同時(shí),通過(guò)特征因果分析可有效降低多類特征的特征維度,避免因特征維度過(guò)高產(chǎn)生特征冗余,造成CFW-Boost過(guò)擬合,模型魯棒性下降的現(xiàn)象。
(2)通過(guò)集成多棵CART 樹得到的CFWBoost,在與其他組合模型及深度學(xué)習(xí)模型對(duì)比中發(fā)現(xiàn),CFW-Boost雖需更高的訓(xùn)練周期,但無(wú)論在訓(xùn)練階段還是測(cè)試階段,其預(yù)警準(zhǔn)確率更高、預(yù)警表現(xiàn)也更穩(wěn)定;同時(shí),特征維度的變化會(huì)影響CFWBoost的預(yù)警準(zhǔn)確率,在特征從高維降為低維的過(guò)程中,CFW-Boost的準(zhǔn)確率會(huì)呈現(xiàn)局部范圍內(nèi)波動(dòng),總體平緩下降的現(xiàn)象。因此,在高維特征時(shí)選擇CFW-Boost進(jìn)行企業(yè)預(yù)警時(shí)效果更優(yōu)。
(3)各財(cái)務(wù)預(yù)警模型均具有各自對(duì)應(yīng)的特征最優(yōu)維度,在特征最優(yōu)維度下,對(duì)應(yīng)的財(cái)務(wù)預(yù)警模型的預(yù)警表現(xiàn)最優(yōu)。其中,CFW-Boost的特征最優(yōu)維度相比于其他預(yù)警而言,其維度數(shù)值最大,表示CFWBoost相比于其他預(yù)警模型,在高維特征中預(yù)警準(zhǔn)確率更高,優(yōu)異性更強(qiáng)。
基于本文研究結(jié)論,可對(duì)企業(yè)及市場(chǎng)監(jiān)督部門提出如下建議:由于不同模型的預(yù)警準(zhǔn)確率及穩(wěn)定性上均具有差異性,每組模型一般都對(duì)應(yīng)特征最優(yōu)維度,故在應(yīng)用模型對(duì)企業(yè)進(jìn)行財(cái)務(wù)預(yù)警時(shí),需實(shí)際結(jié)合企業(yè)性質(zhì),選擇出最適合企業(yè)的預(yù)警模型。其中重要地,可依賴所實(shí)際結(jié)合的企業(yè)性質(zhì),確定企業(yè)的特征最優(yōu)維度,在最優(yōu)維度內(nèi)可選擇出企業(yè)所對(duì)應(yīng)的最優(yōu)預(yù)警模型。進(jìn)一步,當(dāng)特征最優(yōu)維度的數(shù)值較大時(shí),CFW-Boost的預(yù)警表現(xiàn)優(yōu)異于其他模型,實(shí)際應(yīng)用價(jià)值更高,因而合理選擇CFW-Boost進(jìn)行企業(yè)財(cái)務(wù)預(yù)警,可有效提高預(yù)警準(zhǔn)確率,避免因模型的錯(cuò)誤預(yù)測(cè),給予企業(yè)及市場(chǎng)造成經(jīng)濟(jì)風(fēng)險(xiǎn)。