王 沖 劉亞麗
公司的經(jīng)營(yíng)必然會(huì)與風(fēng)險(xiǎn)相伴,這讓公司的未來充滿了更多的不確定因素。如果公司沒有控制好自己的風(fēng)險(xiǎn),就會(huì)導(dǎo)致公司陷入財(cái)務(wù)危機(jī)。一般而言,公司倒閉危機(jī)初期總會(huì)出現(xiàn)一些局部問題。在財(cái)務(wù)方面,它會(huì)呈現(xiàn)為單個(gè)和與之有關(guān)的指標(biāo)的異常,這就是所謂的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警。一個(gè)有效的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警系統(tǒng),可以對(duì)企業(yè)運(yùn)營(yíng)管理進(jìn)行預(yù)警,防止企業(yè)破產(chǎn)。企業(yè)的財(cái)務(wù)風(fēng)險(xiǎn)受多種因素的影響,而各種因素的作用最后又會(huì)通過財(cái)務(wù)指標(biāo)反映到企業(yè)。所以,要對(duì)財(cái)務(wù)危機(jī)企業(yè)和正常企業(yè)在財(cái)務(wù)指標(biāo)上存在的不同點(diǎn)進(jìn)行分析,找到財(cái)務(wù)風(fēng)險(xiǎn)與財(cái)務(wù)指標(biāo)之間的關(guān)系,構(gòu)建出危機(jī)預(yù)警模型,這樣能夠使公司高管及時(shí)判斷、預(yù)防及管控財(cái)務(wù)危機(jī)。
隨著信息化進(jìn)程的加快,財(cái)務(wù)風(fēng)險(xiǎn)的預(yù)測(cè)已由傳統(tǒng)的統(tǒng)計(jì)學(xué)方法向更加智能、更加精確的人工智能方法發(fā)展。流行的基于機(jī)器學(xué)習(xí)(ML)的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型包括樸素貝葉斯(NB)、神經(jīng)網(wǎng)絡(luò)(NNS)、K-近鄰(KNN)、支持向量機(jī)(SVM)、決策樹(DT)等。集成學(xué)習(xí)算法是將多個(gè)弱分類器聚合為一個(gè)較強(qiáng)分類器,被認(rèn)為是主流的基于ML 的模型(Pavlicko et al.,2021;Yan et al.,2020)。像梯度提升樹模型(GBDT)(Liu et al.,2022)這樣的增強(qiáng)集成方法被認(rèn)為是財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警的流行解決方案。
然而現(xiàn)有研究較少考慮財(cái)務(wù)數(shù)據(jù)質(zhì)量的問題,最近幾年國(guó)家一直在加強(qiáng)對(duì)上市公司的監(jiān)督。但是財(cái)務(wù)舞弊仍然時(shí)有發(fā)生,迫切需要探索一種新的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模式(錢蘋和羅玫,2015)。財(cái)務(wù)舞弊指的是一家公司為了虛報(bào)利潤(rùn),來美化價(jià)值表現(xiàn),利用各種手段,刻意修改自己的財(cái)務(wù)指標(biāo)數(shù)據(jù),從而高估自己的資產(chǎn)或低估自己的負(fù)債(余思明等,2020)。會(huì)計(jì)造假會(huì)造成會(huì)計(jì)信息的扭曲,使會(huì)計(jì)信息質(zhì)量下降,從而對(duì)會(huì)計(jì)信息的風(fēng)險(xiǎn)預(yù)警能力產(chǎn)生很大的影響。在構(gòu)建財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的時(shí)候,一定要對(duì)財(cái)務(wù)數(shù)據(jù)質(zhì)量問題所帶來的影響進(jìn)行充分的考量,從而提升對(duì)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型進(jìn)行預(yù)測(cè)的精度(楊貴軍等,2019)。
本文考慮到財(cái)務(wù)舞弊等原因?qū)ω?cái)務(wù)數(shù)據(jù)質(zhì)量的影響,以我國(guó)A股上市公司2000-2021年的財(cái)務(wù)數(shù)據(jù)為研究樣本,根據(jù)Benford 律構(gòu)造Benford 因子,構(gòu)建基于集成方法XGBoost的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型,本文的研究成果將為企業(yè)在危機(jī)發(fā)生前預(yù)警、防范風(fēng)險(xiǎn)、提升企業(yè)經(jīng)營(yíng)效率等提供參考。
1930 年至今,針對(duì)企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警的研究方法從開始的趨勢(shì)分析、判別分析,再到現(xiàn)在的人工智能技術(shù),從傳統(tǒng)的計(jì)量模型再到機(jī)器學(xué)習(xí)模型和深度學(xué)習(xí)模型的應(yīng)用,財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的研究日漸成熟,為企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警研究奠定了基礎(chǔ)。
對(duì)公司破產(chǎn)危機(jī)預(yù)警的研究,國(guó)外相對(duì)更早一些。1920 年起,針對(duì)財(cái)務(wù)比率的分析就已經(jīng)在企業(yè)財(cái)務(wù)狀況分析中占據(jù)重要地位,例如著名的杜邦分析法,通過幾個(gè)重要財(cái)務(wù)指標(biāo)之間的分解和聯(lián)系,從而綜合分析企業(yè)的財(cái)務(wù)狀況。這是一種經(jīng)典的財(cái)務(wù)業(yè)績(jī)?cè)u(píng)價(jià)方法,一直被沿用至今。而學(xué)術(shù)界認(rèn)可的最早的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警研究,即單變量分析,也是基于財(cái)務(wù)指標(biāo)進(jìn)行預(yù)測(cè)。單變量預(yù)警模型最早由Beaver(1966)所提出的,該模型是研究某個(gè)單一的財(cái)務(wù)指標(biāo)的變化趨勢(shì),從而對(duì)公司未來的危機(jī)進(jìn)行預(yù)警。他的研究選取了158 家企業(yè)作為樣本量,并采用AB測(cè)試,即79家為危機(jī)企業(yè),再找79家行業(yè)和規(guī)模與之相匹配的正常企業(yè)進(jìn)行對(duì)比分析,選取了30個(gè)財(cái)務(wù)指標(biāo)進(jìn)行研究,時(shí)間窗口為1954-1964 年期間。研究表明正常企業(yè)和陷入財(cái)務(wù)危機(jī)的企業(yè)財(cái)務(wù)指標(biāo)之間存在較大差異,通過單變量的差異分析對(duì)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警有一定作用。然而該模型的問題也很明顯,僅通過單一變量去預(yù)測(cè)企業(yè)整體財(cái)務(wù)狀況是不準(zhǔn)確的。單變量預(yù)警模型隨機(jī)性和抗干擾性較弱,容易受到外部因素的干擾而得出錯(cuò)誤結(jié)論。于是,Ratios(1968)提出了基于Beaver單變量模型的改進(jìn)模型多元變量模型,也就是著名的Z-Zscore 模型。該模型的核心是采用多元線性判別方法,用多個(gè)指標(biāo)測(cè)試財(cái)務(wù)風(fēng)險(xiǎn),然后通過賦權(quán)綜合計(jì)量得出一個(gè)計(jì)量值Z 值。通過判斷Z 值的大小來預(yù)測(cè)企業(yè)整體財(cái)務(wù)風(fēng)險(xiǎn)的可能性,該值越大發(fā)生危機(jī)的可能性越高,相反則越低。雖然該模型改進(jìn)了單變量模型的不足之處,但實(shí)際應(yīng)用中很難滿足該模型苛刻的統(tǒng)計(jì)假設(shè)前提。
在國(guó)外學(xué)者提出將判別模型應(yīng)用于財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警研究并取得顯著效果后,國(guó)內(nèi)的學(xué)者通過借鑒國(guó)外的經(jīng)驗(yàn)在該領(lǐng)域的研究也迅速發(fā)展起來。最早由吳世農(nóng)和黃世忠(1987)將判別模型應(yīng)用與國(guó)內(nèi)企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警,驗(yàn)證了該模型在國(guó)內(nèi)企業(yè)同樣適用。后來的陳靜(1999)同樣借鑒了國(guó)外的研究方法,選取國(guó)內(nèi)ST 和非ST 配比公司各27 家做AB 測(cè)試對(duì)比實(shí)驗(yàn),并分別進(jìn)行單變量和多變量判別模型預(yù)測(cè),研究驗(yàn)證了多元判別模型的預(yù)測(cè)準(zhǔn)確性效果更好。隨后的張玲(2000)在陳靜的研究基礎(chǔ)上,以A 股上市公司為研究樣本進(jìn)行實(shí)驗(yàn),結(jié)果進(jìn)一步驗(yàn)證了上述結(jié)論。周首華等(1996)在改進(jìn)Z-score 模型基礎(chǔ)上提出F-score 模型,與Z 計(jì)分模型相比,F(xiàn)-score加入了現(xiàn)金流量自變量,充分考慮了在財(cái)務(wù)危機(jī)預(yù)警中現(xiàn)金流量比率這一有效變量。
無論是單變量模型還是多元線性判別模型都存在其方法論的假設(shè)條件,如樣本需滿足高斯分布,且變量之間不存在多重共線性及配比樣本均方差矩陣相等。為了提高模型的適用性和有效性,Martin(1977)選擇了較低樣本分布要求并且適用性更廣的Logistic 回歸模型,與線性回歸模型相比,logistic 不要求樣本數(shù)據(jù)服從正態(tài)分布以及相關(guān)嚴(yán)苛的前提條件,打破了傳統(tǒng)線性判別方法難以實(shí)際應(yīng)用的困境。Martin的研究表明,與傳統(tǒng)線性判別模型相比,Logistic模型的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)測(cè)效果更好。Ohlson(1980)截取1970-1976 年間105 家危機(jī)企業(yè)和2058 家非危機(jī)企業(yè)為研究對(duì)象,發(fā)現(xiàn)非財(cái)務(wù)指標(biāo),如企業(yè)規(guī)模、資本結(jié)構(gòu)等也能預(yù)測(cè)財(cái)務(wù)風(fēng)險(xiǎn)。吳世農(nóng)和盧賢義(2001)以國(guó)內(nèi)企業(yè)為樣本采用相同指標(biāo)體系,進(jìn)行多元判別模型和Logistic 模型預(yù)測(cè)財(cái)務(wù)風(fēng)險(xiǎn)對(duì)比實(shí)驗(yàn),驗(yàn)證了logistic模型的預(yù)測(cè)精度更高。此后一些學(xué)者對(duì)Logistic回歸預(yù)警模型的參數(shù)估計(jì)方法進(jìn)行研究,如Jabeur(2017)應(yīng)用偏最小二乘法對(duì)于精模型進(jìn)行求解,并考慮了缺失數(shù)據(jù)的處理。
人工智能的發(fā)展加速了各個(gè)領(lǐng)域的研究發(fā)展,越來越多的學(xué)者傾向于將計(jì)算功能強(qiáng)大的人工智能技術(shù)引入財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警研究。神經(jīng)網(wǎng)絡(luò)算法是人工智能技術(shù)的一個(gè)基礎(chǔ)算法,源于模擬人腦神經(jīng)的研究。相較于線性判別模型和logistic 這些傳統(tǒng)數(shù)量統(tǒng)計(jì)計(jì)量模型,神經(jīng)網(wǎng)絡(luò)對(duì)樣本要求較低,沒有統(tǒng)計(jì)假設(shè)前提,適用性更強(qiáng)而且預(yù)測(cè)準(zhǔn)確性高。Dutta(1988)在研究債權(quán)等級(jí)分類時(shí)最早引入神經(jīng)網(wǎng)絡(luò)進(jìn)行研究。Odom(1990)在對(duì)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警研究中,將線性判別模型和神經(jīng)網(wǎng)絡(luò)做對(duì)比,發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)效果更好。我國(guó)最早關(guān)于神經(jīng)網(wǎng)絡(luò)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警的研究是1995年黃小原發(fā)表的文章,但也僅是理論闡述。王玉冬等(2018)分別對(duì)比了FOA和PSO這兩種算法優(yōu)化后的BP模型的預(yù)測(cè)效果,研究發(fā)現(xiàn)后者的性能更優(yōu)。
除神經(jīng)網(wǎng)絡(luò)外,作為機(jī)器學(xué)習(xí)中備受歡迎的支持向量機(jī)(SVM)算法也被應(yīng)用于財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警研究。它是一種以統(tǒng)計(jì)理論為基礎(chǔ)的ML 方法。該方法泛化能力強(qiáng),在各種實(shí)際問題中表現(xiàn)優(yōu)秀。Li et al.(2014)將SVM、Logistic 和Z 模型進(jìn)行對(duì)比實(shí)驗(yàn),結(jié)果顯示SVM 的預(yù)測(cè)準(zhǔn)確性更高。劉玉敏等(2017)構(gòu)造了PCA-PSO-SVM 財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型,先用PCA降維,再用粒子群算法對(duì)SVM進(jìn)行優(yōu)化,得到比單一SVM預(yù)測(cè)性能更好的優(yōu)化模型。
隨著人工智能技術(shù)漸漸成熟,研究者開始傾向于融合多個(gè)模型的集成學(xué)習(xí)算法,集成學(xué)習(xí)方法是將多個(gè)弱分類器整合起來構(gòu)造一個(gè)強(qiáng)分類器,通過整合多個(gè)學(xué)習(xí)器,可以得到比單一分類器明顯優(yōu)越的泛化性能,目前被認(rèn)為是基于ML 的主流研究方法。West et al.(2005)為了使單一分類器盡可能有較大的差異,于是采用bagging 提升方法構(gòu)造企業(yè)風(fēng)險(xiǎn)預(yù)警模型,并和神經(jīng)網(wǎng)絡(luò)模型對(duì)比,實(shí)驗(yàn)證明了集成學(xué)習(xí)算法的優(yōu)越性。同年謝紀(jì)剛等(2005)也采用bagging 方法,以國(guó)內(nèi)上市企業(yè)為樣本構(gòu)造了國(guó)內(nèi)企業(yè)財(cái)務(wù)危機(jī)預(yù)警模型。Choi et al.(2018)提出了一種基于集成分類器的承包商財(cái)務(wù)困境預(yù)測(cè)模型,將六個(gè)單分類器,如支持向量機(jī)(SVM)、人工神經(jīng)網(wǎng)絡(luò)(ANN)、邏輯回歸(LR)、決策樹(CART)、K 近鄰(KNN)和樸素貝葉斯(NB)分別和綜合這六個(gè)模型的集成分類器相比較,利用2007-2012 年韓國(guó)承包商的財(cái)務(wù)報(bào)表評(píng)估了模型的預(yù)測(cè)準(zhǔn)確性,研究顯示集成分類模型的預(yù)測(cè)性能比單一分類器的效果好。Wang et al.(2018)發(fā)現(xiàn)在以往的研究中,文本信息,情緒信息等非財(cái)務(wù)信息預(yù)測(cè)信息和階層失衡問題往往被忽略,于是他們用CSMAR 數(shù)據(jù)庫(kù)中的上市公司為研究樣本,將情感和文本信息結(jié)合到集成隨機(jī)子空間方法(ISTRS)中進(jìn)行財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警。結(jié)果表明,該方法能夠顯著提高財(cái)務(wù)困境預(yù)測(cè)性能。Xu et al.(2021)將定性分類器(專家系統(tǒng)法,ES)和定量分類器(卷積神經(jīng)網(wǎng)絡(luò),CNN)相結(jié)合,并且引入互聯(lián)網(wǎng)搜索指數(shù)作為財(cái)務(wù)困境預(yù)測(cè)的新變量,通過構(gòu)建每個(gè)分類器的軟集表示,然后利用軟集上的最優(yōu)決策來識(shí)別企業(yè)的財(cái)務(wù)狀況,結(jié)果表明該模型的準(zhǔn)確性和穩(wěn)定性方面有較好的表現(xiàn)。Liu et al.(2021)提出了一種用于信用評(píng)分的多粒度多層梯度增強(qiáng)決策樹(GBDT)。多層GBDT考慮了基于樹的模型的顯示學(xué)習(xí)過程和區(qū)分申請(qǐng)人好壞的表示學(xué)習(xí)能力的優(yōu)勢(shì)。在6個(gè)信用評(píng)分?jǐn)?shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,分層結(jié)構(gòu)可以有效的減少信用評(píng)分?jǐn)?shù)據(jù)集的類內(nèi)距離,增加信用評(píng)分?jǐn)?shù)據(jù)集的類間距離,從而進(jìn)一步提高信用評(píng)分的性能。
國(guó)內(nèi)外大量文獻(xiàn)均已證實(shí)了機(jī)器學(xué)習(xí)人工智能對(duì)公司財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警的良好表現(xiàn),但少有關(guān)注財(cái)務(wù)數(shù)據(jù)質(zhì)量對(duì)集成學(xué)習(xí)模型預(yù)測(cè)準(zhǔn)確性影響的研究。現(xiàn)實(shí)中,為了避免持續(xù)虧損導(dǎo)致的“退市”,企業(yè)常常會(huì)產(chǎn)生“粉飾”的心理,隨著企業(yè)的經(jīng)營(yíng)業(yè)績(jī)不斷惡化,企業(yè)對(duì)會(huì)計(jì)信息的控制也會(huì)不斷增強(qiáng)。所以,在上市公司存在著財(cái)務(wù)數(shù)據(jù)操縱的情況下,財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警研究應(yīng)該將企業(yè)的財(cái)務(wù)數(shù)據(jù)質(zhì)量作為重點(diǎn),建立預(yù)警指標(biāo)體系并建立預(yù)警模型時(shí),應(yīng)該將財(cái)務(wù)指標(biāo)和數(shù)據(jù)質(zhì)量結(jié)合起來。Benford定律是一種基于財(cái)務(wù)數(shù)據(jù)開頭數(shù)字的分布規(guī)則,它可以用來檢驗(yàn)財(cái)務(wù)指標(biāo)數(shù)據(jù)的質(zhì)量。如果一組數(shù)據(jù)的頭位數(shù)字的觀察頻率與Benford 律不符合,則很大概率有人為操縱的嫌疑(Nigrini &Mittermaier,1997)。而Benford 定律可以有效地鑒別出各類財(cái)務(wù)信息的造假行為,并被廣泛地應(yīng)用于會(huì)計(jì)理論與實(shí)踐中。趙瑩等(2007)利用Benford 定律,對(duì)危機(jī)和正常兩類公司的凈利潤(rùn)特征第一個(gè)數(shù)值分布情況進(jìn)行了檢驗(yàn),并得出了A股凈利潤(rùn)的數(shù)值操作規(guī)則。羅琪(2020)也是用相同的方式,把Benford 因子加入到SVM中,最后得出的結(jié)論是,Benford因子可以幫助預(yù)測(cè)一家公司是否會(huì)出現(xiàn)財(cái)務(wù)危機(jī),帶有Benford因子的組合模型的預(yù)測(cè)效果更好。楊貴軍等(2022)除了構(gòu)造Benford 因子外,還根據(jù)Myer 指標(biāo)構(gòu)造了Myer 因子,帶入到BP 模型進(jìn)行預(yù)測(cè),研究表明:兩種因子都提高了BP 模型預(yù)測(cè)的精度。因此,本文用Benford 律來檢驗(yàn)財(cái)務(wù)指標(biāo)的有效性和真實(shí)性,構(gòu)造Benford-XGBoost預(yù)警模型,一方面既發(fā)揮了XGBoost集成分類器的優(yōu)勢(shì),又能保證用于預(yù)警的數(shù)據(jù)集的數(shù)據(jù)質(zhì)量,從而保證預(yù)警模型的有效性。
Benford 定律是指任何未經(jīng)過人工刻意設(shè)計(jì)的自然數(shù)據(jù),其第一個(gè)數(shù)字的排列分布具有一定的規(guī)律。即數(shù)字1 到9 的概率分布是單調(diào)遞減的,Hill(1995)給出了Benford定律的數(shù)學(xué)公式。記d=1,2,3,...,9,首位數(shù)字D為d的概率為:
在一組數(shù)據(jù)中,統(tǒng)計(jì)每個(gè)樣本的第一順位數(shù)字出現(xiàn)頻率,若滿足上述公式,即表明數(shù)據(jù)的質(zhì)量好。判斷第一順位數(shù)字分布律是否滿足Benford律的一般方法為χ2擬合優(yōu)度檢驗(yàn),公式如下:
公式(2)中N 為樣本量、fd為d 的觀測(cè)頻率、fB,d為Benford定律。若χ2值超過10%顯著的臨界值,則否定原假設(shè),并且財(cái)務(wù)數(shù)據(jù)第一位數(shù)字的頻率被認(rèn)為與Benford定律不一致。然而通過這種方法,只能總體評(píng)判出該組數(shù)據(jù)質(zhì)量的好壞,但并不能定位到某個(gè)具體樣本點(diǎn)。因此,本文參考楊貴軍等(2022)的研究,構(gòu)造Benford因子帶入XGBoost模型。
假設(shè)X(ii=1,2,3,...n)為不符合Benford定律有質(zhì)量問題的變量數(shù)據(jù),記Xi第一位數(shù)字d的觀測(cè)頻率fd與Benford定律的理論頻率fB,d的差值為。
依據(jù)Benford定律的顯著性檢驗(yàn)原理,指標(biāo)Xi(i=1,2,3,...n)的某個(gè)首位數(shù)字觀測(cè)頻率不同于理論頻率極有可能存在舞弊操作,并且這種操作往往會(huì)存在某種傾向,實(shí)際表現(xiàn)為首位數(shù)字的觀測(cè)頻率會(huì)遠(yuǎn)大于理論頻率。因此,本文將首位數(shù)字中觀測(cè)頻率高于理論頻率的最大數(shù)字視為風(fēng)險(xiǎn)值。記差值最大且為正數(shù)的首位數(shù)字為ui,差值最小且為負(fù)數(shù)的首位數(shù)字為ni,有如下公式:
考慮到差值的正負(fù),有兩種指標(biāo)Xi(i=1,2,3,...n)的Benford 質(zhì)量因子構(gòu)造方式。記為Ci s和Cs,如公式(6)和(7)所示:
公式(6)和(7)中,若觀測(cè)樣本點(diǎn)S的指標(biāo)Xi,s的首位數(shù)字滿足ui,則取值1,否則取值0,Cs同理。
在已收集的數(shù)據(jù)集E={(X1,Y1),(X2,Y2),...,(Xn,Yn)}(其中Xi=(Xi,1,Xi,2,...Xi,k)表示自變量,Yi表示分類變量,n 為樣本量,k 為指標(biāo)個(gè)數(shù))的基礎(chǔ)上,利用Benford 定律理論對(duì)數(shù)據(jù)集E 進(jìn)行數(shù)據(jù)質(zhì)量檢驗(yàn)并構(gòu)造Benford因子。根據(jù)公式(6)和(7)將構(gòu)造好的Benford 因子與數(shù)據(jù)集E 整合,再帶入模型進(jìn)行實(shí)驗(yàn)。
本實(shí)驗(yàn)選取XGBoost 算法進(jìn)行財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警建模。整個(gè)基于XGBoost 的A 股上市公司財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警及其特征分析模型的構(gòu)建流程如圖1所示,主要包括因子構(gòu)造、模型訓(xùn)練、超參數(shù)優(yōu)化、多模型對(duì)比以及模型解釋分析等核心模塊。

圖1 財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警及特征分析模型流程圖
XGBoost 是一種新型的梯度增強(qiáng)算法,由于其高效的并行訓(xùn)練和基于ML應(yīng)用的顯著改進(jìn),在ML應(yīng)用的比賽中很受歡迎。XGBoost是集成方法GBDT的變體,它結(jié)合了梯度增強(qiáng)優(yōu)化策略和DT分類器,即將多個(gè)DT組合成一個(gè)梯度提升框架,迭代優(yōu)化訓(xùn)練目標(biāo)。GBDT是由m個(gè)基學(xué)習(xí)器加成組合模型,若第m 次迭代訓(xùn)練的樹模型為fm(xi),則GBDT的表達(dá)式為:
其中,L(m)表示的是真實(shí)值yi與其預(yù)測(cè)值之間的差值。為了緩解過擬合問題,XGBoost 在損失函數(shù)中增加了正則化項(xiàng)∑kΩ(fm),結(jié)合上述兩個(gè)公式,可以得到如下的XGBoost損失函數(shù):
然后對(duì)上述公式進(jìn)行二階泰勒展開,去除常數(shù)項(xiàng),公式推導(dǎo)如下:
其中,gi、hi分別表示目標(biāo)函數(shù)的一階導(dǎo)數(shù)和二階導(dǎo)數(shù):
而正則化項(xiàng)Ω(fm)用來衡量樹的復(fù)雜度,分別由葉子結(jié)點(diǎn)數(shù)量和葉子結(jié)點(diǎn)權(quán)重兩部分組成。展開式中,T代表葉子結(jié)點(diǎn)的個(gè)數(shù)、w表示葉子結(jié)點(diǎn)的權(quán)重,為防止過擬合通過系數(shù)γ 和λ 進(jìn)行控制。正則化項(xiàng)表達(dá)式如下:
定義一棵樹fm(x)=wq(x),w∈RT,q:Rt→{1,2,...,T},包括兩部分:葉子結(jié)點(diǎn)的權(quán)重向量w 和葉子結(jié)點(diǎn)的映射關(guān)系q。將fm(x)和正則化項(xiàng)展開式帶入(13)式:
現(xiàn)有財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警研究大都是用財(cái)務(wù)指標(biāo)數(shù)據(jù),本文參考現(xiàn)有研究,分別從償債能力、盈利能力、發(fā)展能力、營(yíng)運(yùn)能力和現(xiàn)金流量這五個(gè)方面選取財(cái)務(wù)指標(biāo)進(jìn)行模型訓(xùn)練,如表1所示。

表1 財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警指標(biāo)
本文參考現(xiàn)有文獻(xiàn),選取2000-2021 年A 股上市公司中標(biāo)記為ST 的公司為研究對(duì)象,并選擇被標(biāo)記為ST 的上一年的財(cái)務(wù)數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),然后在相同年份同一行業(yè)中按照資產(chǎn)規(guī)模相近原則匹配正常公司,即未被標(biāo)記為ST 的上市公司。實(shí)驗(yàn)數(shù)據(jù)剔除了金融業(yè)的上市企業(yè)。經(jīng)過缺失值處理后,各得到174家上市公司。將列為ST的上市公司標(biāo)記為1,未列為ST的公司標(biāo)記為0,并作為模型的預(yù)測(cè)變量。以上數(shù)據(jù)來源于CSMAR數(shù)據(jù)庫(kù)。
在進(jìn)行Benford 因子構(gòu)造前,先對(duì)財(cái)務(wù)指標(biāo)特征進(jìn)行差異性檢驗(yàn),通過差異性檢驗(yàn)對(duì)指標(biāo)進(jìn)行初選,可以過濾掉一些對(duì)預(yù)警模型無效的指標(biāo)。本文采用SPSS23.0 先對(duì)各項(xiàng)指標(biāo)進(jìn)行K-S 正太分布檢驗(yàn),若不滿足正太性,則采用非參數(shù)Wilcoxon檢驗(yàn)。結(jié)果如表2所示:

表2 ST公司與正常公司財(cái)務(wù)指標(biāo)的差異性檢驗(yàn)
由表2 中的K-S 檢驗(yàn)結(jié)果可以看出,p 值均顯著,表明拒絕原假設(shè),14 個(gè)特征均不滿足正太分布。因此用非參數(shù)Wilcoxon 對(duì)上述14個(gè)特征進(jìn)行差異性檢驗(yàn),從表2的p值可以看出,在本文選取的14 個(gè)財(cái)務(wù)指標(biāo)中,除存貨周轉(zhuǎn)率(X6)和每股經(jīng)營(yíng)活動(dòng)產(chǎn)生的凈流量增長(zhǎng)率(X13)的非參數(shù)檢驗(yàn)不顯著外,其余12 個(gè)財(cái)務(wù)指標(biāo)都可以顯著地區(qū)分ST公司和正常公司。因此刪掉存貨周轉(zhuǎn)率(X6)和每股經(jīng)營(yíng)活動(dòng)產(chǎn)生的凈流量增長(zhǎng)率(X13),用剩余的12個(gè)指標(biāo)構(gòu)造Benford因子帶入模型。
表3 是篩選出的12 個(gè)指標(biāo)的觀測(cè)頻率和理論頻率的卡方擬合優(yōu)度檢驗(yàn)結(jié)果,顯著性水平10%的檢驗(yàn)臨界值是20.09。當(dāng)χ2值大于20.09 時(shí),則表明該指標(biāo)存在質(zhì)量問題。

表3 財(cái)務(wù)指標(biāo)首位數(shù)字觀測(cè)頻率與卡方擬合優(yōu)度檢驗(yàn)結(jié)果
從表3 中的χ2檢驗(yàn)的結(jié)果可以看到,利息保障倍數(shù)(X2)、凈資產(chǎn)收益率(X9)和營(yíng)業(yè)利潤(rùn)增長(zhǎng)率(X12)的χ2都超過了臨界值,說明這三個(gè)指標(biāo)的首位數(shù)字分布頻率不滿足Benford 定律,觀察指標(biāo)X2、X9、X12 的首位數(shù)字,可以發(fā)現(xiàn)其與Benford 理論頻率正向差值最大的數(shù)字分別是1、7、1,根據(jù)公式(6)構(gòu)造相應(yīng)的因子并標(biāo)記為B1、B2、B3。X2、X9和X12的首位數(shù)字中與Benford理論頻率負(fù)向差值最大的數(shù)字分別是5、3、2,根據(jù)公式(7)構(gòu)造相應(yīng)的Benford質(zhì)量因子,記為B4、B5、B6。將構(gòu)造好的這6個(gè)因子以及上述12個(gè)財(cái)務(wù)指標(biāo)帶入XGBoost模型進(jìn)行訓(xùn)練。
將上述構(gòu)造的因子和原來的12個(gè)財(cái)務(wù)指標(biāo)全部帶入XGBoost模型。根據(jù)交叉驗(yàn)證思想,將數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集,其中訓(xùn)練集占80%、測(cè)試集占20%。通過訓(xùn)練集建立基于Benford 定律XGBoost 的初始模型,用測(cè)試集的預(yù)測(cè)準(zhǔn)確率判斷模型的優(yōu)劣。利用中國(guó)A 股上市公司財(cái)務(wù)數(shù)據(jù)建立的基于Benford定律XGBoost模型的預(yù)測(cè)準(zhǔn)確率。結(jié)合學(xué)習(xí)曲線對(duì)加入Benford因子和未加因子的模型進(jìn)行最優(yōu)參對(duì)比,圖2和圖3是加入Benford因子的XGBoost 財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型和未加因子的預(yù)警模型,在不同n_estimators 參數(shù)下的交叉驗(yàn)證準(zhǔn)確率的學(xué)習(xí)曲線,可以看到加入Benford 因子和未加因子的模型在n_estimators參數(shù)200左右時(shí),兩個(gè)模型的預(yù)測(cè)準(zhǔn)確率都比較高。并且,由圖2 和圖3 可以看出,加入Benford 因子的模型在參數(shù)25-200 范圍內(nèi)的整體交叉驗(yàn)證準(zhǔn)確率均高于未加因子的模型。

圖2 加入Benford因子的不同n_estimators下交叉驗(yàn)證準(zhǔn)確率

圖3 未加因子的不同n_estimators下交叉驗(yàn)證準(zhǔn)確率
為進(jìn)一步說明加入Benford 因子的XGBoost 模型的預(yù)測(cè)效果,計(jì)算模型的準(zhǔn)確率(Accuracy)、精確率(Precision)、召回率(Recall)、F1值。其中準(zhǔn)確率(Accuracy)作為最基本的一個(gè)評(píng)價(jià)指標(biāo),是指將實(shí)際非ST公司分類為正常公司或?qū)?shí)際ST公司分類為ST 的比例。精確率(Precision)是指實(shí)際ST 公司樣本中被分類為ST樣本的比例。召回率是指分類正確的ST公司樣本占整個(gè)數(shù)據(jù)集中所有實(shí)際ST公司個(gè)數(shù)的比例。分類矩陣見表4,計(jì)算公式如下:

表4 分類結(jié)果混淆矩陣
將加入Benford 因子和未加因子的XGBoost 模型的預(yù)測(cè)效果進(jìn)行對(duì)比,實(shí)驗(yàn)結(jié)果如表5 所示,可以看到,加入Benford 因子的XGBoost 模型的準(zhǔn)確率、精確率、召回率和F1值都高于未加因子的XGBoost 模型。且加入Benford 因子的預(yù)測(cè)準(zhǔn)確率比原有模型的預(yù)測(cè)準(zhǔn)確率提升了3%。

表5 加入Benford因子和未加因子的XGBoost模型的預(yù)測(cè)效果對(duì)比
為使建模更具有說服力,將上述模型的建模過程分別重復(fù)100 次、200 次、500 次和1000 次,分別計(jì)算含有Benford 因子的XGBoost 財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型和不含因子的XGBoost 模型的AUC、準(zhǔn)確率、精確率、召回率、F1值,得到表6。可以看到不同迭代次數(shù)下,含因子的模型整體預(yù)測(cè)效果優(yōu)于不含因子模型的預(yù)測(cè)效果。

表6 加入Benford因子和不加因子的XGBoost模型預(yù)測(cè)效果對(duì)比
將XGBoost模型與已有的基于邏輯回歸(LR)、KNN、極端森林(DF)、決策樹(DT)以及GBDT 幾種模型進(jìn)行對(duì)比實(shí)驗(yàn),結(jié)果見表7 和圖4。從表中可以看出,與其他模型相比,XGBoost 模型的預(yù)測(cè)性明顯優(yōu)于其他模型。

表7 模型性能對(duì)比

圖4 多模型性能對(duì)比
通過上述實(shí)驗(yàn)結(jié)果,我們可以得出結(jié)論:XGBoost 模型具有較好的預(yù)測(cè)性能。為了進(jìn)一步提高XGBoost模型的預(yù)測(cè)性能,本文對(duì)模型進(jìn)行了參數(shù)調(diào)優(yōu)。常用的超參數(shù)調(diào)參方法包括網(wǎng)格搜索、隨機(jī)搜索和貝葉斯優(yōu)化。其中,網(wǎng)格搜索是應(yīng)用最廣泛的超參數(shù)搜索算法,相當(dāng)于窮舉法且計(jì)算資源消耗較大。隨機(jī)搜索則是從指定的分布中采樣固定數(shù)量的參數(shù)設(shè)置,它一般比網(wǎng)格搜索要快一些,但結(jié)果不確定。貝葉斯調(diào)參是一種使用貝葉斯定理指導(dǎo)搜索以找到目標(biāo)函數(shù)的最小值或最大值的方法,它會(huì)在進(jìn)行一次迭代的時(shí)候,回顧之前的迭代結(jié)果,避免搜索那些結(jié)果太差的參數(shù)值,從而大大提高搜索效率。因此,本文選擇貝葉斯調(diào)參方法來優(yōu)化XGBoost 模型,進(jìn)一步提高其預(yù)測(cè)性能。通過調(diào)參找到參數(shù)最優(yōu)值,其中l(wèi)earning_rate 的最優(yōu)值為0.3、max_depth 最優(yōu)值為7、n_estimators 最優(yōu)值為79,此時(shí)模型的預(yù)測(cè)效果達(dá)到最優(yōu),準(zhǔn)確率達(dá)到92.86%,AUC值達(dá)到99.02%,相比未經(jīng)過調(diào)參的XGBoost模型的準(zhǔn)確率提高了1.43%,AUC 值提高了1.1%。
雖然XGBoost 算法的預(yù)測(cè)性能很好,但是和大多數(shù)機(jī)器學(xué)習(xí)方法一樣存在可解釋性差的問題,如同一個(gè)“黑盒子”無法衡量每個(gè)指標(biāo)的貢獻(xiàn)。因此,本文通過引入SHAP 模型計(jì)算出每個(gè)財(cái)務(wù)風(fēng)險(xiǎn)影響因子的shap value 值,以增強(qiáng)模型的可解釋性。SHAP的全稱是SHapley Additive exPlanation,這是一種可以用來解釋較復(fù)雜的機(jī)器學(xué)習(xí)模型的后驗(yàn)推理方法。通常情況下,機(jī)器學(xué)習(xí)模型都是一個(gè)黑箱,只要在前端輸入用于預(yù)警的指標(biāo),通過模型訓(xùn)練后就可以直接得出預(yù)測(cè)結(jié)果。然而,對(duì)于模型內(nèi)部是怎樣進(jìn)行預(yù)測(cè)的,以及每個(gè)輸入的特征在模型預(yù)測(cè)中發(fā)揮了多大的作用,我們并不清楚,尤其是一些較為成熟的集成學(xué)習(xí)模型,其解釋能力更低,而SHAP模型則能很好的解決這一難題。SHAP以合作博弈論理論為基礎(chǔ),其關(guān)鍵在于對(duì)模型中的各個(gè)指標(biāo)計(jì)算Shapley Value。SHAP將每個(gè)變量都當(dāng)作“貢獻(xiàn)者”,而且還可以計(jì)算出單個(gè)樣本的預(yù)測(cè)值以及單個(gè)樣本中各個(gè)變量的貢獻(xiàn)值。
設(shè)第n 個(gè)樣本為xn,樣本xn的 第m 個(gè)特征 為xnm,模型對(duì)該樣本的預(yù)測(cè)值為yn,整個(gè)模型的基線為ybase,則Shapley Value滿足下列公式:
其中f(xnm)為xnm的SHAP 值,即為第n 個(gè)樣本中第m個(gè)指標(biāo)對(duì)最終預(yù)測(cè)值yn的貢獻(xiàn)值,當(dāng)f(xnm)>0,表示該指標(biāo)有積極作用,可以提高預(yù)測(cè)值。若f(xnm)<0,則表示會(huì)降低預(yù)測(cè)值。
圖5向我們展示了每個(gè)特征的Shap影響,每行代表一個(gè)特征,而每個(gè)點(diǎn)則代表一個(gè)樣本。通過觀察圖5,我們可以清晰地了解每個(gè)特征對(duì)模型預(yù)測(cè)結(jié)果的影響程度,進(jìn)而在優(yōu)化模型的過程中有針對(duì)性地對(duì)特征進(jìn)行調(diào)整。同時(shí),圖6則展示了各特征Shap值絕對(duì)值的均值,以此反映了每個(gè)特征的重要性。根據(jù)表中的數(shù)據(jù),我們可以發(fā)現(xiàn)在XGBoost模型中,凈資產(chǎn)收益率(X9)、營(yíng)業(yè)利潤(rùn)率(X10)、資產(chǎn)報(bào)酬率(X8)、應(yīng)收賬款周轉(zhuǎn)率(X5)以及經(jīng)營(yíng)活動(dòng)產(chǎn)生的現(xiàn)金流量?jī)纛~÷負(fù)債合計(jì)(X3)這五項(xiàng)特征,對(duì)于預(yù)測(cè)企業(yè)的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型具有重要的貢獻(xiàn)。這些特征反映了企業(yè)的盈利能力、營(yíng)運(yùn)能力以及償債能力,是影響企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)的重要因素。此外,Benford 因子B2、B3、B4 在模型中也扮演了預(yù)測(cè)貢獻(xiàn)的角色。這些結(jié)果為我們提供了更深入的洞察和優(yōu)化模型的依據(jù),進(jìn)一步幫助我們理解模型預(yù)測(cè)結(jié)果的形成過程,提高模型預(yù)測(cè)的準(zhǔn)確性和穩(wěn)定性。

圖6 XGBoost模型特征SHAP全局均值
SHAP方法是一種具有局部精確性質(zhì)的特征重要性評(píng)估方法。它可以在單個(gè)樣本上取得每個(gè)指標(biāo)對(duì)當(dāng)前模型預(yù)測(cè)結(jié)果的影響,這對(duì)于理解模型的預(yù)測(cè)結(jié)果非常有幫助。以測(cè)試集中的山東東方海洋樣本為例,我們使用XGBoost模型對(duì)其當(dāng)年的財(cái)務(wù)風(fēng)險(xiǎn)特征值進(jìn)行預(yù)測(cè),并使用SHAP圖進(jìn)行可視化解釋。如圖7所示,山東東方海洋2018年的最終值為5.34。我們發(fā)現(xiàn)凈資產(chǎn)收益率(X9)、固定資產(chǎn)周轉(zhuǎn)率(X7)、資產(chǎn)報(bào)酬率(X8)、應(yīng)收賬款周轉(zhuǎn)率(X5)、經(jīng)營(yíng)活動(dòng)產(chǎn)生的現(xiàn)金流量?jī)纛~÷負(fù)債合計(jì)(X3)和利息保障倍數(shù)(X2)等特征值均為負(fù)數(shù),并且表現(xiàn)為負(fù)數(shù)的特征值所占長(zhǎng)度越長(zhǎng),預(yù)測(cè)結(jié)果為存在財(cái)務(wù)風(fēng)險(xiǎn)的概率越高。這些特征變量的影響可以通過SHAP圖直觀地展示出來,幫助我們更好地理解模型的預(yù)測(cè)結(jié)果。

圖7 山東東方海洋2018年XGBoost模型SHAP圖
鑒于上市公司財(cái)務(wù)數(shù)據(jù)質(zhì)量會(huì)對(duì)危機(jī)預(yù)警模型的預(yù)測(cè)效果產(chǎn)生偏差,本文根據(jù)Benford 定律構(gòu)造了Benford 因子帶入XGBoost 模型,通過帶有Benford 因子的XGBoost 模型和未加Benford 因子的XGBoost 模型的預(yù)測(cè)精度、準(zhǔn)確率等各項(xiàng)指標(biāo)進(jìn)行比較,實(shí)證檢驗(yàn)結(jié)果表明,數(shù)據(jù)質(zhì)量會(huì)影響財(cái)務(wù)危機(jī)預(yù)警模型的預(yù)測(cè)效果,并且通過Benford 因子還可以定位到那個(gè)樣本點(diǎn)存在財(cái)務(wù)高風(fēng)險(xiǎn)。根據(jù)上述實(shí)驗(yàn)結(jié)論,本文還將帶有Benford 因子的數(shù)據(jù)集用其他模型進(jìn)行實(shí)驗(yàn),對(duì)比邏輯回歸(LR)、K-近鄰(KNN)、極端森林(DF)、決策樹(DT)、GBDT 幾種模型和XGBoost模型的預(yù)測(cè)效果,結(jié)果表明XGBoost 模型的預(yù)測(cè)性能最好。基于機(jī)器學(xué)習(xí)模型的可解釋性較差,本文引入了SHAP 模型對(duì)XGBoost 模型的特征貢獻(xiàn)度進(jìn)行分析,可以從全局進(jìn)行歸因分析,也可以從具體樣本點(diǎn)進(jìn)行歸因分析,通過計(jì)算SHAP 值對(duì)模型中財(cái)務(wù)風(fēng)險(xiǎn)的影響因素進(jìn)行解釋分析,增強(qiáng)了模型的可解釋性。