999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

上市公司財務危機預警研究

2020-10-26 06:46:20張志敏
合作經濟與科技 2020年20期

張志敏

[提要] 本文以A股上市公司作為研究對象,運用python中的sklearn模塊,以隨機森林算法對上市公司財務危機預警指標進行選取,并與依據顯著性相關性選取出的指標進行對比,找出兩者在指標選取上存在的差異,并依據選取的財務指標分別建立隨機森林模型;與此同時,還分別構建Logistic回歸模型、SVM支持向量機模型、決策樹模型,并進行展開比較。分析表明:充分利用隨機森林展開上市公司財務危機預警研究比傳統的方式更準確,更能夠精確預判上市公司財務危機。

關鍵詞:特征遞歸消除;隨機森林;logistic回歸;財務危機預警

中圖分類號:F23 文獻標識碼:A

收錄日期:2020年7月2日

一、引言

近年來,我國A股市場每年都會出現許多被特殊處理的公司,且上市公司在資本市場上占有很重要的地位,因此,對上市公司的財務危機預警展開研究有著重要的戰略意義。上市公司作為推動經濟發展的重要主體,對其進行財務危機預警規避財務風險顯得尤為重要,出現財務危機既不利于公司的穩定發展,還減少了經營管理者及投資人的合法利益,通過財務危機預警分析模型可以對公司財務展開預估,給扭轉財務危機局面提供充裕的空間,減少公司倒閉的概率。隨著機器學習算法、大數據、人工智能的發展,越來越多的學者將其引入到風險識別及危機預警中,并有研究表明機器學習算法在風險識別及危機預警方面具有較大的優勢。

二、隨機森林概述

隨機森林算法是有由Leo Breiman和Adele Cutler(2001)最早提出的,是一種集成學習算法,它將不同的決策樹進行組合,利用這種組合降低單一決策樹有可能帶來的片面性和判斷不準確性,它也是目前機器學習算法和數據挖掘算法最為熱門的研究領域之一。他的基本思想是:首先利用Bootstrap重抽樣方法從N個原始訓練樣本中抽取n(n

本文會用到隨機森林的一大特點,即利用OOB評估來評估模型的分類效果。所謂OOB評估是指:當采用Bootstrap重抽樣方法時,原始訓練樣本中每個樣本未被選取的(1-1/N)N,N表示訓練集樣本的個數。當N足夠大時,根據重要極限的推到,(1-1/N)N將近似收斂于1/e≈36.8,這表示原始訓練集中會有將近37%的樣本不會出現在Bootstrap樣本中,這些數據被稱為袋外數據。由于有接近37%的誤差不會出現在訓練集中,所以OOB數據也可以起到測試集作用,檢驗模型預測效果。

另外,本文還利用隨機森林模型的另一個特點變量重要性的度量來對原始變量做篩選,從而建立合理的指標體系。

鑒于以上對隨機森林的介紹,本文建立基于隨機森林遺傳算法的財務危機預警模型。在已有文獻研究中,充分利用組合分類算法進行研究的學者還較少,而隨機森林作為一種集成學習算法,具有不易過擬合、善于處理高維度數據、對存在噪聲和缺失的樣本具有很好的魯棒性、具有較高的預測精度等優點。

三、研究樣本、研究變量和研究設計

(一)研究樣本。為保證數據的真實性和可靠性,所選數據全部來自于國泰安數據庫。以公司是否被特殊處理即是否被ST及*ST為標識,選取2019年首次被特殊處理的82家公司及1990~2019年上市以來從未被特殊處理過的2,859家公司為研究對象。由于企業在第T年被宣布ST或者*ST是由于公司在第T-1年及第T-2年財務上出現較差的情況,所以選用公司在第T-3年財務數據指標基礎上進行建模,當公司在2019年被特殊處理時賦值為1,否則賦值為0。即,選擇2,941家樣本公司在2016年所有可以獲取的財務數據指標進行建模。

(二)研究變量。財務危機預警模型包含兩個主要工作:一是從初始財務指標中篩選出危機預警指標,即存在財務危機的企業都含有怎樣的特征組合;二是進行預警模型算法的選擇。前者是對企業財務危機預警信息進行深層次的挖掘,后者是對財務危機預警算法技術的應用,兩者同時對企業財務危機預警產生影響。目前,危機預警理論還缺乏系統的理論支持,學者們對企業危機預警的研究大都是從可獲得的實際數據出發,采用實際經驗進行研究討論,用試錯的方法,逐個考察變量的組合在實際訓練樣本數據中的體現,挑選出能夠突出判斷能力的變量組合來構建最終的預估分析模型。

本文借鑒已有學者的研究,選取了能代表企業償債能力、經營能力、盈利能力、發展能力、企業現金流量、比率結構這六類指標下29個具體的財務指標,具體變量如表1所示。(表1)

(三)隨機森林模型的構建。分析預警模型構建之前應該對于數據展開預處理,包括異樣系數缺失系數的處理、訓練樣本不太平衡的處理、經濟指標正態性檢驗、相關性顯著性檢驗。

1、樣本缺失值異常值的處理。對于缺失值,一般可以選擇用這一列數據的“平均值”、“中位數”、“眾數”進行填補,也可以對缺失數據進行整行刪除。但由于本文是以機器學習算法進行建模,是在大數據的基礎上進行建模,如果樣本量過少,會造成模型精度的降低,所以對于缺失值,本文沒有進行刪除,而是以樣本均值對缺失值進行填補。

2、類別不均衡的處理。由于2019年首次被ST公司只有82家,只占所選樣本的2.8%,出現數據偏斜,即樣本不均衡。樣本不均衡會造成樣本量低的分類所包含的特征過少,并很難從中提取規律,即使得到分類模型,也很容易產生過度依賴于有限的數據而導致過擬合的問題,當模型應用到新的數據上時,模型的準確性將會很差。本文通過利用python中的SMOTE算法對樣本不均衡進行過采樣處理。SMOTE算法的基本原理為:合成新的少數類樣本,合成的策略是對少數類樣本a,從它的最近鄰中隨機選一個樣本b,然后在a、b之間的連線上隨機選一點作為新合成的少數類樣本。進行SMOTE處理后的樣本分布如圖2。(圖1、圖2)

3、隨機森林模型的構建。在構建危機預警分析模型時,不能將所選用的所有初始財務指標均作為預警模型的輸入變量,倘若初始指標很多,反而可能由于指標間的相關關系等問題降低模型的預測性能。

特征遞歸消除的隨機森林算法(RFE-RF)把需要的特征集合初始化為整個數據集合,每次去掉一個排序準則分數最小的數據,直到取得最后的特征集,由此可知RFE-RF應是一個基于RF的最大間隔原理的序列后向選擇算法。

在本文中,首先根據各指標對模型的貢獻程度進行排序,可以看到排在最前面的指標即貢獻度最大的指標為X27全部現金回收率,排在最末尾的是X16營業利潤率。然后,我們利用python中的序列后向選擇算法逐一刪除指標,并計算出在該指標下的模型精確度。由圖3我們可以看出,當隨機森林的輸入變量為9個時,此時所挑選的指標最少且模型的精確度較高,由圖4我們可以看出,每個指標對上市公司危機預警的重要程度及重要性排名。(圖3、圖4)

本文選取圖4中排名前9位的財務變量作為隨機森林的輸入變量,分別為X27、X5、X28、X4、X13、X26、X8、X24、X6,模型的輸出結果為0.95979,說明他的識別精度為0.95979。

4、進一步檢驗。為了進一步驗證隨機森林在進行上市公司財務危機預警時的準確性,本文又進行了進一步的研究。在選擇企業財務預警指標時選用傳統的相關性顯著性方式選取指標,比較其與充分利用隨機森林展開指標選取時的差異,進而進一步驗證隨機森林的精確性。

(1)財務指標的正態性檢驗。在展開顯著檢驗之前,應當考察樣本的分布情況,并以此來確定使用哪種方法來進行預警指標的差異顯著性檢驗。本文使用算法來做K-S檢驗,來判斷各個財務指標是否服從正態分布,檢驗結果在所有的P值均小于0.05,說明所有的財務指標均不服從正態分布。對于不遵從正態分布的財務指標的差異顯著性檢驗應當選用非參數的檢驗方法。

(2)財務指標的差異顯著性檢驗。選用Mannwhitneyu檢驗法,對2個獨立樣本進行非參數檢驗。找出對于分辨ST公司和非ST公司有貢獻的財務指標。檢驗結果如表2所示。可以看出,財務指標X1、X2、X3、X4、X5、X6、X7、X8、X10、X12、X14、X15、X16、X23、X24、X26、X28的P值均小于0.05,通過了顯著性檢驗,剩余其他指標均予以剔除。(表2)

(3)財務指標的相關性顯著性檢驗。通過Mannwhitneyu顯著性檢驗的指標可能存在相關關系,且本文的財務指標數據均不服從正態分布,因而本文選擇用斯皮爾曼相關性檢驗方法。通過檢驗,發現X1、X2、X3具有高度關聯性,去掉X2、X3;X4、X5具有高度關聯性,去掉X5;X7、X8具有高度關聯性,X8、X10具有高度關聯性,去掉X8;X12、X14、X15、X16具有高度關聯性,去掉X1、X15、X16;X23、X26具有高度關聯性,去掉X23。最后剩余的指標為X1、X4、X6、X7、X10、X12、X24、X26、X28。其中,X1、X4為償債能力指標,X6、X7、X10為經營能力指標,X12為盈利能力指標,X24、X26為發展能力指標,X28為企業的比率結構。

(4)隨機森林模型的構建。將通過顯著顯著性檢驗的指標輸入到隨機森林中建模,得到模型的識別精度為0.94732。將此結果與利用隨機森林的遞歸特征指標篩選法篩選的指標的建模結果進行比較,發現利用隨機森林篩選出的指標識別率更高些,而且利用隨機森林篩選特征更簡單些。

四、模型比較

現階段,關于危機預警的分析模型已有很多,但是以往的分析模型一多半采納的是多元線性判斷分析模型,少部分開始采納機器學習算法分析模型,如決策樹模型、支持向量機模型等,因此為了進一步驗證隨機森林在危機預警識別上的優勢及準確性,本文又分別建立了Logistic、svm向量機、決策樹模型。并比較各個模型在accuracy_score、precision_score、recall_score、f1_score、auc_score上的差異,其中accuracy_score表示模型精度,precision_score表示模型準確率,recall_score表示模型召回率,f1_score表示模型F1得分,auc_score表示ROC曲線下面積。(表3)

表3結果表明,在所有財務指標度量中,隨機森林也體現出較高的精確性,從而意味著隨機森林分析模型可以將盡量多的存有企業財務經營風險的公司找出來。

五、結論

本文的財務危機預警是針對我國A股市場所有上市公司開展的,在借鑒已有學者研究的基礎上,從償債能力、發展能力、經營能力、每股指標、盈利能力及比率結構這6個方面構建財務危機預警指標,并采用隨機森林算法構建財務危機預警模型。一方面指標的選用對于企業財務危機預警具有至關重要的影響,本文統計已有研討文獻中選用頻次較高的辦法,一定程度上可以提升企業財務預警指標的可靠性。與此同時,研討中不但考慮到預警的正確率,并且重點剖析了特性指標的選用,得知隨機森林在妥善處理高維數據指標上具備很大的優勢,而且通過實證得知隨機森林遺傳算法比Logistic回歸、svm方程機、決策樹分析模型更適合展開危機預警,原因是隨機森林遺傳算法是一種集成學習遺傳算法,在對我國所有上市公司樣本展開危機預警時,不但能夠確保不會預警過分。另一方面對處于危機中的公司有較高的準確率。研究表明,隨機森林算法在企業財務危機預警中具有較高的性能,為學術界進行危機預警及風險識別的研究提供了一種新方法,也為股東、債權人、企業經營管理者和監管層的決策分析提供了一種合理的技術手段。

主要參考文獻:

[1]石先兵.基于PCA-SVM的企業財務危機預警模型構建[J].財會通訊,2020(10).

[2]張培榮.基于XGBoost模型的企業財務危機預警研究[J].財會通訊,2019(35).

[3]宋彪,朱建明,李煦.基于大數據的企業財務預警研究[J].中央財經大學學報,2015(06).

主站蜘蛛池模板: 国产成人高清精品免费| 国产麻豆福利av在线播放| 9丨情侣偷在线精品国产| 久久精品这里只有精99品| 91青青视频| 欧美人人干| 一本一本大道香蕉久在线播放| 日韩欧美成人高清在线观看| 日韩一区精品视频一区二区| 国产亚洲视频播放9000| 久草视频中文| 亚洲天堂久久久| 三区在线视频| 老司机久久精品视频| 成人在线观看一区| 亚洲乱码精品久久久久..| 午夜丁香婷婷| 久青草网站| 中国美女**毛片录像在线| 在线免费a视频| 污污网站在线观看| 婷婷伊人五月| 久久毛片基地| 久久这里只有精品8| 在线无码九区| 99色亚洲国产精品11p| 国产无码高清视频不卡| 在线观看无码a∨| 在线欧美日韩| 国产成人成人一区二区| 久久综合久久鬼| 国产成人在线小视频| 超清无码一区二区三区| 成年看免费观看视频拍拍| 亚洲永久免费网站| 亚洲第一中文字幕| 精品少妇人妻一区二区| 国产女人在线观看| 国产精品xxx| 激情网址在线观看| 国产黑丝一区| 老熟妇喷水一区二区三区| 色噜噜中文网| 国产欧美日韩一区二区视频在线| 国产精品开放后亚洲| 欧美色视频网站| 伊人久久大香线蕉aⅴ色| 亚洲欧洲日本在线| 在线观看国产精品一区| 亚洲丝袜中文字幕| 精品国产成人a在线观看| 免费一级毛片在线播放傲雪网| 国产Av无码精品色午夜| 天堂网国产| 欧美色图第一页| 国产好痛疼轻点好爽的视频| 五月婷婷激情四射| 人妻中文字幕无码久久一区| 九九视频免费看| 国产精品手机在线播放| 久久综合九色综合97网| 久久九九热视频| 欧美另类第一页| 亚洲福利视频一区二区| 最新加勒比隔壁人妻| 亚洲综合中文字幕国产精品欧美| 亚洲成A人V欧美综合天堂| 亚洲男女在线| 国产福利免费在线观看| 欧美日韩v| 色网在线视频| 青青操国产视频| 超碰aⅴ人人做人人爽欧美| 成人午夜天| 久久综合结合久久狠狠狠97色| 欧美性精品| 福利国产微拍广场一区视频在线| 色香蕉网站| 国产午夜福利片在线观看| 国产精品私拍99pans大尺度 | 欧美第一页在线| 香蕉精品在线|