999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

機器學習對上市公司年報錯報的識別研究
——財務重述預測的視角

2022-03-15 09:29:32曾慶超許諾
中國注冊會計師 2022年2期
關鍵詞:分類財務特征

| 曾慶超 許諾

一、引言

財務報告作為上市公司對外披露信息的主要載體,是投資者獲得公司信息的重要途徑,也是審計師出具審計意見的重要參考。錯報導致的財務重述,是自愿或被審計師及監管者責令進行修正的一種事后補救行為;造成嚴重負面影響的財務重述主要是由于收入確認不恰當、成本費用不真實等原因所導致的,這些行為本身就是實現盈余管理目標而運用的具體方式,反映了上市公司前期發布的盈余信息不真實,存在誤導投資者決策的錯誤。根據美國會計總署(GAO)的研究報告,在1997到2002年間,由于企業發布關于盈余的重述公告,給投資者造成了1千億美元的損失。錯報導致的重述不僅使財務報告的可靠性受到質疑,損害了投資者的利益,也意味著以前年度財報是低質量的,從而加大注冊會計師審計當期財報的風險。之前研究表明,在財務重述的樣本中,調減盈余的樣本占到了七成左右;因錯報導致的重述表明會計系統存在問題(甚至是經營管理問題),導致預期的未來現金流下降,并且暗示管理層試圖通過粉飾來掩蓋收入下降問題,因而財務重述通常會向投資者傳遞消極信號,從而造成更大的市值下降,使得市場反應顯著為負。因此,研究錯報及其導致的財務重述具有現實意義。現有研究從公司業績、股權結構、治理結構等方面分析了財務重述公司的特點,監管部門為了保障上市公司會計信息披露的質量,對其年報強制執行外部審計,并陸續出臺了中國注冊會計師審計準則,以降低審計風險,提高審計質量。然而本文的財務重述年報樣本中,九成被出具了標準無保留審計意見(即錯報在當年未被識別出來),這說明隨著上市公司的盈余管理手段愈發隱蔽,單純依賴傳統的風險評估方法可能難以有效識別錯報風險。

機器學習是當下被廣泛應用的信息技術,它讓計算機能夠自動地從某些數據中總結出規律,并得出某種預測模型,進而利用該模型對未知數據進行預測。分類是重要的機器學習方法,其目的是從給定人工標注的分類訓練樣本中學習一個分類模型,面對新數據,根據這個分類模型將其映射到給定類別的某一個類中,甄別上市公司財報是否存在重述的可能,比較適合采用分類方法中的二分類方法。目前運用較廣泛的分類方法有極限梯度提升樹(xgboost)、神經網絡、隨機森林(random forest)、K近鄰(K-nearest neighbor)、支持向量機(support vector machine)、樸素貝葉斯(naive bayes)等。

錯報與財務重述具有因果關系:后期出現的財務重述,很大程度上由于當期的錯報未被識別;若能預測后期將發生財務重述,說明當期財報很可能存在錯報。因此本文的研究邏輯是,通過機器學習預測財務重述的能力反映其識別錯報的能力,研究的主要貢獻有:第一,在統一的輸入樣本基礎上,通過與logistic回歸比較,實證檢驗了極限梯度提升樹、神經網絡、隨機森林、K近鄰、支持向量機、樸素貝葉斯等機器學習方法在預測上市公司年報調減盈余的財務重述方面的良好效果,從而證明機器學習應用于識別上市公司年報錯報的可行性。第二,檢驗了現有文獻關于財務重述公司特征的甄別能力,發現營運能力、盈利能力、流動比率與股權集中度等特征對上市公司年報調減盈余的財務重述的預測起到重要作用。

二、研究設計

(一)樣本選擇與配對

以2016至2018年滬深A股制造業上市公司為研究對象,結合現有研究方法,若公司年報之后因錯報進行了調減盈余的財務重述,選為為正樣本(若同一公司有多個年度的年報發生重述,視為不同正樣本),并對其進行配對選取年報未財務重述的公司作為負樣本。負樣本的配對遵循以下原則:(1)參考證監會 2012 發布的《上市公司行業分類指引》選擇大類相同或相近的;(2)非財務重述的年報披露年度與相匹配的財務重述年報一致;(3)非財務重述年報對應的上市公司在以后年度也未發生過財務重述行為;(4)總資產規模相近;(5)剔除數據缺失的樣本。最終獲得104個樣本,正樣本和負樣本各52個,數據來源于csmar數據庫。運用機器學習方法對上市公司年報財務重述行為進行預測,是通過從既有數據中挖掘公司進行年報財務重述的共同規律并學習之,從而在未知數據上對重述行為進行預測;因此,將2016、2017年的樣本作為訓練集,將2018年的樣本作為測試集,即通過在2016、2017年樣本上分別學習重述樣本與非重述樣本的規律,并將其運用于2018年樣本財務重述的識別,樣本分布如表1。重述樣本中有約10%當年被外部審計師出具了非標準審計意見,即絕大多數因錯報而后期發生調減盈余的財務重述的年報,當期并沒有被審計師發現,可見僅僅依靠傳統的風險評估方法可能難以有效識別調減盈余的錯報風險。

表1 訓練集與測試集樣本分布

(二)特征選擇

1.財務重述與財務業績。資本市場壓力,比如對未來盈利增長的高預期、更高的未償債務水平,會促使公司采取激進會計政策,以提高當期收益并在隨后進行調減盈余的財務重述,即財務重述的重要動因就是盈余操縱,公司管理層為了達成財務預期、滿足融資需求或完成薪酬契約,可能運用各種手段進行盈余操縱,若此行為被識破,隨之而來的便是財務重述;而業績不好的公司更可能進行盈余管理;重述公司在重述期的業績通常會惡化,包括收入方面和現金流方面,具體地,重述公司往往盈利水平低、流動性差、資產周轉速度慢、負債水平高,且自由現金流不足,總應計水平與財務重述行為具有部分顯著的正相關關系。

2.財務重述與公司治理及股權結構。內部控制缺陷是導致財務重述發生的最為主要的原因,區分公司治理實踐優劣的因素對于財務重述的預測可能有幫助,監事會規模較大的公司發生財務重述的概率較低,外部獨立審計也是保證公司財務信息質量的有效措施。重述公司往往股權分散,大股東的監管能有效降低管理層機會主義行為,尤其是股權集中度較高時,大股東的利益與公司的績效更為密切,從而促使其對公司的會計系統進行更有力地監督以控制會計差錯的發生,同時對管理層的機會主義傾向產生震懾作用。

基于以上文獻的研究結論,選取特征變量如下:選取總應計率代表公司盈余管理情況,選取總資產凈利潤率、扣除非經常性損益后的總資產凈利潤率、凈資產收益率和扣除非經常性損益后的基本每股收益代表公司盈利能力,選取流動比率代表公司流動性,選取總資產周轉率代表公司營運能力,選取資產負債率代表公司負債水平,選取經營活動產生的現金流量凈額/資產總額代表公司自由現金流狀況,選取監事比例代表公司監事會規模,選取是否披露內控審計報告及內控審計報告意見代表公司外部獨立審計情況,選取股權集中度代表公司股權結構。由于需要對年報在將來會否因錯報而重述做出預測,而重述公司的年報財務數據在當年披露時是不準確的,故涉及年報財務數據的特征變量取重述期的前一期數據,其他特征變量取重述期數據,如表2。

表2 特征變量及其解釋

(三)分類方法及其評估指標

1.常用的機器學習分類方法。極限梯度提升樹(xgboost)是一個基于梯度提升模型的可擴展樹學習系統。它將多個弱評估器通過迭代的方式結合成一個強評估器,在每次梯度提升的迭代中,之前學習的殘差被用于校正先前建立的評估器從而優化損失函數;同時,xgboost模型在損失函數中加入正則化從而防止過擬合,而它的輸出是迭代過程中各個弱評估器共同投票的結果。在2015年機器學習競賽—Kaggle的29個獲勝方案中,xgboost模型被17個方案所使用,成為最流行的機器學習模型。

神經網絡是模擬和簡化生物神經元的機理,將多個神經元相互連接組成復雜模型,通過神經元之間的復雜聯系建立輸入到輸出的映射關系,從而實現自學習的過程。多層感知機(MLP)神經網絡是一種基礎的神經網絡模型,它的輸入層、隱藏層和輸出層是全連接的,每一層的神經元接受大量其他層神經元的輸入,通過非線性輸入、輸出關系,實現從輸入狀態空間到輸出狀態空間非線性映射的。作為神經網絡的基礎模型,多層感知機神經網絡對于內部規律不太清晰或難以用一組數學表達式進行概括的情境,可達到良好的預測效果。

隨機森林是采用裝袋法(bagging)進行集成學習的模型,它利用決策樹作為基評估器,在樹分枝的節點選擇時,使用特征的隨機子集而非從所有特征中挑選某個特征。通過將隨機性添加到樹的構造過程中,使得每顆樹都不相同,最后綜合所有樹的結果作為輸出,在保障預測能力的同時降低過擬合,提高模型的泛化能力。

K近鄰是一種非參數分類方法,對于一個給定的被預測值,在訓練集中尋找K個最接近它的值(近鄰),將這K個近鄰的投票結果作為被預測值的取值。由于其原理簡單、誤差可控及能處理非線性問題等優點,仍然是機器學習的重要成員。

支持向量機是根據VC維理論和結構風險最小化原則,在學習能力和模型復雜度之間尋求平衡;為了提高泛化能力,通過核函數的選擇,把低維向量映射到高維空間中并尋找超平面,在所有訓練樣本中尋找處于決策邊界的支持向量(support vector)并據此進行分類的。其目標函數的優化為凸優化問題,使得其在尋找全局最優解、擴展性等方面表現不俗,在應用中能良好適應各種數據集。

2.分類的評估指標。對于上市公司年報財務重述行為的預測,本文采用二分類方法,即分類的輸出有且只有兩種情況:陽性(Positive)或陰性(Negative),而相對于真實情況,分類的輸出可能是正確的(True)或錯誤的(False),因此,二分類的結果可歸納為正確的陽性(TP)、正確的陰性(TN)、錯誤的陽性(FP)和錯誤的陰性(FN)四種情況,而FP與FN的數量分別代表第Ⅰ類錯誤和第Ⅱ類錯誤的數量;相應的有如下評估指標。準確率(Accuracy)是評估分類結果最基本的指標,取值在0至1之間,計算所有樣本中被正確分類樣本的比例,通常準確率越高則分類結果越好,此指標直觀而解釋性好,但不能具體查看各個類別的分類結果情況。精確率(Precision)又稱查準率,計算所有被分類為陽性的樣本中的正確比例,取值在0至1之間,越大表示對陽性樣本的識別越精準。召回率(Recall)又稱查全率,計算所有真實的陽性樣本中被正確分類的比例,取值在0至1之間,越大表示對陽性樣本的識別越完全。精確率與召回率是一對此增彼減的評估指標,而無論哪一個太低都不理想,為了整合二者的評估結果,可使用F1分值進行評估,在分類方法對正樣本的識別能力上做出綜合的評價。第Ⅰ(Ⅱ)類錯誤率,錯誤的陽性(錯誤的陰性)樣本占所有陰性(陽性)樣本的比例。具體計算公式如下。

上述四個指標以比率的方式評估分類結果,如果要以數量的方式查看分類結果,可使用混淆矩陣(Confusion Matrix),正確的陽性、正確的陰性、錯誤的陽性和錯誤的陰性各有多少樣本,如表3。本文數據分析工具使用基于Python 3.9.5的NumPy 1.20.3、Pandas 1.3.1、Matplotlib 3.4.2、SciPy 1.7.0、Scikit-Learn 0.24.2及Excel 2019。

表3 混淆矩陣

三、實證檢驗與分析

(一)描述性分析

表4對重述樣本和非重述樣本在特征方面進行了對比,發現二者在公司業績、公司治理與股權結構方面存在明顯差異。重述樣本的盈利水平顯著更低,表現為總資產凈利潤率(在10%水平上顯著)、扣除非經常性損益后的總資產凈利潤率(在10%水平上顯著)、凈資產收益率(在10%水平上顯著)及扣除非經常性損益后的基本每股收益(在5%水平上顯著)都更低;流動性較差,表現為流動比率偏低;營運能力更差,表現為總資產周轉率更低(在5%水平上顯著);負債水平偏高,表現為資產負債率更高(在5%水平上顯著);現金流狀況顯著更差,表現為經營活動產生的現金流量凈額/資產總額更低(在1%水平上顯著);盈余管理的可能性較高,表現為總應計率偏高,支持了之前研究的結論。在公司治理方面,重述樣本的監事比例與披露內控審計報告比例反而更高,這與之前研究的結論不一致,但這種差異不存在顯著性;而內控審計報告意見的嚴重程度顯著偏高(在10%水平上顯著),支持了關于重述公司的治理能力較差的結論;股權集中度顯著更低(在1%水平上顯著),支持了關于重述公司的股權更為分散的結論。

表4 特征的描述性統計

(二)機器學習預測結果分析

為了提高機器學習的學習能力和學習速率,在使用機器學習分類方法之前,對特征數據進行無量綱化(采用標準化方法),即將訓練集的各個特征列縮放成均值為0、方差為1,并按相同的縮放比例對測試集的各個特征列進行縮放處理。之后依次使用各分類方法,在2016、2017年訓練集上學習規律,然后對2018年測試集的樣本執行甄別并檢驗其結果,如表5。

表5 機器學習分類方法評估結果

在準確率方面,多層感知機神經網絡、極限梯度提升樹、K近鄰、隨機森林與支持向量機都優于logistic回歸,樸素貝葉斯與logistic回歸持平,其中極限梯度提升樹、多層感知機神經網絡與K近鄰最高,表明多數機器學習分類方法在區分調減盈余的年報錯報與未錯報年報方面表現較好。在精確率方面,所有機器學習方法都優于logistic回歸,且多數機器學習方法的精確率超過80%,最高者為樸素貝葉斯(達到100%);可見機器學習分類方法對調減盈余的年報錯報識別的誤判率較低(準確性較好)。在召回率方面,多層感知機神經網絡高于logistic回歸,樸素貝葉斯低于logistic回歸,其他機器學習方法與logistic回歸持平,表明多數機器學習分類方法對調減盈余的年報錯報識別的遺漏率較高(全面性較差)。機器學習分類方法對于調減盈余的年報錯報識別強于準確性而疏于全面性,注冊會計師在應用于風險評估程序時,對于預測為陽性的年報樣本應警覺并設計進一步審計程序;對于預測為陰性的年報樣本亦不能放松警惕。進一步分析混淆矩陣,發現在錯誤的陽性樣本數量(或第Ⅰ類錯誤率)方面,所有機器學習方法表現都優于logistic回歸,表現最好的樸素貝葉斯對于陽性的誤判率為零(第Ⅰ類錯誤率為零),體現了機器學習方法在調減盈余的年報錯報識別方面規避第Ⅰ類錯誤的能力更強;而在錯誤的陽性樣本數量(或第Ⅰ類錯誤率)方面,多層感知機神經網絡高于logistic回歸,樸素貝葉斯低于logistic回歸,其他機器學習方法與logistic回歸持平,反映了機器學習方法在調減盈余的年報錯報識別方面規避第Ⅱ類錯誤的能力不突出。特別地,多層感知機神經網絡在各個指標的表現都優于logistic回歸。

除了可以分析各分類方法的表現,某些分類模型在建模過程中對各個特征的重要性進行了計算,從而能夠觀察各個特征對于分類方法的重要性程度。選取能夠查看特征重要性的分類方法中表現較好的極限梯度提升樹和隨機森林,其特征重要性排序如圖1和圖2;為便于分析,制成表6。可見各個特征對于兩種分類方法的學習都產生了一定的影響,但影響大小并不完全相同。其中對于極限梯度提升樹的學習影響最大的前五個特征分別是總資產周轉率、股權集中度、是否披露內控審計報告、扣除非經常性損益后的基本每股收益以及流動比率;而對于隨機森林的學習影響最大的前五個特征分別是總資產周轉率、股權集中度、扣除非經常性損益后的基本每股收益、經營活動產生的現金流量凈額/資產總額以及流動比率;其中總資產周轉率、股權集中度、扣除非經常性損益后的基本每股收益和流動比率四個特征在兩個分類方法中都屬于重要性排名前五的特征,且前三個特征在之前樣本均值t檢驗中都有顯著差異(顯著性分別為5%、1%和5%),表明營運能力、盈利能力、流動比率等公司業績特征與股權集中度特征在調減盈余的財務重述行為的預測方面起到了重要作用;而是否披露內控審計報告與經營活動產生的現金流量凈額/資產總額兩個特征,在兩個分類方法中分別屬于重要性排名前五位和重要性排名后五位的特征,其重要性表現不穩定。同時,對于兩個分類方法影響排名后五位的特征中,都出現了內控審計報告意見和總應計率,表明二者對調減盈余的財務重述行為的預測的作用不明顯。

圖1 極限梯度提升樹特征重要性

圖2 隨機森林特征重要性

表6 特征重要性比較

四、結論

選取2016至2018年滬深A股制造業上市公司中年報發生調減盈余的財務重述的52家公司和年報未發生財務重述的52家配對公司為樣本,以2016和2017年的樣本作為訓練集,以2018年的樣本作為測試集,分別運用機器學習和logistic回歸對財務重述進行預測并比較結果,同時檢驗現有文獻關于財務重述公司特征對財務重述行為的預測能力。結果顯示,與logistic回歸相比,多層感知機神經網絡、極限梯度提升樹、K近鄰、隨機森林與支持向量機等機器學習方法在上市公司財務報告重述行為預測的準確率、F1分值和第Ⅰ類錯誤率等方面都表現更優,其中多層感知機神經網絡在各個指標都表現更優;表明機器學習能有效識別調減盈余的年報錯報,可在注冊會計師執行風險評估程序中運用,以降低審計風險。研究還發現,營運能力、盈利能力、流動比率與股權集中度等特征對上市公司年報調減盈余的財務重述行為的預測起到重要作用。

會計信息質量對于內部管理者的管理、股權與債權人的決策,分析師的預測等利益相關者都有重要影響,而注冊會計師的審計質量是披露會計信息質量的重要保障,財政部2019年更新了18項關于中國注冊會計師的審計準則,推動了風險導向審計的實施。通過研究機器學習對上市公司年報錯報的識別,以期給注冊會計師識別錯報風險提供參考,給監管部門監督、查處信息披露失真行為提供借鑒,給投資者、分析師等對財報的甄別使用提供參考。

猜你喜歡
分類財務特征
黨建與財務工作深融合雙提升的思考
現代企業(2021年2期)2021-07-20 07:57:18
分類算一算
論事業單位財務內部控制的實現
如何表達“特征”
欲望不控制,財務不自由
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
抓住特征巧觀察
主站蜘蛛池模板: 久久77777| 香蕉视频在线精品| 国产精品久久久久婷婷五月| 欧美日韩亚洲综合在线观看| 亚洲天堂区| 波多野结衣中文字幕一区| 亚洲精品在线观看91| 亚洲码一区二区三区| 女人一级毛片| 久综合日韩| 69国产精品视频免费| 波多野结衣久久精品| 国产成人亚洲毛片| 免费观看三级毛片| 在线观看无码av免费不卡网站| 中日无码在线观看| 午夜限制老子影院888| 日韩乱码免费一区二区三区| 国产精品吹潮在线观看中文| 免费黄色国产视频| 亚洲综合九九| 精品夜恋影院亚洲欧洲| 国产婬乱a一级毛片多女| 91原创视频在线| 亚洲性日韩精品一区二区| 国产靠逼视频| 欧美色视频网站| 亚洲最大福利网站| 日韩中文字幕亚洲无线码| 欧美日韩高清| 久久99国产精品成人欧美| av一区二区三区在线观看| 亚洲精品波多野结衣| 国产超薄肉色丝袜网站| 伊人精品视频免费在线| 色哟哟国产精品| 欧美成人区| 无码国产偷倩在线播放老年人| 欲色天天综合网| 9cao视频精品| 看国产一级毛片| 思思热在线视频精品| 日韩精品免费一线在线观看| 91av成人日本不卡三区| 91在线中文| 国产成人高清精品免费5388| 成人午夜免费视频| 亚洲人成色77777在线观看| 亚洲无码精彩视频在线观看| 亚洲人妖在线| www中文字幕在线观看| 免费毛片网站在线观看| 日本免费精品| 色婷婷在线播放| 国产全黄a一级毛片| 国产丝袜一区二区三区视频免下载| 99久久精品免费看国产电影| 国产精品亚洲天堂| 久久久久88色偷偷| 九色在线视频导航91| 九色视频线上播放| 午夜精品久久久久久久99热下载| 人妻丰满熟妇啪啪| 无码一区中文字幕| 亚洲天堂.com| 色综合天天视频在线观看| 99久久精品免费观看国产| 毛片a级毛片免费观看免下载| 无码综合天天久久综合网| 99精品在线看| 欧美高清视频一区二区三区| 亚洲精品天堂在线观看| 国产一二三区视频| 国产小视频网站| 国产97视频在线观看| 中文字幕伦视频| 欧美日韩精品综合在线一区| 亚洲视频四区| 网久久综合| 中国一级毛片免费观看| 成年片色大黄全免费网站久久| 国产亚洲欧美在线专区|