999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

制造業上市公司財務數據異常風險評分卡模型

2023-04-29 00:00:00邵永運張立瑩

摘 要:傳統的評分卡模型往往用來對個人或企業進行信用評分。將信用評分卡模型引入上市公司財務數據異常風險評分中,對上市公司財務數據異常風險進行打分,在規范證券市場的同時,中小股東在投資前可以使用其作為投資參考,使得該操作具有一定的研究意義。首先,運用機器學習相關技術,通過特征篩選與SVM-LightGBM模型將上市公司財務異常風險判別的概率值作為邏輯回歸模型的輸入值;其次,進行特征分箱、證據權重值的計算與替換等操作;最后,將其與評分卡模型銜接,對12287條制造業上市公司的財務數據進行實證研究。結果表明,利用評分卡模型得出的結果具有較高的可信性,該模型可以合理地對上市公司財務數據的異常風險進行評分,且具有較好的性能。

關 鍵 詞:財務造假; 邏輯回歸; 評分卡模型; 實證研究

中圖分類號:F275;F832.5 文獻標志碼:A

doi:10.3969/j.issn.1673-5862.2023.06.012

Financial data anomaly risk scorecard model of listed manufacturing companies

SHAO Yongyun, ZHANG Liying

(Software College, Shenyang Normal University, Shenyang 110034, China)

Abstract:The traditional scorecard model is often applicable to the credit score of individuals or enterprises. Introducing the credit scorecard model into the abnormal risk score of financial data of listed companies to score the abnormal risk of financial data of listed companies will not only regulate the securities market, but also enable minority shareholders to use it as an investment reference before investment, which has certain research significance.Using machine learning technologies, firstly, feature screening and introducing SVM-LightGBM model are applied to take the probability value of financial anomaly risk identification of listed companies as the input value of logistic regression model. Then, operations such as feature sorting, calculation and replacement of weight of evidence(WOE) value are carried out. Finally, WOE is connected with the scorecard model.The financial data of 12287 manufacturing listed companies are empirically studied.The results show that the scorecard model has high credibility and can reasonably score the abnormal risk of financial data of listed companies, and the scoring model has good performance.

Key words:financial fraud; logistic regression; scorecard model; empirical research

隨著世界經濟復蘇放緩,全球經濟走向的不確定性逐漸加深,外部的金融沖擊對部分國內企業造成很大影響,導致其運行情況不穩定。企業管理層出于自利的角度可能會選擇加強盈余管理等方式,篡改或隱瞞部分信息,僅發布對自身發展有利的盈利信息,從而降低信息的披露質量[1

上市公司運營的好壞與股東的利益息息相關,中小股東是其不可忽視的重要組成部分。中小股東雖然出資額較少或者持股比例偏低[2,但他們的每一筆投資也都關系著一個家庭的運轉。專業的機構投資者更傾向于對信息披露質量較好、不對稱度較低的大型上市公司進行調研[3,而普通投資者往往沒有獨立的能力憑借企業披露的財務報表對投資公司進行分析研究,常常迷失在財務造假公司所“粉飾”的財務數據中,導致投資風險激增,甚至投資失敗。因此,為盡可能避免被某些公司所披露的財務報表數據欺騙,本文對上市公司的財務數據進行分析,按照一定的算法規則對財務數據進行量化,形成穩定準確的上市公司財務數據異常風險評分卡作為投資參考。如果被投資公司存在財務異常風險的嫌疑,那么中小股東可以盡快撤出股份,以免產生更大的虧損。

1 模型建立與模型重構

1.1 邏輯回歸模型

其中:x為樣本取值;y(x)為邏輯回歸模型返回的標簽值;θ表示求解出來的一組參數。

邏輯回歸的核心任務就是求解θ來構建一個能夠盡量擬合數據的預測函數。通過引入損失函數來衡量參數為θ的模型在擬合訓練集時產生的信息損失大小。邏輯回歸的損失函數為

其中:m是樣本的個數;yi是樣本i上真實的標簽;yθ(xi)是樣本i上基于參數θ計算出的邏輯回歸的返回值;xi是樣本i各特征的取值。損失函數越小,模型在訓練集上表現越優異,擬合越充分;損失函數越大,模型在訓練集上表現越差,擬合越不足。因此,需要追求讓損失函數最小化的參數組合,也就是要求解出使J(θ)最小的θ的取值。邏輯回歸模型的損失函數是高階連續可導的凸函數,故可以使用常見的凸優化理論,如梯度下降法、牛頓法等方法求解[6

邏輯回歸模型理論完善,且模型穩健直觀,具有較高的可解釋性。邏輯回歸的變量系數簡單易懂,模型整體便于理解,其與業務知識相結合也較便利,因而成為國內外研究者與金融機構構建信用評分卡的首選模型。

1.2 評分卡模型

評分卡模型是對邏輯回歸模型輸出結果進行轉換的一種模型。在邏輯回歸模型對所有樣本進行擬合后可以得到每個樣本是否進行財務數據造假的預測值,即該樣本公司財務數據造假的概率。設財務數據造假的概率為p,則未進行財務數據造假的概率為1-p,好壞財務數據的對數幾率odds為

評分卡模型最終輸出的是與違約概率呈負相關的分數,違約概率越大,則評分卡分數越低,即高分數高信用低風險[7。評分卡的計算公式為

score=BasePoint-βln(odds) """(4)

其中:score為最終得分;BasePoint和β是可以通過計算得到的常數;ln(odds)代表違約的可能性。要計算常數BasePoint和β需要確定如下2個假設:1)給定一個特定的財務數據造假概率之比odds0下的分值P0;2)指定財務數據造假概率翻倍的分數(points to double the odds,PDO),即PDO=P1-P0。代入評分卡計算公式[8可以得到

由式(5)可以看出,財務數據造假的比率每升高一倍,得分升高PDO個單位。在得到BasePoint和β的取值后,根據給定的違約概率可以計算出比率odds,進而求解最終結果。

評分卡模型結構簡單,可解釋性強,通過評分卡模型的轉換可以使邏輯回歸輸出的結果更加淺顯易懂。一個可靠的評分卡模型可以提高金融評估的準確性和效率。但評分卡模型的局限性在于其輸出結果的可靠性完全依賴于輸入的數據,也就是依賴于邏輯回歸模型是否穩定準確,因而提升邏輯回歸模型的可靠性是提升評分卡模型準確性的關鍵。

1.3 財務數據異常風險模型的建立

傳統的評分卡模型使用邏輯回歸模型構建而成,這得益于邏輯回歸模型獨有而其余模型沒有的截距與各個變量的參數系數。然而,邏輯回歸模型所擬合的輸入值對最終輸出的結果有很大影響。當特征空間很大時,邏輯回歸模型的性能會降低,因而提升邏輯回歸模型輸入變量的可靠性成為提升模型效果的不二之選。目前市面上常見的評分卡模型多以信用評分卡模型為主,其主要應用于信貸評分。評分卡模型尚未用于對上市公司財務數據是否異常進行評分判斷,故該模型可以成為中小股東的投資參考,具有很好的應用前景。

為提升最終財務數據異常風險評分卡水平,從方便投資者對公司是否存在財務異常進行辨別的角度出發,引入SVM-LightGBM模型[9對來源數據進行分析預測,將其所生成的財務數據異常風險概率值作為邏輯回歸模型的入模變量之一,以此來提升模型的準確性,從而建立易于投資者進行投資參考的評分卡模型。上市公司財務數據異常風險評分卡模型的構建流程如圖1所示。

上市公司財務數據異常風險評分卡模型的構建步驟如下:

第1步 為使最終生成的評分卡模型簡單易讀,需要在已經進行過預處理的數據上,計算各特征所攜帶的信息量(information value,IV)大小。按照IV值的大小進行特征篩選,以此來增強評分卡的可讀性。

第2步 將SVM-LightGBM模型生成的財務數據異常的概率值作為新特征引入特征篩選完畢的特征集中,計算箱子數量不同的情況下各特征所攜帶的IV值總量及其對模型的貢獻程度,以此來確定各特征的最佳分箱個數。

第3步 獲得各特征分箱個數后,分別計算各箱的證據權重(weight of evidence,WOE),也就是優質公司與壞公司的比例的對數,WOE值越高說明該箱子里優質公司越多。將WOE值映射并替換原始數據,作為邏輯回歸模型的輸入。

第4步 構建邏輯回歸模型。模型構建完成后將其生成的截距與各特征對應的系數代入評分卡模型中進行計算,最終生成上市公司財務數據異常風險評分卡。

2 實證分析

2.1 數據來源及數據處理

數據來源于第九屆“泰迪杯”數據挖掘挑戰賽A題的上市公司財務數據。該數據文件包含2667家上市公司近6年來的22213條數據,數據字段共363個。其中,按照公司行業進行分類,可以大致分為制造業、信息技術服務業、批發零售業及其他行業。我國是制造業大國,制造業高質量發展是經濟高質量發展的核心內容[10,所以本文選取在總數據中占比最高的制造業公司財務數據作為研究對象。通過數據預處理[11,得到用于分析的數據。其中包含制造業公司12287條財務數據,共257個財務數據特征字段。

2.2 特征篩選與分箱

在數據預處理后,計算各特征IV值進行特征篩選并對特征進行分箱。IV值用以描述各特征對最終結果的貢獻程度,多用于描述特征所攜帶的有用信息量。通常情況下,如果IV值小于0.1,則認為該特征攜帶信息量過少,價值過低[12。基于以上原則,選取IV值在0.15以上的特征作為后續的入模特征。特征篩選完畢后,引入SVM-LightGBM模型對制造業上市公司的財務數據進行識別,將其輸出的各公司財務數據異常概率值作為新特征加入評分卡模型使用的特征集中。分箱的本質就是連續變量的離散化,遵循“組間差異大,組內差異小”的原則,可以使用卡方檢驗衡量2個箱體之間的相似性。如果卡方檢驗后箱體間差異不顯著,則認為2個箱體之間相似,對2個箱體進行合并。最終制造業財務異常指標選擇結果及各指標對應的IV值和分箱個數見表1。

分箱處理完成后計算各個箱體的WOE值并覆蓋原始數據,為后續邏輯回歸模型的構建做準備。WOE值是指該箱中風險公司與非風險公司的比值與總體之間存在的差異,WOE值越大,表示該箱體中擁有風險公司的概率越高[13。在對分箱進行WOE化處理后,箱體與箱體間的運算關系變得清晰,為下一步的建模工作打下了良好基礎。

2.3 模型驗證

在數據分箱處理與WOE化的覆蓋處理完成后,將數據劃分為訓練集和測試集,建立邏輯回歸模型,將訓練集數據輸入并進行模型的調參。邏輯回歸模型的參數主要由正則化系數λ的倒數C和模型收斂的最大迭代次數max_iter控制。

考慮到模型的穩定性與限制模型過擬合等因素,通過繪制模型參數的學習曲線選取最佳模型參數。最終模型的參數設置為C=0.05,max_iter=3。受試者特征曲線(receiver operating characteristic curve,ROC)縱坐標代表真正率,橫坐標代表假正率。曲線越接近左上角也就是曲線下方面積越大,則說明模型分類效果越好。ROC曲線下面積的量化值稱為AUC(area under the curve of ROC)值,表示模型識別能力的好壞。該模型最終的ROC曲線如圖2所示。

由圖2可知,ROC曲線為凸曲線,AUC取值為0.82,說明模型性能優秀,具有很好的樣本分類能力。

KS(Kolmogorov-Smirnov)曲線是對模型風險區分能力評估的重要指標,該指標衡量好壞樣本累積分布的差值,好壞樣本累計差異越大,KS值越大,模型的風險區分能力越強[14。其具體做法是分別繪制真陽性率(true positive rate,TPR)和假陽性率(1 positive rate,FPR)曲線,利用2條曲線之間的距離繪制出KS曲線。模型的KS曲線如圖3所示。

通常情況下認為模型的KS值在0.4及以上說明其有較好的風險區別能力。由圖3可知,該模型最高的KS值為0.4742,說明該模型風險區別能力較好。

為進一步驗證把引入SVM-LightGBM模型輸出的財務風險概率值作為輸入變量的可行性,在此對比未引入財務風險概率值所構建的邏輯回歸模型,對比結果見表2。

由表2可知,引入財務數據風險概率值的邏輯回歸模型總體表現優于未引入財務數據風險概率值的邏輯回歸模型,說明模型構建合理。

2.4 模型結果

基于構建完畢的邏輯回歸模型可以進一步建立評分卡模型,以驗證模型的可行性。已知邏輯回歸模型的截距和各特征的系數,代入評分卡模型即可求得最終評分結果。假設當對數幾率odds為1/60時,score分數為600,PDO為20,則對數幾率為1/30時的score分數為620。將以上設定代入公式,最后求得BasePoint=481.86,β=28.85。評分卡模型的構建需要以基準分數base_score作為參考,也就是需要求解不受評分卡中各特征影響的基礎分。這里將邏輯回歸模型求解出的截距作為ln(odds)代入公式即可求得評分卡模型的基礎分。最終求得基礎分的分值base_score=484.68。

在構建評分卡模型后,為進一步驗證模型效果,對所有樣本公司的財務數據風險情況進行打分,并將評分按照降序排列,觀察不同分數區間內各公司的財務數據風險情況。其中,所有樣本中最高得分為664.74,最低得分為288.68。各分數區間風險情況統計見表3。

由表3可知,分數分布滿足正態分布,說明該評分卡具有一定的合理性。分值越高,財務數據風險高的公司占比越低;分值越低,財務數據風險高的公司占比越高。分值低于300分的公司,財務數據異常風險的概率為100%。

3 結 語

本文引入廣泛應用于金融行業信用評分的評分卡模型并加以改進,構建出適用于制造業上市公司財務數據風險的評分卡模型。結果顯示,在邏輯回歸模型中,引入SVM-LightGBM模型對上市公司財務數據風險識別的概率值作為入模變量,提高了模型最終的表現效果。最終構建出的財務數據風險評分卡模型的分數分布符合正態分布,驗證了模型的有效性,為中小股東的投資提供了參考。邏輯回歸模型的輸入值很大程度上影響了最終模型的表現效果,可以考慮擴大數據特征的選擇,使用傳統數據外的另類數據增加數據維度和厚度[15。同時,評分卡分數區間的劃分可以更為詳盡,方便投資者參考使用。

參考文獻:

[1]陳湘,朱麗波. 信息披露質量對房地產企業盈余預測的影響[J]. 稅務與經濟, 2022(4):100-105.

[2]徐鑫. 公司法對中小股東合法權益的保護研究[J]. 市場周刊, 2022,35(8):172-177.

[3]劉劭睿,李正杰,劉佳麗. 機構投資者調研行為與上市公司股票流動性[J]. 稅務與經濟, 2022(5):60-69.

[4]趙青松,祝學軍,錢姝. 信用卡用戶的風險評估研究[J]. 金融發展評論, 2019(5):145-158.

[5]李航. 統計學習方法[M]. 北京: 清華大學出版社, 2012.

[6]陳翠艷. A股上市公司財務造假問題研究[D]. 鄭州: 鄭州大學, 2021.

[7]肖文. 基于機器學習的農戶信用評估研究[D]. 蚌埠: 安徽財經大學, 2020.

[8]肖磊. 基于集成學習的個人信用評分模型研究[D]. 南昌: 江西財經大學, 2022.

[9]邵永運,張立瑩. 基于SVM-LightGBM算法的上市公司財務數據異常識別模型實證研究[J]. 沈陽師范大學學報(自然科學版), 2023,41(5):464-468.

[10]張維佳. 我國制造業正在從高速增長轉向高質量發展[N]. 中國電子報, 2023-04-04(3).

[11]仲姝锜. 基于機器學習的數據預處理框架研究[D]. 西安: 西安工業大學, 2021.

[12]GHAILAN O,MOKHTAR H M O,HEGAZY O. Improving credit scorecard modeling through applying text analysis[J]. ILACSA, 2016,7(4):512-517.

[13]牛麗. 基于CatBoost融合算法的信用風險評估及模型研究[D]. 太原: 太原理工大學, 2021.

[14]劉志惠,黃志剛,謝合亮. 大數據風控有效嗎?[J]. 統計與信息論壇, 2019,34(9):18-26.

[15]龐德良,李思卓. 另類數據征信對信貸公平的影響及展望[J]. 稅務與經濟, 2022(4):57-64.

主站蜘蛛池模板: 97免费在线观看视频| 国产成人精品高清在线| 波多野结衣久久精品| 国产网友愉拍精品| 亚洲小视频网站| 国产精品露脸视频| 国产精品第一区| 久久国语对白| 国产人妖视频一区在线观看| 亚洲综合精品第一页| 东京热av无码电影一区二区| 国产成人久视频免费| 亚洲午夜综合网| 久久超级碰| 国产男人天堂| 在线观看免费人成视频色快速| 国产人碰人摸人爱免费视频 | 看国产毛片| 婷婷色婷婷| 亚洲啪啪网| 伊人久久精品无码麻豆精品| 亚洲视频影院| 国产JIZzJIzz视频全部免费| 国产精品视频白浆免费视频| 久久久久人妻一区精品| 中国丰满人妻无码束缚啪啪| 久无码久无码av无码| 拍国产真实乱人偷精品| 天天爽免费视频| 91麻豆国产在线| 久久香蕉国产线看精品| 国产亚洲精品97在线观看 | 一区二区欧美日韩高清免费| 亚洲va视频| 久久久久亚洲精品无码网站| 欧洲成人在线观看| 在线观看免费国产| 无码视频国产精品一区二区| 久久精品嫩草研究院| 亚洲电影天堂在线国语对白| 18禁色诱爆乳网站| 国模视频一区二区| 久久亚洲日本不卡一区二区| 亚洲日韩第九十九页| 免费国产在线精品一区| 潮喷在线无码白浆| 欧美一道本| 久久频这里精品99香蕉久网址| 欧美日本视频在线观看| 97视频免费看| 一区二区三区国产精品视频| 国产亚洲精品91| 亚洲精品成人片在线观看 | 亚洲中文久久精品无玛| 国内精品久久久久鸭| 老熟妇喷水一区二区三区| 久青草免费在线视频| 国产精品自在自线免费观看| 免费精品一区二区h| 日韩精品成人网页视频在线 | 欧美19综合中文字幕| 国产成人av一区二区三区| 韩国自拍偷自拍亚洲精品| 国产午夜无码片在线观看网站 | 天堂在线亚洲| 国产在线观看成人91| 亚洲三级网站| 国产亚洲欧美日韩在线观看一区二区| 喷潮白浆直流在线播放| 试看120秒男女啪啪免费| 波多野结衣一二三| 国产成人亚洲毛片| 大学生久久香蕉国产线观看| 国产97视频在线| 欧美亚洲一区二区三区导航| 中文字幕亚洲电影| 永久免费AⅤ无码网站在线观看| 天堂av综合网| 国产成人盗摄精品| 色天天综合| 国产精品成人AⅤ在线一二三四| 欧美一道本|