鞏斌
(安徽財經大學統計與應用數學學院,安徽蚌埠233030)
企業在經營時機遇和風險相伴而生,當然對企業而言最嚴重的是發生財務困境,最甚者就是面臨著破產。當前國內資本市場發展和建設日趨成熟,伴隨而來的是上市公司陷入財務危機的比例也相應增加。探其原因,世界經濟總體低迷、企業經營環境的變化、國家宏觀調控政策的變化、核算準則的經常變動等原因也會在一定程度上影響著企業的經營成果,然而最根本的原因還是在于企業自身存在問題,因而對監管者、經營者、股東等而言,如何正確對待和評價上市公司的經營成果已成為他們最終的目的。另外通過對各上市公司之間進行經營成果的對比分析,還可以讓它們正確認識其在本行業、乃至所有的上市公司中所處的位次。我們依據指標選取的根本標準和上市公司披露的相關財務信息,選取了五類財務比率指標:資本結構即長期負債比率和股東權益比率;償債能力即流動比率和速動比率;盈利能力即毛利率、銷售凈利率、資產收益率和股東權益收益率;資產運營能力即應收賬款周轉率、存貨周轉率和總資產周轉率;成長能力即每股收益增長率、凈利潤增長率和凈資產收益率增長率。[1]
為了提高建模的有效性以及挖掘內部所隱含的內在有效信息,本文樣本采集了大量的橫截面數據。[2]43-51首先影響企業發生財務危機的最根本的指標數據即是判別指標分析時所使用的數據,再次對這些指標和財務狀況的關系進行描述統計分析,模型對新數據的預測解釋能力是選擇模型第一考慮的因素。據此,本文分別使用了決策樹、logistic回歸分析和神經網絡三種技術建立模型。[3]152-156在建立模型前必須預處理這些初始的數據,主要是數據具有囊括原有絕大部分信息、訓練集數據與驗證集數據彼此不相關。把所屬行業作為分層變量,運用分層隨機抽樣技術,使驗證集、訓練集分別占25%和75%。目標變量為ST變量,輸入變量則為上述的財務比率指標和所屬的行業類別,[4]分別采用決策樹、logistic回歸和BP神經網絡進行建模。
為了提高模型的擬合度和保存“真”信息,數據挖掘技術盡可能多地選用輸入變量。由于較多的變量所含的信息具有重疊性,所以選用那些囊括絕大部分信息的變量,而拒絕那些信息具有重疊性或發生多重共線性的冗余變量。依據卡方值方法對變量進行選擇,從而消除目標變量是二值變量的影響。[5]處理后的結果如表1所示。

表1輸入變量篩選結果表
由表1可知:所屬行業、股東權益比率、速動比率、銷售凈利率、資產收益率、總資產周轉率和凈資產收益率增長率的卡方值大于閾值,應作為輸入型變量;其余的則因相應的X2過小而被拒絕。
以通過閾值的變量為輸入變量,以特別處理狀況為目標變量進行決策樹建模。[6]219-223為了建立好的決策樹模型,樹的結構設置尤為重要,使模型區分數據的能力最大,是建模的目標,根據對問題的理解和變量選擇的結果進行試錯。從圖1中可以看出,雖然訓練集的正確分類率還在上升,模型在驗證集的正確分類率開始下降時就停止繼續細分,從而有效地防止模型的過度擬合。[7]由決策樹生成的語言規則可以看出:資產收益率指標的影響最大(log worth=-log(X2檢驗的P值)=95.496),從圖2 ST值密度圖可以看出,ST值不同的公司在該指標的分布圖明顯不同,因此首先以它為劃分屬性,接著在分節點上股東權益比率是競爭獲勝的變量,其次是銷售凈利率。正確分類率可以達95%以上。同時銷售凈利率、凈資產收益率增長率和股東權益比率的log worth也較大,分別為89.175、55131和56.509,也可以選擇它們為第一劃分變量。

圖1決策樹構建過程圖

圖2資產收益率在ST值上的分布密度圖
采用逐步回歸的辦法對備選變量進行篩選,得出如下參數估計,如表2和表3。

表2logistic回歸模型參數估計結果表

表3Logistic回歸分析性能統計量表
把上述的財務指標和所屬的行業作為輸入節點,進而對它們的數值進行標準化處理,輸出節點則為ST狀況變量,隱含層及其節點個數的計算函數為雙曲對數函數,而輸出節點的傳遞函數則是正切函數。計算隱藏層節點個數一般認為其取值在輸入、輸出節點數之間,且與所取樣本容量有關。其計算公式則為:隱藏層節點數=1/10×樣本數÷(輸入層節點數+輸出層節點數)。[8]選用SAS內置算法(learning rate=0.9,min.learning rate=0.1,accelerate rate=1.1,decelerate=0.9)進行訓練。為了避免學習過程收斂于局部最優點,使學習有一個好的起始點,讓網絡預訓練20次直至按照規定的收斂準則使訓練停止,按照誤分類率最小的準則選擇網絡。分析的結果如圖3、表4、表5所示。

圖3BP神經網絡模擬學習過程圖

表4BP神經網絡模擬訓練權數結果表

表5BP神經網絡模型性能統計量表
提升圖(lift chart)和接受者操作特征曲線(ROC curve)能夠可視化地實現模型性能的評估,提升圖越高模型性能越好。提升圖是描述模型在各個分位區間的提升率,即運用模型進行判別比不用模型隨機判別提高準確率的程度,橫軸的分位區間按預測的可信度由大而小排列。ROC曲線是類別1中的對象被正確分類到類別1的估計比例(sensitivity)與相對類別2的對象被錯誤分類到類別1的估計比例(1-specificity)的曲線,ROC曲線越向左上方延伸,曲線下的面積越大,表明可以選用的分類閾值越多、模型的分類效果越好。現將三個模型的累積提升圖和ROC比較如下:由圖4可以看出,三個模型均有較高的判別能力,在第二個百分位區間以后模型的性能差異不大,在前兩個百分位區間決策樹的判別性能最好,Logistic回歸模型和神經網絡稍差一些。從圖5 ROC曲線來看,logistic回歸模型的分類效果最好,其次是決策樹模型,神經網絡的效果略差。

圖4三個財務危機判別模型累積提升對比圖

圖5三個財務危機模型的ROC曲線對比圖
從各個模型的分析結果可獲知它們識別的主要影響變量幾乎是一致的。即資產收益率、股東權益比率、凈資產收益率增長率最高,其次是銷售凈利率。總資產周轉率、速動比率和行業因素也有所影響,但程度不大,回歸模型和決策樹模型卻將其拒絕。企業的相關利益者應重點關注上述幾個指標,同時也應以它們作為整個指標體系來考察本企業有關經營方面的方針措施。依據上述模型各自的優點可按需而用:決策樹模型可生成具體的語言表述的能力,使結論易于理解,在定性分析方面具有優越性;Logistic回歸模型簡潔,分類的效果較好,可用來計量計算;神經網絡模型運用時考慮外界條件少,過濾噪聲強,保全信息最大。因此在實踐中可將三者結合起來,互為參考,為決策服務。
財務危機判別模型的結果表明:影響上市公司財務狀況的重要指標是資產收益率、股東權益比率與凈資產收益率增長率,其次是銷售凈利率。
其一,資產收益率是表現企業獲利大小與否的一個指標。分析的結果顯示它的系數為負數,因此綜合實力強的企業陷入財務危機的可能性就大,反之,可能性就小。資產收益率越低,公司陷入財務危機的顯著性就越高。因此提高資產收益水平、搞好經營管理是企業避免陷入財務危機的必然選擇。[9]
其二,股東權益比率是反映企業資本結構的指標。上市公司對股東權益負責,究其實質是企業自身實力、抵御風險能力和拓展經營業務的基礎。財務危機判別Logistic回歸模型中,該指標系數為負,表明公司的財務比率越小則發生財務困境的可能性就越大,兩者呈反比例關系。
其三,被特別處理企業財務的一大特征是凈資產收益率增長率偏高。如果某公司的財務狀況良好、經營業績健康則顯示該指標很穩定。故而此指標在識別企業財務是否健康中也占據很重要的地位。
其四,銷售凈利率是反映公司的盈利是否強勁的一個重要指標。通過上述三種模型分析顯示,該指標是影響公司是否陷入財務危機與否的一個重要指標。因此,從公司在實際的經營活動中都注重銷售,可見一斑。它是企業實現資金周轉、獲取利潤、回報企業利益相關方的重要手段。
[1]鞏斌.基于BP神經網絡的上市公司財務困境判別實證研究[J].蘭州商學院學報,2010,(2).
[2]朱明.數據挖掘[M].合肥:中國科學技術大學出版社,2002.
[3]王又莊.上市公司財務會計報告分析與評價[M].上海:立信會計出版社,2002.
[4]易丹輝.統計預測——方法與應用[M].北京:中國統計出版社,2001.
[5]曾衛.上市公司業績綜合評價模型的構建及應用[J].數量經濟技術經濟研究,2002,(2).
[6]于秀林,任雪松.多元統計分析[M].北京:中國統計出版社,1999.
[7]相龍艷.基于BP神經網絡的上市公司財務危機預警研究[J].金融經濟,2009,(8).
[8]鞏斌.基于BP神經網絡的上市公司財務困境預警模型實證研究[J].皖西學院學報,2010,(2).
[9]白羽.我國上市公司盈利能力分析[J].合作經濟與科技,2008,(15).