曹 強 方扶星
(安徽財經大學,安徽 蚌埠233030)
隨著經濟全球化的高速發展以及市場環境的變化多端,上市公司外部發展環境的不確定性急劇增加。面對這樣的不確定性,上市公司如何及時發現并規避退市風險將直接影響著公司的可持續發展,而退市風險預警系統作為證券市場退市機制的核心內容,一直以來引起了學者們的廣泛研究和關注。Xie等[1]通過比較支持向量機(SVM)和數據包絡分析(MDA)對于上市公司的財務困境預測,實證結果表明支持向量機的預測結果較好;Mselmi等[2]結合偏最小二乘法提出了支持向量機混合模型,發現債償能力對于納斯達克上市公司的退市風險影響最大。雖然偏最小二乘法能夠通過最小平方和尋找數據的最佳函數匹配,但該方法只能進行線性估計,應用于非線性的財務數據會產生一定的數學偏差。主成分分析法借助于正交變換,將財務變量相關的原隨機向量轉化成其分量不相關的新隨機變量,然后對多為變量系統進行降維處理,能夠顯著降低非線性財務數據的降維損失。另外,基于非線性核函數(Nonlinear kernel)的支持向量機分類器能夠避開局部極小值的干擾,從而減少模型的系統偏差。因此,本文通過構建基于主成分分析的支持向量機模型預測我國上市公司的退市風險,對完善中國證券市場的退市風險預警機制具有重要意義[3]。
本文研究的上市公司源自于我國A股市場,其中被交易所處以退市風險警示(ST)的公司139家,非ST公司239家。同時本文所搜集的數據來自于樣本378家上市公司2018年第四季度財務報表,并將ST和非ST公司的數據隨機分為兩個子集:70%的數據用于擬合支持向量機模型,余下30%的數據對模型進行交叉驗證。由于描述公司財務狀況的指標繁多,本文參照鮑新中和楊宜[4]的經驗選取了退市風險預警實證研究中較為常用(引用頻次超過50)的21項指標,這些指標分別從債償能力、盈利能力、發展能力和每股指標四個方面較為全面的反映了我國A股上市公司的發展狀況,預警指標如表1所示。
由于初步確定的21項指標較多,部分指標可能不夠顯著并且存在著交叉重復。本文通過顯著性檢驗進行指標分辨能力篩選,并利用主成分分析對剩余指標進行降維處理,將多個指標合并成幾個主成分,確保財務指標的顯著性以及預警指標的簡潔性。

表1 財務指標體系
K-S正態性檢驗是常用的多元正態性檢驗方法,能夠對數據進行定量檢驗,因此本文采用K-S正態性檢驗來驗證各財務指標是否服從正態分布[5]。由表2結果可知,各變量指標的顯著性水平均小于0.05,此時各財務指標均不服從正態分布。表2為KS正態性檢驗結果及顯著性水平。

表2 K-S正態性檢驗
對K-S正態性檢驗中不服從正態分布的財務指標需要進行非參數檢驗。SPSS25.0提供的方法多種多樣,其中最為常用的是Kruskal-Wallis(H檢驗),用來檢驗多個獨立樣本是否具有顯著性差異。因此,對不服從正態分布的財務指標進行K-W非參數檢驗驗證其是否存在顯著性差異。檢驗結果如表3所示。
由表3中的結果可知,只有財務指標X7、X20的漸近顯著性大于0.05,表明其對ST公司和非ST公司的區分不顯著。綜合K-S正態性檢驗和K-W非參數檢驗結果可知,財務指標X 1-X6、X8-X19和X21具有顯著性特征并且能夠顯著區分ST公司和非ST公司。
經過顯著性檢驗后的財務指標雖然保證了較高的分辨能力,但如果直接用來擬合支持向量分類器會導致系統信息冗余,而且輸入變量過多會導致擬合支持向量分類器時產生維度災難問題[6]。鑒于此,本文對上述19項財務指標進行主成分分析,相關系數矩陣的前六個特征根及其貢獻率如表4所示。
可以看出前5個特征根的貢獻率均為10%以上,累計貢獻率達到了71%,主成分分析效果較好。因此本文選取前5個主成分構建預警指標體系,前5個主成分對應的特征向量如表5所示,從主成分的系數可以看出,第一主成分(CR)主要反映了上市公司的盈利能力;第二主成分(NA)主要反映了上市公司的債償能力;第三主成分(OM)主要反映了上市公司每股指標;第四主成分(NIROS)主要反映了上市公司的利息保障倍數和資本累計率;第五主成分(ROTA)主要反映了上市公司的營業利潤率和資本保值增值率。
支持向量機(Support Vector Machine,SVM)是一種能夠同時用于分類和回歸的統計方法。SVM的原理是將低維特征空間投影到高維中,從而在高維特征空間中實現線性可分[7]。在分類問題上,它通過尋求將特征空間的最優超平面來將其一分為二。本文隨機選取70%的樣本數據擬合支持向量分類器,并且基于線性核函數和非線性核函數分別找出特征空間的最優超平面,建立最優支持向量分類器并使用剩余30%的樣本進行交叉驗證。

表3 Kruskal-Wallis(H檢驗)

表4 主成分分析結果

表5 5個主成分對應的特征向量
首先將區分上市公司是否被ST的5個主成分作為支持向量機分類器的預測變量,設定觀測樣為[ai,yi](i=1,2,…,378),其中ai∈R5,yi=1,為無退市風險,yi=0有退市風險,即公司股票被處以退市風險警示的企業。我們將觀測樣本的70%用作訓練集,剩余樣本用作測試集。擬合支持向量分類器就是要找一個最優分類面(最優超平面)(ω*x)+b=0,其中x=[x1,x2,x3,x4,x5]T,ω∈R5,b∈R,ω,b待定,滿足如下條件:

即有yi[(ω*ai)-b]≥1,i=1,2,…,378,其中,滿足方程(ω*ai)+b±1的樣本為支持向量。要使兩類總體到分類面的距離最大,則有

基于此建立SVM預測模型:

這是一個凸線性規劃問題,可以求得最優值對應的ω*,b*,得到分類函數

引入線性核函數(ai*x)得到最終的分類函數表達式如下:

實際上,非線性核函數可以將原樣本空間線性不可分的向量轉化到高維特征空間中線性可分的向量,所以將線性核函數(ai*x)換成一般的核函數K(x,y),可得到一般分類函數的表達式為

1.數據預處理
第i(i=1,2,…,378)個樣本的第j(j=1,2,3,4,5)個主成分的取值記為aij。對于給定的378個訓練樣本,首先計算它們的均值向量μ=[μ1,μ2,μ3,μ4,μ5]和標準差向量σ=[σ1,σ2,σ3,σ4,σ5],對于所有樣本點數據利用如下公式進行標準化處理:

對應地,稱

2.核函數的選取
核函數(kernel)的一般形式為K(x,y)=<f(x),f(y)>,其中x,y為n維,f為n維到m維的映射,<f(x),f(y)>表示內積在用SVM處理問題時,如果數據線性不可分,希望通過將輸入空間內線性不可分的數據映射到一個高維的特征空間內,使數據在特征空間內是線性可分的,這個映射記作。接下來的優化問題中就會有內積,這個內積的計算維度會非常大,而核函數可以幫我們很快地做一些計算,否則需要在高維空間中進行計算。常用的核函數有線性核函數(Linear kernel)和非線性核函數(Radial kernel)接下來便選取這兩種核函數擬合支持向量分類器[8]。
首先選取線性核函數(Linear kernel)擬合支持向量分類器,設置一系列cost值,cost值的取值范圍為[0.01,0.1,0.5,1,5,10],通過交叉驗證法選擇最優的cost。結果顯示,在cost=1時,交叉驗證的錯誤率最低,模型的擬合效果最佳。同時使用命令plot畫出一對變量的決策邊界,如圖1所示。

圖1 線性支持向量分類器
主成分CR與主成分OM分別反映了上市公司的盈利能力和每股指標,此時使用最優線性模型對測試集進行測試,結果顯示,分類錯誤率為0.1348。本文預警指標體系選取的4項每股指標均為正向指標,當每股指標的標準化數值越大,每股指標的實際數值也就越大,從而上市公司的盈利能力也就越好,面臨退市風險警示的概率可能性就越低。圖二的最優超平面恰好將數據集分為左下角和右上角兩個部分,與實際情況相吻合,右上角的上市公司很少被除以退市風險警示,而左下角的上市公司大部分都被處以了退市風險警示。
接下來選取非線性核函數(Non-linear kernel)擬合支持向量分類器,設置一系列cost值和gamma值,同樣通過交叉驗證法選擇最合適的cost,進而用最優模型對測試集進行預測。結果顯示,在cost=10,gamma=2時,交叉驗證的錯誤率最低,模型的擬合效果最佳。同時可以使用命令plot畫出一對變量的決策邊界,如圖2所示。

圖2 非線性支持向量分類器
此時使用最優模型對測試集進行測試,結果顯示,分類錯誤率為0.115,0,非線性核函數擬合支持向量分類器的預測效果要優于線性核函數擬合的支持向量分類器,正確分類率達到了89.50%。這是因為各個經濟指標之間不是單純的線性關系,還受到邊際遞減效應的影響,隨著每股指標按單位數值逐漸增加時,盈利能力的增加會越來越小。因此,非線性支持向量分類器的最優超平面呈單支雙曲線狀,預測效果相較于線性支持向量分類器會更好。
圖3 為Logit模型、線性判別分析模型(LDA)、二次判別分析模型(QDA)和樸素貝葉斯模型(Naive Bayes)的ROC曲線圖[9]。通過對比圖1和圖2可知,非線性支持向量機預測模型的分類效果明顯優于傳統的Logistic回歸模型,對上市公司退市風險預警的準確性提高了5.29%。

圖3 4種模型的ROC曲線
上市公司的資產質量是衡量一個企業能否穩定運營發展的重要指標,良好的資產質量可以使企業保持生機活力并擁有廣闊的發展空間,在市場調研的基礎上,企業有針對性地根據客戶群體的消費習慣,提供更優質的售后服務。與此同時,加強企業的成本管理,有利于提高上市公司產品的市場占有率和企業利潤率,保證資金的良性循環,提高企業的抗風險能力。
對上市公司內部控制的管理,首要任務是為全體員工樹立退市風險防范意識,形成退市風險管理文化。同時積極執行全面預算控制,將企業經營收益最大化作為發展的戰略目標,調整資源統籌全局對企業的各項經營活動預算進行成本-效益分析管理,提高資金的利用率以及時間價值,幫助上市公司管理層掌控企業發展動向,真正實現經營收益最大化和有效控制退市風險的目標。
退市風險預警是一種運用科學統計方法,幫助企業管理者了解內部經營狀況和風險狀態的管理手段。通過對企業內部財務數據收集整理,對其退市風險狀態進行實時監督,便于管理層采取針對性的風險控制措施。本文通過構建非線性支持向量機模型和Logistic回歸模型對我國上市公司的退市風險進行實證分析,即使在不考慮多元正態性檢驗的前提下,非線性支持向量機模型的性能仍然普遍優于傳統的Logistic回歸分析[10]。總之,合理的退市風險預警具有較強的監督作用,有助于企業找到退市風險發生的根本原因,從而采取相應的對策和措施,在風險進一步惡化之前及時解決問題。