趙芮悅 鐘 意 趙雯璇 樊雯韻
(上海立信會計金融學院 上海 201209)
隨著我國證券市場的不斷發展和完善,滬深兩市交易的上市公司數量逐年增加,截至2021年,我國滬深兩市A股上市公司總數達4000多家。但隨著市場競爭的激烈,致使許多企業無法在此市場環境下幸存下來,出現不可挽回的財務危機。我國A股上市公司虧損數量和比重呈逐年增加態勢,業績虧損上市公司超200家,比例超6.30%,且合計虧損超1200億元,而滬深兩大證券交易所A股迄今也共有83家退市公司??梢娖髽I經歷經濟沖擊或是管理失控等原因,均可能使其財務活動出現各種隨機性和風險性,進而造成退市風險(*ST)或者被特別處理(ST)。因此防范企業財務危機并做精準預警已經成為現上市公司風險管理的重要組成部分。
在基于傳統Cox回歸模型的研究中,多數學者采用固定協變量的Cox模型,然而考慮到實際場景中,財務指標往往會隨著時間變化而變化,因此本文將時間因素納入協變量的考量之中,構建時依Cox模型來刻畫相對風險函數的動態變化。另外,本文引入Cox比例風險神經網絡DeepSurv,將深度學習應用于非線性Cox比例風險網絡中,構建深度生存分析算法以評估企業財務風險。不同于之前學者們使用的傳統Cox模型,將其擴展至非線性Cox能夠使協變量之間的非線性關系更好的被神經網絡方法識別出,解決了傳統Cox無法識別協變量間的交互作用這一局限性。
實驗結果表明,DeepSurv模型能夠推廣應用于更復雜的數據集,更好的估計出相對風險函數于協變量間的非線性關系度量。應用于股票市場場景中,能夠為上市公司實時評估財務狀況、有效避免財務困境、降低退市風險做出貢獻,也為投資者和商業銀行分析、預測和監督企業的財務狀況做出參考。
20世紀70年代,Cox[4](1972)首次提出Cox模型,隨后該模型就被廣泛運用于各個研究領域。在流行病學領域,Insan[7](1997)利用Cox模型,研究新奧爾良黃熱病有關時間與死亡風險之間的關系。在財務領域,William[5](1986)運用Cox模型來預測銀行倒閉時間,并證明其預測有效。Chancharat[10](2008)應用Cox模型,證明財務比率對澳大利亞公司財務困境的影響具有統計學意義。Kristanti(2016)使用Cox模型,尋找影響財務困境生存可能性的因素。在生物統計領域Brazauskas(2016),以造血細胞移植研究數據表明Cox模型是評估治療效果的優良工具。在人口統計學方面,Kundu(2021)按人口因素分組,發現運用Cox模型有助于評估印度COVID-19患者存活率的變異性。
為滿足不同的研究需求,Cox模型也隨之不斷地擴展、優化。Faraggi-Simon[6](1995)使用深度生存神經網絡為協變量與因變量之間的關系建模非線性表示,使用前饋網絡來學習協變量與相對風險函數的關系,代表了神經網絡在生存分析中的首次應用。Laura[9](2005)提出了一個隨時間變化的新鑒別指數Ctd,該指數對于具有時間依賴性的協變量的評估模型具有分辨能力。Jared(2018)使用DeepSurv來研究病人的協變量和各種治療方案之間的關系。實證發現,DeepSurv結合神經網絡有更好預測效果。Havard Kvamme(2019)基于損失函數,提出了Cox模型的擴展,繼而得到神經網絡擴展Cox比例風險模型。
為模擬企業財務指標和生存風險間的相互作用,本文引入Cox比例風險神經網絡DeepSurv,將深度學習應用于Cox比例風險網絡中,更好的捕捉變量間的關系,并借此評估企業財務風險。DeepSurv本質上是一個前饋神經網絡,其輸入為企業財務數據,網絡的隱藏層由全連接層和Dropout層組成,其輸出為是一個線性激活函數單元,用于估計Cox模型中的風險似然函數。通過設置損失函數為并進行正則化來訓練該網絡,最終估計出相對風險函數與協變量間的非線性關系度量。
Cox模型,又稱Cox比例風險模型,是常見的生存分析半參數回歸模型之一,可以研究生存時間是否具有一定規律,并分析一個或多個風險因素對生存時間的影響,在生物統計領域具有廣泛運用。Cox比率風險模型采用偏似然函數對協變量進行參數估計,定義為具有預測效應的協變量,為參數變量,即各協變量的回歸系數,是基準風險函數,即危險因素為0時t時刻的風險值,則有風險函數如下所示:





本文實驗數據取自國泰安數據庫(cndata1.csmar.com),樣本為滬深A股全部上市公司,共計3726家。在3726個樣本企業中,截止至2021年有896家企業出現過ST/*ST/DT,認為具有財務風險。對于ST企業,本文將企業被ST的年份定義為第T年,考慮上市企業在T-3年的各項經營指標與在T年的財務危機結果有較強的相關性,截取上市公司被ST前三年的各項指標數據,對于非ST公司,則以近三年指標作為實驗數據,并基于上市日期對齊時間序列。在選取變量時,依照全面性原則,由償債能力、披露財務指標、比率結構、經營能力、盈利能力、現金流分析、風險水平、發展能力、每股指標、相對價值指標共計十個大類的因素入手提取了51個原始變量。
對數據進行處理,將數據以十折交叉驗證分為隨機10組,取其中9組建立和優化模型,剩余1組為測試集,以評價模型在新數據上的表現。為評價模型準確性,本文選用一致性指數 (Concordance index,C-index)與Brier Score,NBLL三項指標分別對模型進行評估。為比較不同模型的預測能力,本文以時依Cox模型、邏輯回歸模型、CoxCC模型作為基準線,與本文模型進行對照實驗。實驗結果表明,DeepSurv在C-Index,Brier score,NBLL三項指標中,均取得了最優表現,驗證了模型的擬合優度與準確性(見表1)。

表1:實驗結果比較
本文選用滬深A股市場的所有企業為樣本數據,從比率結構、償債能力、發展能力、風險水平、經營能力、每股指標、現金流分析、相對價值指標、盈利能力十個方面選取51個原始變量作為預警指標。由于協變量在不同時間維度上存在變化,各協變量間存在交互影響,本文引用時依協變量Cox模型,隨后使用基于DeepSurv的深度生存分析算法對數據進行訓練最終獲得相對風險函數,得到指標對于企業退市事件的正反影響及強度。實驗結果表明,該預測模型與其他傳統模型相較有較高的準確性,實現了對企業生存率的準確預測,動態展現了企業從正常轉入財務危機的變化過程,尤其是較為復雜的財務數據集預測有了一定的突破,具有一定的判斷能力。對于企業、監管部門、投資者三方都有一定的參考價值。