











摘 要:北交所的成立完善了我國多層次資本市場的構(gòu)成,并且為創(chuàng)新型中小企業(yè)發(fā)展提供了新的資本環(huán)境和發(fā)展機遇。基于機器學習模型XGBoost和SHAP模型,對北證50指數(shù)上市公司投資價值進行實證分析。結(jié)果發(fā)現(xiàn),在眾多影響投資價值的因素中,資產(chǎn)總計和研發(fā)能力兩個因素作用最為明顯,證實了北證50指數(shù)上市公司專精特新的性質(zhì),并基于此提出相應的投資建議,以期為投資者投資決策提供有益參考。
關鍵詞:北交所;中小企業(yè);XGBoost;投資價值
中圖分類號:F832.5;F832.48;F830
文獻標識碼:A
DOI:10.3969/j.issn.1672-2272.202409090
英文標題
The Research on the Investment Value of Companies Listed on the BSE 50 Index: An Empirical Analysis Based on XGBoost and SHAP
Yang Youbai, Wang Ziming
(School of Economics and Management, Qinghai Minzu University, Xining 810000, China)
英文摘要Abstract:The establishment of the Beijing Stock Exchange (BSE) has improved the structure of China’s multi-level capital market and provided a new capital environment for the development of innovative small and medium-sized enterprises (SMEs). This paper analyzes the investment value of companies listed on the BSE 50 Index using the XGBoost machine learning model and SHAP model. The results reveals that among the various factors influencing investment value, total assets and Ramp;D capability have the most significant impact, confirming the “specialized, refined, distinctive, and innovative” nature of the BSE 50 Index companies. Based on the results, corresponding investment recommendations are proposed to provide useful references for investors’ decision-making.
英文關鍵詞Key Words:Beijing Stock Exchange;SMEs; XGBoost; Investment Value
0 引言
中小企業(yè)是我國經(jīng)濟發(fā)展的重要基石,肩負著稅收、就業(yè)的重要使命。張峰等[1]提出科技創(chuàng)新能力是支持企業(yè)不斷成長的重要因素,也是企業(yè)的核心競爭力。2021年9月2日,習近平總書記在中國國際服務貿(mào)易交易會全球服務貿(mào)易峰會提出,“繼續(xù)支持中小企業(yè)創(chuàng)新發(fā)展,深化新三板改革,設立北京證券交易所,打造服務創(chuàng)新型中小企業(yè)主陣地”。田利輝[2]、張曉燕等[3]提出北交所的設立,將為打通場內(nèi)市場和場外市場起到關鍵的橋梁作用,使多層次市場之間連接更加通暢,為“專精特新”中小企業(yè)提供更完善的資本市場環(huán)境。林麗娟和張宗新[4]、郝臣[5]提出隨著我國對資本市場不斷深化改革,服務科技創(chuàng)新發(fā)展的力度也在不斷增強,逐步形成了以科創(chuàng)板、創(chuàng)業(yè)版、北交所協(xié)同發(fā)展的良性競爭格局。喬永遠等[6]提出科創(chuàng)板專注“硬科技”特色,創(chuàng)業(yè)板突出“三創(chuàng)四新”特征,北交所定位“專精特新”,資本市場多層次進階演化滿足不同生命周期、不同規(guī)模企業(yè)的融資需求。然而,科技創(chuàng)新屬性突出的中小企業(yè)在投資價值評估方面與傳統(tǒng)企業(yè)存在很大差異。因此,構(gòu)建一個更加科學的投資價值評估體系對中小企業(yè)發(fā)展具有十分重要的意義。
1 文獻綜述
在投資價值及公司價值研究領域,當前國外相關文獻已取得諸多成果。Kristi amp; Yanto[7]、Tarmidi等[8]提到財務因素與非財務因素對投資價值的影響作用。Reschiwati等[9]、Markonah等[10]認為盈利能力和償債能力對投資價值具有強相關性。Rahman amp; Howlader[11]認為研發(fā)支出對投資價值具有正向影響。Safitri等[12]提到股息政策和公司治理對投資價值存在一定相關性。當前,國內(nèi)關于公司投資價值影響因素的研究主要集中于財務因素與非財務因素兩個方面。在財務因素方面,呂梅萌和楊銀娥[13]提出盈利能力、運營能力、償債能力、發(fā)展能力均對公司投資價值具有明顯的相關性。邱玉等[14]提出營業(yè)收入同比增長率可有效衡量公司發(fā)展能力。王波和楊茂佳[15]認為對于企業(yè)而言,ROA、固定資產(chǎn)周轉(zhuǎn)率和資產(chǎn)負債率對投資價值具有顯著的相關性。在非財務因素方面,研發(fā)能力、資本結(jié)構(gòu)、公司規(guī)模和股權(quán)結(jié)構(gòu)對公司投資價值具有重要影響。王曉紅等[16]指出企業(yè)的ESG、研發(fā)能力、成長環(huán)境等是影響投資價值的重要因素。陳慧慧等[17]提出研發(fā)投入是衡量公司研發(fā)能力的重要指標。王廣生[18]也提出研發(fā)能力對公司價值有著顯著的影響。此外,郭冰和劉坤[19]認為,股權(quán)結(jié)構(gòu)和激勵約束機制等非財務因素對投資價值創(chuàng)造具有重要作用。郝少田[20]、王莉莉等[21]認為資本結(jié)構(gòu)和股權(quán)結(jié)構(gòu)與公司價值之間存在顯著的關聯(lián)性。基于以上研究,本文也將從財務因素和非財務因素兩個維度對公司價值進行分析。
目前,隨機森林、神經(jīng)網(wǎng)絡和XGBoost等機器學習模型在學術(shù)研究領域應用十分廣泛。遲國泰和王珊珊[22]提出機器學習在處理復雜數(shù)據(jù)時表現(xiàn)出極高的效率,相較于傳統(tǒng)的線性模型,其在處理因子、非線性系統(tǒng)中展現(xiàn)出更強的擬合能力和泛化能力。吳先銘等[23]運用XGBoost模型分析了公司治理中創(chuàng)新投入與創(chuàng)新績效之間的關系。吳成英和馬東方[24]通過XGBoost模型提取并分析了金融客戶投資行為的特征因子。周清明和彭濤[25]基于隨機森林模型對企業(yè)長期價值進行分析。
綜上所述,國內(nèi)外學者對投資價值的影響因素大致分為財務、非財務因素兩種,其中,財務因素包括盈利、償債、營運、成長能力和資產(chǎn)結(jié)構(gòu)等指標,非財務因素包括公司規(guī)模、產(chǎn)品與技術(shù)、股權(quán)結(jié)構(gòu)、高管團隊特征等指標。考慮到北證50指數(shù)相較于成熟的主板市場具有一定的特殊性,某些特定因素如創(chuàng)新能力、成長能力、公司治理水平等因素對投資價值的增長具有顯著影響,這為相關研究提供了新的視角。通過對國內(nèi)外的研究成果進行系統(tǒng)梳理,本文將遵循學術(shù)主流,在前人文獻研究的基礎上,篩選并重新構(gòu)建全面影響投資價值的因素體系,同時考察財務指標與非財務指標對投資價值的影響,根據(jù)機器學習的特性,利用XGBoost和SHAP模型對公司投資價值進行全面分析。
2 基礎理論
2.1 XGBoost簡介
XGBoost(Extreme Gradient Boosting)是一種基于梯度提升決策樹(GBDT)的優(yōu)化算法,因其高性能和高效性而被廣泛用于機器學習競賽和實際應用中。其由Chen amp; Guestrin[26]于2014年開發(fā),是提升模型性能的有力工具。XGBoost的核心機制是梯度提升(Gradient Boosting),通過逐步構(gòu)建弱學習器(決策樹)提升整體模型的預測能力。以下是詳細的原理和公式說明:
2.1.1 模型表示
假設有一個訓練數(shù)據(jù)集xi,yini=1 ,其中xi是輸入特征,yi是目標值。模型的預測值表示為:yti︿=∑tk=1fkxi
其中,fk是第k棵決策樹,t是迭代次數(shù)。
2.1.2 損失函數(shù)
為了衡量預測值與真實值之間的差距,定義損失函數(shù)L:
Lyi︿,yi=∑ni=1lyi︿,yi
其中,l 是單個樣本的損失函數(shù)(如平方誤差為 lyi︿,yi=yi︿-yi2)
2.1.3 目標函數(shù)
XGBoost的目標函數(shù)包含兩部分,損失函數(shù)L和正則化項Ω。其用于控制模型的復雜度:
Obj=∑ni=1lyi︿,yi+∑tk=1Ωfk
其中,Ωfk 是第k棵樹的正則化項。
Ωf=γT+12λ∑Tj=1w2j
其中,T是樹的葉子節(jié)點數(shù),λ和γ是正則化參數(shù),wj是第j個個葉子節(jié)點的權(quán)重。
2.1.4 梯度提升
在第t次迭代中,添加一個新的決策樹ft來最小化目標函數(shù)。使用泰勒展開式對損失函數(shù)進行二階近似:
Obj(t)≈∑ni=1lyi,y(t-1)i︿+giftxi+12hiftxi2+Ωft
其中,gi和 hi分別是損失函數(shù)的一階和二階導數(shù):
gi=lyi,yi︿yi︿和hi=2lyi,yi︿y2i︿
2.1.5 樹結(jié)構(gòu)的優(yōu)化
通過優(yōu)化目標函數(shù),得到每棵樹的結(jié)構(gòu)和葉子節(jié)點的權(quán)重。目標函數(shù)的最優(yōu)分裂條件為:
Gain=12G2LHL+λ+G2RHR+λ-GL+GR2HL+HR+λ-γ
其中,GL、GR和HL、HR分別是左子節(jié)點和右子節(jié)點的梯度和。
在多因素模型中,XGBoost有以下優(yōu)勢:①處理高維數(shù)據(jù)。XGBoost通過列采樣和正則化技術(shù),能夠有效處理高維數(shù)據(jù),減少過擬合風險。②特征交互自動學習。決策樹天然能夠捕捉特征之間的交互作用,XGBoost通過集成多個決策樹進一步增強該能力。③魯棒性強。XGBoost對噪聲和缺失數(shù)據(jù)具有良好的魯棒性,能夠自動處理缺失值。④集成特性。通過集成多個弱學習器,XGBoost能夠綜合多個因素的影響,提高模型的泛化能力和預測準確性。⑤可解釋性。XGBoost提供特征重要性評分,使得模型的解釋性增強,便于識別重要驅(qū)動因素。XGBoost通過迭代訓練決策樹逐步減少預測誤差,并添加正則化項以防止過擬合。其高效性、靈活性和性能優(yōu)越性使其在廣泛的應用場景中表現(xiàn)出色,特別在多因素模型中,能夠有效處理高維數(shù)據(jù),捕捉特征交互作用,并提高模型的魯棒性和可解釋性。
2.2 評價指標
XGBoost既可以用于分類問題,也可以用于回歸問題。建立XGBoost模型對北證50指數(shù)上市公司投資價值進行分析時,以上市公司股票的年平均市值作為模型的輸出變量,因此采用XGBoost回歸模型的評價指標來評估模型的解釋效果。常見評價指標有:均方誤差 MSE、R平方值、相對均方誤差RMSE。
2.2.1 均方誤差
均方誤差(Mean Squared Error, MSE)是衡量預測值與實際值之間差異的常用指標。通過計算預測誤差的平方,并取平均值。MSE值越小,表示模型預測精度越高。
公式如下:
MSE=1n∑ni=1yi-yi︿2
其中,n是樣本數(shù)量,yi是實際值,yi︿是預測值。
2.2.2 R平方值
R平方值(R-squared Score, R2)是衡量模型對目標變量的解釋能力的指標。其取值范圍為0~1,值越接近1,表示模型對目標變量的解釋能力越強。R2也可以看作是解釋變量對因變量總變異的解釋比例。公式如下:
R2=1-∑ni=1yi-yi︿2∑ni=1yi-y-2
其中,yi是實際值,yi︿是預測值,y-是實際值的平均值。
2.2.3 相對均方誤差
相對均方誤差(Relative Mean Squared Error, Relative MSE)是均方誤差與目標變量的方差或平均值的平方的比值,用于衡量預測誤差相對于目標變量規(guī)模的大小。該指標可以標準化誤差,使不同數(shù)據(jù)集之間的誤差更具可比性。公式如下:
RMSE=1n∑ni=1yi-yi︿2y-2
其中,n是樣本數(shù)量,yi是實際值,yi︿是預測值,y-是實際值的平均值。
2.3 SHAP值的理論基礎
SHAP值是基于博弈論中的夏普利值(SHAPley value)概念發(fā)展而來。夏普利值用于分配合作博弈中的收益,以公平反映每位參與者對總收益的貢獻。在機器學習領域,這一概念被應用于解釋模型預測,其中特征被視為博弈中的參與者,預測結(jié)果被視為博弈中合作的收益,SHAP值表示每個特征對預測結(jié)果的貢獻程度。
SHAP具有以下優(yōu)點:①一致性。SHAP值保證了特征重要性的加和性質(zhì),即所有特征的SHAP值之和等于模型的輸出。②局部解釋。SHAP值為每個單獨的預測提供了特征貢獻的詳細解釋。③全局解釋。通過聚合多個實例SHAP值,能夠理解特征在整體數(shù)據(jù)集上的重要性。
3 研究設計
3.1 樣本選取及數(shù)據(jù)來源
本文旨在研究影響北證50指數(shù)上市公司投資價值的主要因素。因此,本文選取截至2023年12月已披露的2022年和2023年年報的249家北證A股上市公司作為研究對象,并提取其最新的財務數(shù)據(jù)。為提高模型準確性,同時選取573家科創(chuàng)板上市公司的財務數(shù)據(jù)擴充訓練集。本文所需的公司財務、非財務數(shù)據(jù)主要來源于Choice金融終端數(shù)據(jù)庫。在獲取數(shù)據(jù)后,為保證樣本的科學性與合理性,對數(shù)據(jù)進行數(shù)據(jù)缺失處理和Z-score標準化處理。數(shù)據(jù)處理及相關統(tǒng)計性分析使用Excel、Python軟件實現(xiàn)。
3.2 指標體系
如表1所示,經(jīng)過指標分析和選取,最終選取8個維度共計21個指標來全面衡量上市公司投資價值評價指標體系。
4 實證分析
4.1 XGBoost分析過程
4.1.1 XGBoost分析
為了保證XGBoost分析的有效性,需要嚴格區(qū)分訓練集和測試集,如未能明確劃分測試集和訓練集的數(shù)據(jù),可能會出現(xiàn)以下問題:
①過擬合(Overfitting)。XGBoost模型會過度“記憶”訓練數(shù)據(jù)中的特征和噪聲。當訓練數(shù)據(jù)包含測試數(shù)據(jù)時,模型可能會過度擬合這些測試數(shù)據(jù),從而在測試集上表現(xiàn)出色,但在實際應用或面對新數(shù)據(jù)時,其表現(xiàn)可能欠佳。
②模型性能評估失真。如測試數(shù)據(jù)出現(xiàn)在訓練集中,測試結(jié)果會顯得過于樂觀,因為模型在測試數(shù)據(jù)上已見過這些樣本。這將導致模型性能評估失真,無法反映模型對未見過數(shù)據(jù)的實際表現(xiàn)。
③無法真實評估模型的泛化能力。泛化能力是指模型在新的、未見過的數(shù)據(jù)上的表現(xiàn)。如測試數(shù)據(jù)被用于訓練,模型的泛化能力將無法得到真實評估,進而影響模型在實際應用中的可靠性和穩(wěn)定性。
為避免上述問題,應確保訓練數(shù)據(jù)和測試數(shù)據(jù)嚴格分離。本文將北證50指數(shù)上市公司2023年數(shù)據(jù)設為測試集,其余數(shù)據(jù)設為訓練集。由于本研究聚焦上市公司的投資價值,因此將上市公司的股價設為目標變量,為了防止股價波動對投資價值產(chǎn)生負面影響,以當年成交均價作為替代變量。經(jīng)過未經(jīng)調(diào)參的XGBoost模型訓練后,在北證50指數(shù)的訓練樣本上驗證模型效果,如表2所示,其中的MSE、RMSE的值較大,而R平方值相對較小,表明該模型不能很好地解釋北證50指數(shù)上市公司投資價值,因此需要對模型進行優(yōu)化。
4.1.2 XGBoost模型優(yōu)化
為了提高模型對北證50指數(shù)上市公司投資價值的解釋效果,機器學習模型一般會在初次訓練模型的基礎上進行參數(shù)調(diào)優(yōu)。具體步驟為:首先,加載并預處理數(shù)據(jù),包括標準化處理,隨后定義XGBoost回歸模型和參數(shù)搜索網(wǎng)格。其次,通過初步訓練模型獲得特征重要性,并按重要性排序。在一個循環(huán)中逐步增加使用的特征數(shù)量,對每個特征組合使用GridSearchCV進行超參數(shù)調(diào)優(yōu),記錄其最佳參數(shù)和模型性能指標。最后,從記錄結(jié)果中選擇R2評分最高的特征數(shù)量及對應的最佳超參數(shù)組合,使用這些最優(yōu)參數(shù)和特征數(shù)量重新訓練最終模型,并在測試集上評估模型的均方誤差(MSE)、R2評分和相對MSE,以驗證模型優(yōu)化的效果。通過逐步增加特征數(shù)量和超參數(shù)調(diào)優(yōu),提升模型的預測性能。本文的參數(shù)搜索網(wǎng)格為:樹的數(shù)量 (n_estimators):100, 200, 300, 500;最大深度 (max_depth):3, 5, 7, 9;學習率 (learning_rate):0.01, 0.1, 0.2;子采樣比例 (subsample):0.6, 0.8, 1.0;特征采樣比例 (colsample_bytree):0.6, 0.8, 1.0。
模型優(yōu)化之后所選取的參數(shù)值和模型性能結(jié)果如表3、表4所示。
由表4結(jié)果可知,模型在經(jīng)過參數(shù)優(yōu)化和最優(yōu)特征值選取后,模型的解釋能力得到很大提升。R平方值提升明顯,為后續(xù)分析提供了有力支持。
如表5、圖1所示,基于XGBoost模型的特征重要性排序結(jié)果表明,在對北證50指數(shù)上市公司投資價值的分析中,對于投資價值影響較大的因素包括資產(chǎn)總計X20、成本費用利潤率X3、研發(fā)人員數(shù)量占比X17等。在前10特征值中,財務指標占6個,其中盈利能力指標3個,償債能力指標1個,發(fā)展能力指標1個,資本結(jié)構(gòu)指標1個;非財務指標有4個,其中研發(fā)能力指標有2個,公司規(guī)模指標1個,股權(quán)結(jié)構(gòu)指標1個。資產(chǎn)總計X20在投資價值影響因素中的重要性占比為17.659%,遠高于其他指標,表明其在北證50指數(shù)上市公司的投資價值中具有重要作用。成本費用利潤率X3重要性占比為13.643%,表明盈利能力在投資價值影響因素中的重要地位。研發(fā)人員數(shù)量占比X17的重要性占比為6.671%,雖低于前兩者,但在整體排序中位列第三,表明研發(fā)能力指標在北證50指數(shù)上市公司的投資價值起到了顯著作用,也反映了北證50指數(shù)上市公司的定位。
4.2 SHAP分析
4.2.1 北證50指數(shù)上市公司的SHAP整體性分析
為更好地解釋各個指標對投資價值的影響機制,引入SHAP分析以進一步闡釋XGBoost模式。SHAP分析既可以對XGBoost模型的效果整體進行解釋,也可以對單個樣本進行局部解釋。
如圖2所示,右側(cè)縱軸顏色表示特征值的大小,灰度越淺,表明特征值越小;顏色灰度越深,表示特征值越大。左側(cè)縱軸表示特征值重要性排序,橫軸表示SHAP值,SHAP值大于0表明對投資價值有正向影響,小于0表示對投資價值有負向影響。
SHAP值基于博弈論中的SHAPley值,為每個特征分配一個“公平”的貢獻值。其考慮了所有可能的特征組合對預測結(jié)果的影響,并計算每個特征在這些組合的邊際貢獻。由于SHAP值的計算方法與XGBoost計算特征值重要性的算法不同,因此在特征值重要性排序時可能會出現(xiàn)不同的結(jié)果。
從SHAP特征值重要性排序中可以看出,資產(chǎn)總計X20位居第一。當X20取值較低時,對投資價值產(chǎn)生負向影響;當X20取值較高時,對投資價值產(chǎn)生正向影響。可以得出在北證50指數(shù)上市公司中,公司擁有較高的資產(chǎn)總計時,對其投資價值具有積極影響。這表明投資者在對北證50指數(shù)上市公司進行投資決策時,認為較高的資產(chǎn)總計更值得關注,而較低的資產(chǎn)總計則可能降低投資者投資預期。
在研發(fā)人員數(shù)量占比X17的SHAP分析中,X17取值較高時,對投資價值產(chǎn)生正向影響;取值較低時,則產(chǎn)生負向影響;當X17值為中間值時,SHAP值集中在0處,表明其對投資價值的影響較為溫和。同為研發(fā)能力指標的研發(fā)支出總額占營業(yè)收入比例X16也表現(xiàn)出相似的影響機制。這表明在北證50指數(shù)上市公司中,研發(fā)人員占比越高,意味著其具有更高的科技屬性,從而更有可能獲得較高的投資價值。
作為盈利能力指標的凈資產(chǎn)收益率roeX1和成本費用利潤率X3的SHAP分析表現(xiàn)出高度相似性。當X1和X3取值較高時,對投資價值產(chǎn)生正向影響;取值較低或趨于均值時,則對投資價值產(chǎn)生一定的負面影響。這表明北證50指數(shù)上市公司中盈利能力越強,其投資價值越具有競爭力。
總資產(chǎn)同比增長率X12在SHAP分析表明,該指標在大多數(shù)情況下對投資價值產(chǎn)生負向影響,僅在取值極高時才表現(xiàn)出一定的正向影響。
4.2.2 北證50指數(shù)上市公司的SHAP局部性分析
為更深入地理解資產(chǎn)總計X20和研發(fā)人員數(shù)量占比X17的作用機制,利用SHAP Dependence Plot(特征依賴圖)分析進行進一步研究。圖3、圖4分別是研發(fā)人員數(shù)量占比X17和資產(chǎn)總計X20的特征依賴圖,用于分析這兩個特征變量對投資價值的影響。同時,也顯示凈資產(chǎn)收益率X1與這兩個特征變量的交互作用。
如圖3所示,縱軸表示X17的SHAP值,該值表示對投資價值預測結(jié)果的貢獻程度;橫軸表示X17的取值范圍;點的顏色代表另一個特征X1的取值水平,灰色度的由淺到深表示X1取值由小到大。整體來看,隨著X17增加,SHAP值也呈現(xiàn)上升趨勢,這表明X17對模型輸出的影響是正向的。具體而言,當X17取值較低時,SHAP值呈負值,表明X17對模型輸出的貢獻是負面的。當X17取值較高時,SHAP值呈正值,表明X17對模型輸出的貢獻是正面的。通過分析X17與X1的交互效應可知:當X17取值較低時,點的顏色較為混雜,表明X1的取值對SHAP值的影響不顯著。當X17取值較高時,X1的取值對SHAP值的影響則更為明顯,特別是X1取值較高時,對應的SHAP值也較高。
如圖4所示,縱軸表示X20的SHAP值,該值表示對投資價值預測結(jié)果的貢獻程度;橫軸表示X20的取值范圍。整體來看,X20的SHAP值分布更為分散,未呈現(xiàn)出明顯的線性關系。具體而言,當X20取值較低時,SHAP值在負值范圍內(nèi)波動較大,表明X20對模型輸出的貢獻是負面的;而隨著X20取值的增加,SHAP值也在增加,但波動較大,缺乏規(guī)律性。通過分析X20與X1的交互效應可知:當X20取值較低時,X1對SHAP值的影響較為顯著,且取值較低的X1對應較低的SHAP值;當X20取值增加時,取值較高的X1對應的SHAP值也較高,這表明X1和X20之間存在一定的交互效應。
通過對這兩張?zhí)卣饕蕾噲D的分析,可以得出以下結(jié)論:X17和X20均對模型輸出具有顯著影響,但其影響方式存在差異。其中X17對模型輸出的影響呈現(xiàn)出較為明顯的線性特征,即隨著X17取值增加,SHAP值也增加。而X20對模型輸出的影響則較為復雜,SHAP值波動較大,缺乏明顯規(guī)律。此外,X1作為交互特征,對X17和X20的SHAP值均有影響,尤其在X17和X20取值較高時,X1的影響更為顯著。
為了更具體地了解各個特征變量對投資價值的影響,本研究引入SHAP Force Plot分析。在該分析中,每個特征對預測結(jié)果的貢獻能夠通過其顏色和箭頭方向進行解釋,右指向箭頭表示該特征將預測值有正向作用(即向上推),左指向箭頭表示該特征將預測值有負向作用(即向下推)。為直觀展示特征變量在具體數(shù)據(jù)中的作用,選取測試集前兩條數(shù)據(jù)進行分析。
如圖5所示,在第一個力量圖中,X10和X16對投資價值具有正向貢獻,X20、X1、X12則表現(xiàn)出負向貢獻。在第二個力量圖中,特征貢獻X17的值為0.491 8,對預測結(jié)果有正貢獻。X2和X16的值分別為0.028 7和-0.027 65,同樣對預測值有正貢獻。X15的值為2.234,使預測值進一步增加。X11、X12、X20特征的值為-0.028 82、-0.286、-0.212,均對預測值有負貢獻,使預測值逐步減少。最終,所有特征貢獻的總和等于模型輸出值和基值之間的差異。這一過程可以通過從左到右的箭頭軌跡在視覺上清晰呈現(xiàn)。
圖5有助于理解模型的決策過程,并揭示各個特征對預測結(jié)果的重要性。通過分析這些特征貢獻,可以進一步優(yōu)化模型,改進特征選擇,并為模型的預測結(jié)果提供更具說服力的解釋。
5 結(jié)論與建議
5.1 研究結(jié)論
本文主要在于研究北證50指數(shù)上市公司投資價值影響因素,并探討主要影響因素的作用機制。通過構(gòu)建一種基于特征篩選、XGBoost模型和SHAP解釋方法的機器學習模型,本文對北證50指數(shù)上市公司投資價值進行了實證分析,得出以下結(jié)論:XGBoost模型進行初始分析以及對模型參數(shù)進行優(yōu)化分析時,XGBoost模型在MSE、R平方值、
RMSE3項性能指標上均表現(xiàn)良好,能夠很好地解釋北證50指數(shù)上市公司投資價值。從影響因素分析來看, 資產(chǎn)組總計和研發(fā)能力是最重要的兩個指標。首先,資產(chǎn)總計影響作用最大,公司擁有較高的資產(chǎn)總計時,對其投資價值有積極影響。其次,研發(fā)能力作用也很明顯,研發(fā)支出總額占營業(yè)收入比例和研發(fā)人員占比越高,表明其擁有更高的科技屬性,更有可能取得較高的投資價值。最后,資產(chǎn)總計和研發(fā)能力對模型輸出都有顯著影響,但影響方式不同。其中研發(fā)能力對模型輸出的影響較為線性,隨著研發(fā)能力影響因素數(shù)值的增加,SHAP值增加,對投資價值積極作用增加。但是資產(chǎn)總計對模型輸出的影響較為復雜,SHAP值波動較大,缺乏明顯規(guī)律。
5.2 投資價值建議
根據(jù)本文的實證結(jié)果,北證50指數(shù)上市公司中,公司的核心資產(chǎn)和科研能力是提升公司投資價值的重要指標。首先,資產(chǎn)規(guī)模較大的公司往往具備較強的財務穩(wěn)健性,能在經(jīng)濟波動中保持穩(wěn)定的經(jīng)營,特別是初創(chuàng)的中小企業(yè),提高資產(chǎn)規(guī)模能夠降低運營風險。因此,公司應保證有高質(zhì)量的核心資產(chǎn)來確保自身投資價值有穩(wěn)固的實物資產(chǎn)支撐。其次,較高的研發(fā)投入占比的公司可能在短期內(nèi)難以產(chǎn)生明顯的收益,但是持續(xù)的研發(fā)投入是公司未來持續(xù)發(fā)展的基礎,這類公司在行業(yè)變革和技術(shù)升級中具備較大優(yōu)勢,未來成長性較高。明確“專精特新”價值定位,加大研發(fā)人員占比和研發(fā)投入的經(jīng)營決策有助于提升自身科研能力和創(chuàng)新能力,這是公司投資價值長期發(fā)展的核心動力。投資者在對北證50指數(shù)上市公司進行投資時,由于北交所上市公司具有“專精特新”的特點,區(qū)別于傳統(tǒng)的上市公司,所以應該重點關注公司的資產(chǎn)總計和研發(fā)能力表現(xiàn)。首先,公司資產(chǎn)總計高于平均市場水平的往往具有較高的投資價值,核心資產(chǎn)支撐投資價值不會偏離其內(nèi)在價值,具有較好的投資機會。其次,研發(fā)人員占比和研發(fā)投入占營業(yè)收入占比高于市場平均水平的企業(yè)具有較強的研發(fā)能力,研發(fā)能力表現(xiàn)強說明在“專精特新”的企業(yè)中有較強的競爭力,公司投資價值在短期和長期都具有較高的潛力。最后,資產(chǎn)規(guī)模大和研發(fā)投入高的公司在規(guī)模上處于優(yōu)勢,并且有能力在未來實現(xiàn)技術(shù)突破,再結(jié)合盈利能力、償債能力、股權(quán)結(jié)構(gòu)等財務指標和非財務指標進行綜合分析,是長期投資的較優(yōu)選擇。
參考文獻參考文獻:
[1] 張峰,王晨悅,邢秀芹,等.北交所助力中小企業(yè)成長的實證研究——基于投資價值角度[J].北京聯(lián)合大學學報(人文社會科學版),2023,21(4):83-94.
[2] 田利輝.北交所對中國資本市場創(chuàng)新發(fā)展的影響分析[J].人民論壇,2022(8):62-65.
[3] 張曉燕,殷子涵,王藝熹.北京證券交易所新規(guī)對中小企業(yè)融資影響分析[J].多層次資本市場研究,2021(4):12-20.
[4] 林麗娟,張宗新.科創(chuàng)板、創(chuàng)業(yè)板和北交所錯位協(xié)同進階式支持新經(jīng)濟[J].財會月刊,2023,44(6):124-129.
[5] 郝臣.北交所上市公司治理狀況解析[J].審計觀察,2022(4):18-23
[6] 喬永遠,孔祥,陳敬.北交所與多層次資本市場建設[J].中國金融,2022(1):79-80.
[7] KRISTI N M, YANTO H. The effect of financial and non-financial factors on firm value[J]. Accounting Analysis Journal, 2020, 9(2): 131-137.
[8] TARMIDI D, SARI P N, HANDAYANI R. Tax avoidance: impact of financial and non-financial factors[J]. International Journal of Academic Research in Accounting, Finance and Management Sciences, 2020, 10(2): 1-8.
[9] RESCHIWATI R, SYAHDINA A, HANDAYANI S. Effect of liquidity, profitability, and size of companies on firm value[J]. Utopia y Praxis Latinoamericana, 2020, 25(6): 325-332.
[10] MARKONAH M, SALIM A, FRANCISKA J. Effect of profitability, leverage, and liquidity to the firm value[J]. Dinasti International Journal of Economics, Finance amp; Accounting, 2020, 1(1): 83-94.
[11] RAHMAN M M, HOWLADER M S. The impact of research and development expenditure on firm performance and firm value: evidence from a South Asian emerging economy[J]. Journal of Applied Accounting Research, 2022, 23(4): 825-845.
[12] SAFITRI R, LIDYAH R, RACHMANIA R. Profitability, good corporate governance, dividend policy, and firm value at ISSI[J]. Etikonomo,2022, 21(1): 139-152.
[13] 呂梅萌,楊銀娥.我國獨角獸企業(yè)價值評估影響因素分析[J].中國資產(chǎn)評估,2019(2):27-34
[14] 邱玉,姚爽,周方,等.關系資本、動態(tài)能力與中小企業(yè)成長關系研究綜述[J].科技創(chuàng)業(yè)月刊,2022,35(9):155-158.
[15] 王波,楊茂佳.ESG表現(xiàn)對企業(yè)價值的影響機制研究——來自我國A股上市公司的經(jīng)驗證據(jù)[J].軟科學,2022,36(6):78-84.
[16] 王曉紅,欒翔宇,張少鵬.企業(yè)研發(fā)投入、ESG表現(xiàn)與市場價值——企業(yè)數(shù)字化水平的調(diào)節(jié)效應[J].科學學研究,2023,41(5):896-904,915.
[17] 陳慧慧,王怡皓,陶勁松,等.武漢中小型高新技術(shù)企業(yè)“專精特新”發(fā)展探究[J].科技創(chuàng)業(yè)月刊,2022,35(7):92-95.
[18] 王廣生.金融科技企業(yè)價值影響因素研究——基于滬深上市公司的模糊集定性比較分析[J].金融發(fā)展研究,2022(5):59-63.
[19] 郭冰,劉坤.股權(quán)結(jié)構(gòu)、激勵約束機制與企業(yè)效率——基于A股國有控股上市公司的實證檢驗[J].經(jīng)濟問題,2022(3):53-61,115.
[20] 郝少田.資本結(jié)構(gòu)、股權(quán)結(jié)構(gòu)與公司價值的關系[J].商場現(xiàn)代化,2021(21):86-88.
[21] 王莉莉,韓道琴,張宸愷.中小板公司股權(quán)集中度、研發(fā)投入與公司績效[J].會計之友,2021(3):117-123.
[22] 遲國泰,王珊珊.基于XGBoost的中國上市公司違約風險預測模型[J].系統(tǒng)管理學報,2024,33(3):735-754.
[23] 吳先銘,劉可新,翟育明.CEO個人特征、創(chuàng)新投入與創(chuàng)新績效的關系——基于XGBoost樹模型的經(jīng)驗證據(jù)[J].上海對外經(jīng)貿(mào)大學學報,2023,30(1):81-93.
[24] 吳成英,馬東方.基于改進XGBoost的金融客戶投資行為特征選擇方法[J].計算機應用,2024,44(S1):330-336.
[25] 周清明,彭濤.改進隨機森林的企業(yè)長期價值影響因素研究[J].長春大學學報,2023,33(11):29-33.
[26] CHEN T, GUESTRIN C. Xgboost: a scalable tree boosting system[C]//Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining. NY: Association for Computing Machinery, 2016: 785-794.
責任編輯(責任編輯:周 媛)