胡傳勝 周志國



摘要:目前對企業進行量化評估的研究主要基于企業特征維度進行分析。通過對企業財務、營運等特征進行建模,利用各種算法進行統計分析,從而達到對企業量化評估的目的。這些研究大都基于全量樣本數據進行評估,但這種做法忽略了生命周期對企業的影響。在不同生命周期階段,企業具有不同的財務、營運等特征數據,將這些企業進行無差別評估,會降低企業量化評估的準確性和科學性。基于此,文章推出一種基于生命周期的企業特征量化評估模型,首先對企業的生命周期進行分類,然后分別對不同生命周期階段的企業進行特征量化評估的方法。這種方法解決了傳統評估方法對不同生命周期階段內企業由于實際業務數據差異而帶來的影響和偏差。
關鍵詞:企業生命周期;企業特征量化評估;XGBoost算法;TOPSIS算法
中圖分類號:TP181? ? ? 文獻標識碼:A
文章編號:1009-3044(2024)09-0086-03
開放科學(資源服務)標識碼(OSID)
0 引言
企業生命周期理論廣泛應用于企業管理和規劃領域,它描述了企業在不同發展階段所面臨的挑戰和機遇。在當今競爭激烈的市場環境中,正確評估企業現狀、制定匹配決策方案,對企業的成功發展至關重要。然而,目前現有的企業評估模型大都忽視企業生命周期因素的影響,導致評估結果的科學性和準確性受到一定的限制[1]。
本研究旨在研發一種基于生命周期[2]的企業特征量化評估模型[3],該模型將通過結合生命周期理論和特征量化評估方法,首先對企業進行生命周期分類,然后利用特征量化評估模型對企業進行評估分類,實現精準、全面的分析企業現狀,為企業管理者和決策者提供更具針對性的管理建議和決策支持。
本方案利用大數據AI算法,收集并分析企業全量數據,構建基于生命周期的企業特征量化評估模型。本方案采用XGBoost算法構建企業生命周期模型,結合熵權法和TOPSIS算法實現對企業的量化評估。此外,本文還結合實例,驗證模型在實踐中的準確性和有效性。
本研究的創新之處在于將企業生命周期理論與企業評估方法相結合,提供了一種更加全面、準確的企業評估模型。該模型不僅可以幫助企業管理者深入了解企業現狀,還可以為決策者提供具有針對性的決策支持。此外,該模型還具有廣泛的應用價值,如企業投融資管理、市場決策分析等。
1 基于生命周期的企業特征量化評估模型
生命周期理論認為,生命周期貫穿于企業生產經營全過程。研究表明企業生命周期主要由初創期、成長期、成熟期和衰退期四個階段組成,每個階段都有其獨特的特征和需求。本文從模型特征篩選、生命周期分類、特征量化評估3個方面展開企業經營特征評估,提出了一種基于企業生命周期的特征量化評估模型,將企業先按生命周期分類,規避由特征數據全距過大而引起的差異,再利用特征量化評估模型對企業進行評估,以提升企業評估算法的準確性和科學性,為管理者制定精準決策服務方案,提供堅強數據支撐。
1.1 模型特征篩選
評估模型涉及生命周期分類與企業量化評估兩部分,模型數據來源包括工商、司法、電力等多類數據源,根據當前主流的生命周期與特征量化評估研究成果,特征集選取主要從企業財務、信用等幾個方面進行選取。模型特征經過數據探查處理后,最終形成模型特征集23個,如表1所示。
1.2 算法原理
分類模型中常用的算法有隨機森林、SVM、邏輯回歸、XGBoost等算法,本文中企業生命周期模型采用XGBoost算法進行分類預測,同時將隨機森林、SVM兩種算法與XGBoost算法的預測分類結果進行比較。XGBoost算法是一種基于Boosting的集成學習模型,由多個弱學習器集合而成一個強學習器,通過對目標函數進行二階泰勒展開,使模型結果更加逼近真實情況,在分類與回歸問題上較其他型模型具有更高的精度。
XGBoost模型表達式如公式(1)所示:
[yi=k=1Kfk(xi),fk∈F ]? ? ? ? (1)
上式中[yi]表示預測值;K表示回歸樹數量;xi表示第i個輸入的特征向量;F是回歸樹集合空間;fk是集合R上的一個函數,表示基學習器的輸出。
對yi進行k次疊加計算后,得到XGBoost的目標函數如公式(2)所示:
[obj(t)=i=1nl(yi,yi(t)) + i=1tΩ(fi)]
[=i=1nl(yi,yi(t-1)+ft(xi))+Ω(ft)]+constant? ? (2)
上式中[l(yi,yi(t-1)+ft(xi))]是損失函數,用來計算真實值與預測值之間的誤差;[Ω(ft)]是正則化項,constant是常數項。
對上述公式進行二階泰勒式展開并簡化計算,最終得到如公式(3)所示:
[obj*=-12j=1TG2jHj+λ+γT]? ? ? ?(3)
上式中T為 k 次迭代后樹中葉子結點個數;Gj表示當前葉子結點所有樣本一階導數和;Hj表示當前樣本所有二階導數和;γ為懲罰函數系數;λ為正則化懲罰項系數。
1.3 企業生命周期分類
根據生命周期理論,雖然企業在不同生命周期表現出來不同的特征,但在相同周期內具有某些共性。因此利用這些共性可以實現企業生命周期分類。研究表明,初創期企業具有企業市場占比小、成本高、利潤低、現金流轉少、組織結構簡單等特點;成長期企業具有融資能力和償債能力較強、營收和利潤增速快等特點;成熟期具有市場占有率穩定、營收和利潤均穩定、現金流較為充裕、很強的償債能力、組織結構復雜等特點;衰退期具有營收和利潤均逐年下降、企業市場份額占比越來越小、組織結構混亂等特點。
企業生命周期模型采用XGBoost算法,模型特征集涉及財務、信用等幾個方面。模型數據經過ETL處理,去除異常值與缺失值過多的企業。為了提高模型的訓練效率和泛化能力,本文對數據進行標準化處理,使其近似滿足0-1分布。XGBoost 模型訓練時,采用gridsearch網格搜索法進行參數粗調,利用Stratified KFold進行10折交叉驗證,減少模型評估誤差,提高模型評估的準確性和泛化能力。經過粗調后,采用控制變量法精調模型,得到最佳模型參數。
XGBoost模型評估標準采用F1值,F1值由準確率(Precision) 和召回率(Recall) 調合平均組成。F1的公式如公式(4)所示:
[F1=2×Precision×RecalPrecision+Recal]? ? ? ? ?(4)
為了驗證模型的準確性,預測結果與SVM算法和隨機森林算法進行實驗對比,從表2實驗結果可以看出本文提出的XGBoost預測模型F1值為0.9618,與SVM和隨機森林相比,整體評估預測結果均有顯著提升,表明XGBoost模型算法適用于本數據集。
1.4 企業特征量化評估
企業特征量化評估模型[4]通過量化企業特征對企業進行評估,能夠全面、客觀了解企業實際情況,指導管理者制定準確的決策分析方案,幫助決策者策劃清晰可持續差異化服務決策。本文采用熵權法結合TOPSIS算法對企業進行評估。熵權法不需要對指標進行主觀賦值,具有計算簡單、易于實現等優點。TOPSIS算法能夠充分利用原始數據信息,對企業經營現狀進行全面評估,最大程度避免人為主觀性,精準刻畫特征指標。熵權法負責計算特征權重系數,TOPSIS算法負責計算企業特征量化綜合評估得分。模型特征集涵蓋財務、信用等幾個方面。
由于企業特征數據存在分布、尺度方面的差異,所以模型數據需要進行同向歸一化處理,本文采用最大最小歸一化方法進行處理。根據數據特征,對于負向數據,如違法、失信、資產負債率等,采用如公式(5)方法進行處理:
[xi=max(xi) - ximax(xi)-min(xi)]? ? ? (5)
對于正向數據,如銷售利潤率、總資產收益率、專利數量等,采用如公式(6)方法進行處理:
[xij=xij-min(xij)max(xij)-min(xij)]? ? ? ?(6)
同向歸一化后,利用熵權法計算模型中每個特征所占樣本的比重[Pi],如公式(7)所示:
[Pij=Xiji=1mXij]? ? (7)
然后利用比重[Pij]計算第j個特征的熵值[E][j]和特征差異系數[Gj],如公式(8)和(9)所示:
[Ej=1lnmi=1mPijlnPij]? ? ? ?(8)
[Gj=1 - Ej? ]? ? ?(9)
上式中m為樣本總數。
根據特征差異系數[Gj],最終得出每個特征的權重系數,如公式(10)所示:
[Wj=Gji=1nGj]? ? ? ? (10)
TOPSIS算法中,同樣需要對數據進行同向化與歸一化處理,采用方法同上述熵權法中最大最小化公式。然后構造企業的n維特征空間正、負理想解(各指標的最優解(z+)和最劣解(z-)),如公式(11)和(12)所示:
[? ?z+ = max{z11,z21,...,zn1 },max{z12,z22,...,zn2 },...,]
[max{z1m,z2m,...,znm } =Z+1,Z+2,...,Z+m]? ? ? ?(11)
[z- =min{z11,z21,...,zn1 },min{z12,z22,...,zn2 },...,]
[min{z1m,z2m,...,znm }=Z-1,Z-2,...,Z-m]? ? ? ?(12)
在得到企業特征最優解和最劣解后,計算每個企業到正負理想解的距離,如公式(13)所示:
[D+i=j=1mωj(Z+j-zij)2,? D-i=j=1mωj(Z-j-zij)2? ]? ?(13)
到此可以結合[ D+i]和[D-i]計算每個企業的綜合得分,利用公式(14)對企業進行評估,判定其綜合優劣。
[Ci = D-iD+i+D-i]? ? ? (14)
1.5 模型架構
基于生命周期的企業特征量化模型包括數據源、數據存儲、模型計算和模型輸出四個部分,邏輯架構如圖1所示:
數據源提供模型所需的各種數據,如工商、稅務、司法、電力等數據,通過數據接入層傳輸數據。數據存儲層處理模型原始數據,生成入模特征數據。其中,ETL實現多數據融合、異常值處理等功能。模型計算層中,企業生命周期模型實現企業生命周期計算與分類;企業特征量化模型中,熵權法計算模型特征權重,TOPSIS算法負責實現量化、計算各個生命周期內的企業評估得分。模型輸出包括企業生命周期分類、綜合量化評估得分和排名、綜合評估報告等相關內容組成。
2 應用案例
基于生命周期的企業特征量化評估模型在某大型國企集團內部進行應用。模型所需數據由企業內部數據和外部數據組成,形成基本條件、科研能力、信用情況、財務狀況4個維度,共計23個模型特征。數據經過企業生命周期模型預測后,待評估企業中,初創期共有19家,成長期共有564家,成熟期共有606家,衰退期共有86家。分別對這四類企業進行評估預測,最終得出這四類企業的綜合得分。企業綜合評估后,需要對企業進行數據融合定位,由于預測企業屬于同一個集團,數據來源一致,評估方法一致,所以可以直接利用企業綜合得分進行統一排序,最終得到所有企業的綜合評估排名。
本模型在集團內部對企業進行量化評估驗證,評估結果得到集團業務人員的高度認可,一致表明基于生命周期的企業特征量化模型評估結果真實可靠,符合集團內部企業實際分布情況,模型評估準確度得到驗證。
3 結論
本文提出一種基于生命周期的企業特征量化的評估模型,旨在減少由于生命周期不同而導致企業在財務、科研等方面特征數據差異而帶來的評估誤差,提高企業評估的準確性和科學性。通過模型的應用與實踐,驗證了模型的正確性和有效性,為企業評估模型方面的研究提出了一種切實可行的方案。
另外本文創新性地將電力數據融入企業特征量化評估模型中,增加新的特征維度,使模型預測準確度得到了提升。本模型可廣泛應用于企業投融資管理、差異化服務定制、市場決策分析等業務場景,為提升企業整體競爭力提供底層數據支撐。
參考文獻:
[1] 王士偉.中小型科技創新企業生命周期各階段的特征及融資政策分析[J].科技進步與對策,2011,28(10):88-91.
[2] 陳志存.基于生命周期理論的企業財務戰略[J].納稅,2023,17(23):79-81.
[3] 奚夢緣.中小企業信用指標體系構建及評估模型的最優化[D].南京:南京大學,2018.
[4] 朱宗元,蘇為華,王秋霞.新三板融資環境下中小企業信用風險評估[J].統計與信息論壇,2018,33(10):107-113.
【通聯編輯:王 力】