江乾坤,王成哲
(浙江理工大學 經濟管理學院,杭州 310018)
隨著全球數字經濟的強勁發展和“數字絲綢之路”倡議的深入推進,以字節跳動、騰訊、阿里巴巴為首的我國互聯網企業相繼扛起新興技術產業“出海”的大旗,迅速崛起并在海外并購領域嶄露頭角。然而,互聯網行業作為新興行業,爆發式成長的背后伴隨著高風險。由于互聯網企業特有的輕資產結構,資金鏈緊張成為常態,且其融資方式主要傾向于風險投資和私募,這顯著地增加了運營成本和流動性方面的風險,從而引發財務危機。另外,互聯網行業的競爭激烈,在“贏者通吃”的市場上只要技術略微突破便可能吸引大批客戶,相反技術落后企業便很快會被市場所遺棄(蔣殿春和唐浩丹,2021)。在這種激烈的市場競爭下,互聯網企業需要不斷創新和提供差異化服務才能生存下來。此外,隨著國內人口紅利見頂、內需供給增長變緩、智能手機銷量下滑,國內互聯網各領域增速在逐漸回落,為了追求業務的增長,互聯網公司必須要拓展新的市場,“走出去”成為互聯網企業的必然選擇(郭全中和李祖岳,2023)。然而,在追隨互聯網巨頭“走出去”的過程中,許多新興互聯網企業盲目擴張、過度投資而忽視風險管理,導致內部控制和抗風險能力滯后于擴張速度,造成運營混亂,從而引發財務危機。創造奇跡的同時也暗藏阻礙與風險,例如,暴風影音因為盲目并購英國體育媒體服務公司MPS(MP&Silva)而破產退市,聯絡互動因為收購美國電商公司Newegg 而一度巨虧被特別處理(ST)等。錯綜復雜的風險因素交織作用于互聯網企業海外并購的各個流程,最終效果會以財務指標予以呈現。互聯網企業正掀起新一輪國際化投資浪潮,如何應對錯綜復雜的全球投資環境以避免財務危機?如何利用大數據、云計算、人工智能等新技術進行國際化投資風險預警?如何提升互聯網企業跨國并購風險管控能力?因此,有效識別我國互聯網企業海外并購財務風險因子,進而制定相應的財務風險預警策略勢在必行。
海外并購風險的傳統預警手段主要是企業或專業機構的盡職調查、各類機構發布國家投資風險評估報告等單指標、定性、靜態模式,在“世界是平的”互聯互通時代,這已不能滿足風險管控實時決策的需要。本文借助大數據技術開發多指標、定量、動態模型,克服模型設定的片面性和簡單性,突破自選擇問題,克服了數據不完全性、主觀性和時滯性缺陷。
目前財務風險預警模型研究軌跡可分為三個代際:第一代為單一變量分析法;第二代為多元變量和條件概率分析法,如Z 分值、邏輯回歸模型等;第三代為人工智能分析法,如聚類、隨機森林、BP 神經網絡、支持向量機等(肖毅等,2020)。隨著大數據技術的日漸成熟,如何構建機器學習等智能財務風險預警模型正成為新的研究方向。對于財務風險預警因子,現有研究大多局限于戰略選擇風險、政治風險、融資風險等單一風險或幾種風險對互聯網企業海外并購的影響,如何引入股吧評論等非財務信息值得期待。
雖然機器學習已廣泛運用于風險預警模型構建,但多基于基學習器的單一分類算法和預測,且在實際中仍會遇到諸多難題(楊劍鋒等,2019)。本文的貢獻在于:首先,已有研究大多集中于“重資產”類的制造型企業海外并購,本文研究對象是聚焦“輕資產”類的互聯網企業海外并購,拓展了海外并購風險預警研究;其次,通過大數據證實Stacking 集成學習模型相比隨機森林(RF)等其他機器學習模型的財務風險預警效果更好;第三,通過Stacking 集成學習模型發現,運營能力等傳統型財務指標依然是互聯網企業海外并購風險預警因子的首選指標,但股吧評論等創新型非財務指標也具有重要的預警價值。
現有財務風險預警模型的構建可概括為兩個維度(肖毅等,2020):一是預測方法經歷了從單一傳統的統計學方法到基于人工智能的機器學習方法的演化;二是風險因子從固定財務比率到通過數據挖掘方法進行數據篩選以選擇財務比率,再到引入非財務因素。本文將從智能財務預警模型和互聯網企業海外并購風險因子兩方面進行梳理。
現有智能財務風險預警模型可總結為:①單分類器模型。包括Z 分值、Logit、Probit 及累積求和模型等統計分析類;人工神經網絡、遺傳算法、粗糙集、決策樹、支持向量機等人工智能類。②混合單分類器。將兩個模型串聯混合或融合兩三種單分類器模型來產生一種新的預測模型。③多分類器組合模型,包括單分類器的并聯組合和串聯組合(滕曉東和宋國榮,2021)。不過,上述智能財務風險預警研究存在諸多改進之處:一是單分類器模型研究尚不深入;二是多分類器組合模型研究較少;三是忽視專家經驗知識和非財務信息對財務風險預警的重要作用;四是針對中國市場開展實證研究的經驗證據還不夠充分。
當前機器學習算法主要分三類:一是基本分類算法,典型代表是支持向量機(SVM)、邏輯回歸(LR)、樸素貝葉斯(Bayes)、鄰近算法(KNN)和決策樹(DT);二是神經網絡算法(ANN),典型代表是BP 神經網絡模型和多層感知機(MLP);三是集成分類算法,典型代表是隨機森林(RF)和極端梯度提升(XGBoost)。其中,Gini系數(CART)等決策樹算法模型往往會出現過擬合,ANN 模型只能高度匹配局部經濟狀況,模型的大局匹配能力不高,而集成分類算法最為常用。集成學習通過構建并組合優化多個模型來完成學習任務,雖然其得到的也是“弱學習器”,但優點在于可以產生多種“弱學習器”并將它們集成為一個“強學習器”,該新學習器在泛化性能和預測精度方面具有明顯的優勢。從以往實證結果來看,相比其他機器學習算法,采用集成學習算法對于財務困境企業的預測更為準確(任婷婷等,2021)。
目前最為成熟和發展最壯大的三種集成學習算法(Chowdhury et al,2015):一是Bagging,包括RF、極端隨機樹(ET)等,可減少方差;二是Boosting,包括梯度提升算法(Adaboost)、梯度提升決策樹(GBDT)和輕量級GBM 梯度提升機(LGBM)等,可減少偏差;三是Stacking。三種算法在樣本選擇、樣例權重、預測函數、并行計算、目標側重上各有千秋。但一般的集成算法是通過某種方式融合多個相同的學習器,而Stacking 集成學習策略則更為強大,其通過將多個不同的基本學習器的預測結果作為新的特征輸入一個元學習器中,從而獲得更準確和泛化能力更強的預測結果(林萍和呂健超,2023)。在Stacking 算法中,需要進行兩個階段的學習:第一階段是使用多個基本學習器對原始數據進行訓練和擬合,得到多個基本模型;第二階段是使用一個元學習器將多個基本模型的預測結果組合起來,生成最終的預測結果。Stacking 集成學習方法能夠兼顧多個基模型和元模型的學習能力,發揮各模型優勢,進一步提高預測精度。此外,由于Stacking 集成學習方法及選取模型的自身優勢,該模型具有可移植性(李美玉等,2023),在其他應用情境下實現風險預警,例如,信用債違約風險預警(劉曉等,2023)、P2P 網貸違約風險預警(丁嵐和駱品亮,2017)等。
從智能財務危機預警模型實踐來看,通常是先選取財務類指標,包括企業償債能力、企業盈利能力、企業營運能力、企業現金流量水平、企業發展能力、資本結構(吳春雷和馬林梅,2007)。由于財務信息存在滯后性,應引入多角度的非財務信息,從不同側面預測企業財務危機的風險源,進而提升預警模型的預測價值(肖毅等,2020),例如,監事總規模、審計意見和創新成長能力、大股東持股比例和獨立董事比例(呂峻,2014)、網絡輿情(宋彪等,2015)、系統性風險(楊子暉等,2022)、線上運營能力、投訴途徑、登陸方式與合作第三方網絡平臺數量。此外,通過引入新聞媒體和股吧評論等運用大數據分析的指標,財務危機預警模型可以得到有效的改進,從而提高其預警效果,同時減輕傳統財務指標的滯后性(宋彪等,2015)。可見,融合大數據與機器學習算法的智能財務風險預警模型不僅可行,而且往往會挖掘很多新型的預警因子。
相比于國內并購而言,跨國并購所涉及的政治、經濟、文化等風險問題更為錯綜復雜(王靜,2020),例如東道國媒體負面情緒強烈(晏艷陽和湯會登,2023);數據風險日益突出(馬述忠等,2023);“來源國劣勢”引發東道國政府的監管阻撓(楊勃等,2020);貿易堡壘帶來的跨國并購障礙與風險(楊連星,2021);文化差異導致并購整合失敗(Ahern et al,2015);制度環境差異大導致并購雙方信息不對稱(Ahmad et al,2019)、法律風險(俞鋒和池仁勇,2015)等宏觀因素。但是,這些研究大多限于單一風險或幾種風險因子,且大多采用傳統實證方法,如Logistic 回歸等方法,鮮有運用大數據的機器學習方法。而隨著大數據技術日益興盛,通過機器學習模型挖掘更豐富的互聯網企業海外并購風險因子已成為可能。
隨著國內互聯網市場進入存量市場競爭時代,互聯網行業“出海”已成趨勢,這對以往大多針對于傳統制造業的跨國并購研究提出了新的挑戰。近年來,部分文獻開始對互聯網企業國際化展開探索式研究(Vecchi and Brennan,2022;馮乾彬等,2023)。Luo(2021)提出主流的國際化投資理論難以適用于中國互聯網行業等新興行業的投資行為,傳統的所有權優勢、區位優勢和內部化優勢在數字經濟時代有所削弱。在互聯網企業進行跨國并購時,東道國的市場規模、地理距離不再是企業著重考慮的因素,而是更傾向于獲取東道國豐富的數字技術和研發資源(蔣殿春和唐浩丹,2021)。相比于傳統制造業,互聯網行業的敏感性會導致企業在并購時會遭受著更為嚴厲的東道國政府監管(郭全中和李祖岳,2023),例如,近年來美國對我國的中興、華為和字節跳動等互聯網企業的長臂管轄與定點打擊及美國外資投資委員會(CFIUS)以國安理由介入調查并取消的并購案例越來越多。歐盟出臺的《通用數據保護條例》(GDPR)等數據隱私法規的出臺也對我國互聯網企業出海提出了更高的要求(馬述忠等,2023)。區別于傳統制造業跨國公司,互聯網企業獨特的成長路徑蘊涵著特有的海外并購風險(樓潤平等,2019),因此有必要對互聯網企業國際化作更深入的探討。
綜合來看,現有文獻機器學習研究主體多是上市公司國內并購(王言等,2021),較少專注海外并購事件;研究對象以傳統制造業為主,較少專注互聯網企業;預警指標體系以微觀(企業)財務指標為主(Jia et al,2020),較少涉及宏觀(國家)和中觀(行業),且對跨層面多角度的影響因素的綜合分析較少;預警風險因子以財務類指標為主,非財務類指標已經逐漸增多(陳藝云,2022);研究方法已經大量探索機器學習模型,但集成學習及Stacking 算法模型少見。為此,基于互聯網企業海外并購事件及其文獻,本文從國家宏觀、行業中觀、企業微觀和大數據4 個維度構建互聯網企業海外并購財務風險大數據預警指標,通過算法優化構建集成預測模型,并對比不同學習算法在跨國并購風險預警的預測效果,以期為海外并購風險管控提供新思路。
本文設計的基于Stacking 模型的互聯網企業海外并購財務風險大數據預警模型實施路線如圖1 所示。國內和國外并購交易分析平臺中記錄了大量互聯網企業海外并購記錄數據,本文首先通過網絡爬蟲、手工等方法收集我國互聯網企業海外并購的樣本。除基礎數據預處理工作外,本文就可能出現的樣本過擬合和特征維度過多的問題提出了解決方案。在模型設計和實施階段,依據“好而不同”的原則在模型候選列表(包括集成學習模型和非集成學習模型)中進行隨機選擇并針對海外并購數據集完成訓練,并采用機器學習任務中常用的準確率和area under curve(AUC)值等指標進行模型評估,選取預測精度最高的組合模型作為本文的基模型組合。接下來,基于Stacking 集成學習的思路,本文對單分類器的輸出結果進行特征融合優化,并將其作為輸入進行元模型的訓練,以輸出最終的預測結果。最后,通過輸出特征重要性圖來分析模型中各個特征對預測結果的影響程度。這有助于理解模型對于不同特征的關注程度,并有助于特征選擇和模型調整的優化工作。

圖1 模型實施路線圖
集成學習技術是將一系列基學習器通過迭代、組合等方式組成新的機器學習模型來降低方差及提高模型的泛化性能(Dasarathy and Sheela,1979),首先,依據預先設定的規則生成多個分類器;其次,利用預設定的組合規則將這些分類器合理地組合起來,形成一個元分類器,其泛化能力更優于單一分類器;最后,綜合分析多個分類器的預測結果,得出最終的輸出結果。基于“堆疊泛化”(stacked generalization)概念,Wolpert(1992)認為集成學習是一種將多重機器學習模型分類、分層,最后通過一類投票(vote)方法輸出模型最終分類結果的算法模型。對比傳統的基于投票法的集成學習模型與Stacking 模型,后者的分類準確性均優于前者(Georgios et al,2005)。Stacking 算法使用特殊的結合方法,可以將不同類型的機器學習算法匯集并堆疊成為一個新的學習器(徐繼和楊云,2018)。
Stacking 算法建模過程如圖2:首先,對數據集進行重采樣,獲取多個子集,一般分為與基學習器個數相同的份數。第一層學習模型通常是指對原始數據即沒有標簽的數據進行預測并進行有監督的學習。本文所用的數據均是在已有事實結果的情況下獲取,數據已經有了明確結果,故第一層學習模型不再考慮。基學習器是指在構建Stacking 算法中用于構建第二層預測模型的機器學習算法。每個基學習器僅使用一個其他基學習器未預測過的子集來作為預測集,以保證這個子集未參與到訓練過程之中,且可以減少過擬合程度。通常在選擇基學習器時,選擇計算方法有偏差的弱學習器來產生分類結果,以免導致后續的訓練受第二層結果影響過大,造成結果方差偏離較大。在分配訓練子集過程中,應當避免每一塊數據索引互相重疊(史佳琪和張建華,2019),以防最終輸出結果出現嚴重的過擬合。

圖2 Stacking 算法建模過程
其次,得到所有基學習器的輸出結果后,對相互之間的結果進行相關性分析。篩選出相關性較差的輸出結果,保留其算法模型,而對于相關度較高的模型則保留預測結果最好的一組模型。其原因在于,不同的算法本質上是不同維度及不同的數據結構角度擬合數據,然后根據不同的原理來建立模型,而最終的疊加是一個糾錯過程(徐繼和楊云,2018)。這就使得對于整體Stacking 集成學習模型而言,基學習器的召回率比準確率更重要。本文選擇Pearson 法來衡量各個模型的差異程度,其計算方法如式(1)所示。
其中:x和y分別為兩不同模型輸出的預測值;i為觀測值,共m組預測值。rxy越小,模型匹配度越高。再者,選擇所有相關性較差的結果組合記錄其所對應的基學習器,得到第二層基學習器集合。這些基學習器在最終的集成學習算法之中將會反復訓練堆疊,結果也會不斷做交叉驗證,最終選取得到精確率更高的集成學習模型。
最后,第三層通常選用投票法來產生最終的預測結果。基于陳鐵明和馬繼霞(2012)等已有研究,通常賦予最優模型以更高的權重。根據隨機森林或其他樹形決策分類器的特征,在已經獲得數據分類結果的情況下,可以使預測結果更好的模型得到更高權重,也可以使用加權投票法來簡化算法流程(徐繼偉和楊云,2018):H(x)=,其中wi為第i個個體學習器的權值;hi(x)為第i個學習器(共T個)的誤差,通常wi>0 且或可以采用平均法,其中i為第i個學習器。Stacking 算法具體表示如下:對于一個樣本集合D={(xp,yp),p=1,2,3,…,N},yp是第p個樣本的結果,xp為第p個樣本所對應的特征集。
1.互聯網企業海外并購風險預警因子體系
綜合現有研究,本文構建的中國互聯網企業海外并購風險預警因子包括4 個維度(表1),共計86 個指標。其中,股吧評論屬于大數據非財務指標,下文將詳細解析,其他類指標限于篇幅不再詳析。這些風險預警因子相對獨立又相互關聯,從風險演化鏈角度來看,東道國宏觀風險因子、市場中觀風險因子、企業微觀風險因子往往會依次顯現,媒體關注等大數據預警因子則憑借獨特的實時動態優勢貫穿其中,它們的綜合預警效果最終會通過主并企業財務危機形式呈現,而上述紛繁復雜的風險預警過程無法采用傳統的財務風險預警模型,需要引入以集成學習為代表的的智能財務危機預警模型。

表1 互聯網企業海外并購財務風險預警因子體系
2.股吧評論指標
從在線信息獲取的企業相關大數據,其內容可包含導致企業財務危機方方面面的因素,甚至包含人們尚未認識到的危機根源。在眾多網絡平臺中,股吧平臺最為活躍,也是最具有研究價值的平臺,股吧平臺是媒體、機構投資者、小眾投資者、供應商及基金經理之間信息傳遞的重要媒介,其產生的大數據對于研究公司股票價格和財務狀況的變化極具價值(Lai,2022)。股吧評論中不乏資深網民與相關專家對海外并購事件的真知灼見,其言論具有一定的專業性和科學性。它們所傳遞的信息及情感交流的互動和波動在一定程度上能夠反映企業在實施海外并購后的經營及財務狀況,因此對企業的財務危機具有一定的預警價值。此外,互聯網上的網民對企業的相關行為也會產生反應,這涵蓋了線下接觸企業的人們所產生的各種情緒。所有這些信息通過線下行為映射到互聯網,并通過聚集、排斥和融合的作用在互聯網中形成股民情緒,進而形成與相關企業相關的網絡輿情(宋彪等,2015)。這些客觀、科學的數據可以為財務危機預警提供幫助。不僅大數據與企業財務狀況密切相關,而且通過計算機自然語言處理技術進行量化處理,結果更加客觀,因此通過大數據量化處理形成的指標可以解決以往非財務指標片面、主觀、難以量化的問題。通過分析和監測這些數據,可及早發現潛在的財務風險因素和市場反應,幫助企業及時采取措施避免危機的發生或減輕其影響(段珊珊和朱建明,2016)。
關于股吧評論的指標獲取,本文采用Python 作為編程基礎,選取中國最大的財經網站東方財富網作為數據來源,從中批量爬取評論的標題、內容文本、時間等。為了對所爬取的內容文本進行情感分析,本文采用了多個情感詞典來構建情感詞庫,其中包括如下詞典:第一,基礎詞典,主要以知網HowNet 情感詞典為主;第二,網絡語言詞典,以BosonNLP 和SnowNLP 情感詞典為主;第三,金融專業領域詞典,以證券和財經領域詞匯為主;第四,新聞詞典,主要以新聞、政策中隱性情感傾向的詞匯為主。基于以上的情感詞典,加入其他手動搜集的情感詞和股吧情感詞典(表略),得到本文進行集成學習的評論數據情感詞典。此外,在日常交流中,除了情感詞典中的積極詞匯和消極詞匯以外,大量的副詞和否定詞也經常被用來加強或減弱所要表達的內容。為了更準確地評估文本情感,本文參考HowNet 情感詞典、相關研究和人工收集的信息,整理出副詞和否定詞的詞典(表略),并將它們分為7 個等級,根據現有的文本情感分析文獻進行具體賦值。積極詞匯賦值為1,消極詞匯賦值為-1,副詞和否定詞的值在-1.0~2.5,絕對值越高表示程度越強。
另外,根據情感詞典和機器學習程序分析股吧評論的情感值。使用jieba 分詞將爬取到的文本內容的句子分割成詞匯,將分割后詞語中的情感詞與情感詞典中的詞匯自動進行對比,并使用程度副詞進行加權計算得到情感值。之后,根據文本中各詞匯的情感值,相加匯總后可得到每一個帖子中文本的情感值。若情感值大于0,則當前主題帖為積極評論貼;若情感值小于0,則當前主題帖為消極評論貼;若情感值為0,則將其定義為中立評論貼。
本文將主并互聯網企業實施海外并購后被ST 的年份定義為T年,由于財務報告發布具有滯后性,T-2 年財務數據已包含企業發生財務危機的主要特征——虧損,但這些評論屬于在T-2年財務數據發布之前的評價,并不會夸大財務危機預警效果。因此,本文在考慮大數據指標時,選取企業T-2 和T-3 年的股吧平臺數據進行觀察和分析。
由此,本文給出股吧評論大數據指標的定義見表2。

表2 互聯網企業海外并購事件的股吧評論大數據指標
綜上,本文選取T-2 年帖子數、T-2 年評論數、T-2 年輿論熱度、T-2 年積極情緒指數、T-3 年帖子數、T-3年評論數、T-3 年輿論熱度、T-3 年積極情緒指數8 個大數據指標作為待選項,用于后續的海外并購財務危機預警模型,并借助Python 收集到約60 萬條數據,整理匯總成45 家互聯網上市公司的56 起海外并購事件的8個大數據指標。本文的互聯網企業海外并購財務風險大數據預警模型如圖3 所示。

圖3 互聯網企業海外并購財務風險大數據預警模型
完整且質量高的數據是機器學習的重要基石。在數據獲取的過程中,應以數據質量評估標準為導向,以確保數據的完整性、一致性和準確性,并在最終結果的形成中予以體現。同時,需要摒棄傳統的邏輯思維方式,不再僅從因果邏輯的角度出發,尋找與實驗目標有可能相關聯的因素,而是應該盡可能從多個維度收集企業的所有相關信息。這些特征值有可能是以非線性的形式呈現在最終的分類結果之中,傳統的線性回歸方式對非線性疊加的特征利用率較差,而借助集成學習算法,則有可能從海量的、雜亂無章且不清晰的數據中找尋到蘊含有規律、有價值和能夠理解應用的特征。
1.數據來源
鑒于許多中國互聯網企業注冊于開曼群島等避稅天堂,本文以實際營業地或辦事機構所在地處于中國大陸并在滬深兩市、香港聯交所、美國納斯達克交易所、美國紐約交易所等上市的中國互聯網企業為主并企業,以實際營業地或辦事機構所在地處于中國大陸以外(不含港澳臺地區)的企業為目標企業,以2013 年1 月1 日—2020 年12 月31 日發生的45 家中國互聯網企業56 起海外并購事件為研究樣本,具體信息主要源于清科研究中心、Zephyr 全球并購交易分析庫、中國全球投資跟蹤報告(美國企業研究所和傳統基金會)、國泰安“海外直接投資”數據庫,同花順iFind 等數據平臺,通過網絡爬蟲、并購數據庫、手工等方法收集,結合新浪財經、巨潮資訊、東方財富網等多方平臺加以驗證和篩選,并對如下樣本進行剔除:①未對外公告的并購事件;②并購前為ST 類公司;③目標公司所在地為港澳臺地區、開曼群島、英屬維爾京群島等避稅區;④數據缺失的樣本。最終得到56 起中國互聯網企業跨國并購事件樣本。宏觀層面的東道國國家風險指標和數據主要來自中國社會科學院世界經濟與政治研究所(IIS)發布的歷年《中國海外投資國家風險評級報告(2013—2021)》(CROIC-IWEP);中觀層面的數據主要來自于世界銀行、百度搜索和同花順;微觀層面的企業數據主要來自國泰安、新浪財經、巨潮資訊等。
2.數據爬取與存儲
為了獲取建模所需要的互聯網企業海外并購風險因子數據,研究團隊編寫了爬蟲程序,在公開的海外并購相關數據平臺上爬取互聯網企業海外并購事件的各個維度信息。這些數據平臺覆蓋了清科研究中心(數據庫-并購事件)、新浪財經、巨潮資訊、東方財富網等網站。具體流程如下:①獲取鏈接。根據網站自身統一資源定位符(URL)規則獲取各個數據的鏈接,設置baseURL 變量遍歷所有數據。②獲取信息。利用BeautifulSoup 庫對html 重構成文檔樹,并加入異常捕獲、日志記錄增強爬取過程程序的健壯性。隨機掛起程序,以減輕網站訪問壓力。③數據存儲。利用輕量級的sqlite3 數據庫實時存儲爬取到的數據。
3.數據預處理
(1)缺失值回歸填充。在原始測試集中,除去對年份進行檢索補全之外,發現缺失值分布較為均勻。考慮到數據有部分分布不均衡,本文將測試集中約15%的空缺數據刪除,以減少對最終結果的影響。在增添的特征方面,由于對數據的除法運算會出現除無意義(0ERROR),將這一部分跳過之后會出現空值,所以選擇回歸填充缺失值的方法,分flag=0 和flag=1 的情況執行隨機森林決策樹回歸填充缺失。上述缺失值填充原理是:在填補每個特征時,將其他特征的缺失值用0 代替,每完成一次回歸預測,就將預測值放到原特征矩陣中,再繼續填補下一個特征。隨著每個特征的填補,有缺失值的特征數量會逐漸減少,每次循環后需要用0 填補的特征也會越來越少。當遍歷到最后一個特征時,所有其他特征都已經用回歸填補了大量有效信息,可以用這些信息來填補缺失最多的特征。最終,遍歷所有特征后,數據將不再存在缺失值。
(2)String 編碼。由于區域特征比較少,對此部分的特征考慮選用獨熱編碼或直接編碼。在初步選用的模型嘗試后發現直接編碼效果比較好,最終采取了直接編碼的形式。
(3)歸一化處理。由于參數變化范圍較大,最終可能會對模型產生影響,需要移除掉名稱、區域、行業等不需要標準化的數據后再對其他數據進行歸一化處理,將該類數據原始值x使用z-score 標準化到x′。數據標準化過程中對序列x1,x2,…,xn進行如下變換:其中,則新序列y1,y2,…,yn的均值為0,方差為1,且無量綱。
(4)數據降維。數據降維就是通過特征選擇或特征變換操作將數據從原始的D 維空間投影到新的K 維空間。數據降維方法主要分為兩類:一是特征選擇,它是在所有的特征中通過子集搜索算法尋找和模型最相關的特征子集的過程,即在所有特征中選擇和目標最相關的一些特征,丟棄掉一些不太重要的特征。特征選擇可細分為三個類型:①過濾式,即根據特征的統計學特性選擇特征,例如Relieff 算法等;②包裹式,即通過訓練機器學習模型來選擇特征,例如支持向量機遞歸特征消除(SVM-RFE)方法等;③嵌入式,即在訓練機器學習模型的同時選擇了特征,例如邏輯回歸、LASSO 回歸(最小絕對值收斂和選擇算子算法)。二是特征抽取,亦稱特征降維,它是指通過某種線性變換或非線性變換,將數據從高維空間映射到低維空間,例如主成分分析法(PCA)(Tharwat,2016)。特征選擇的數據降維方法符合本文研究目的,同時Least absolute shrinkage and selection operator(LASSO)回歸對于數據的要求極低,能夠進行變量篩選和降低模型復雜度。變量篩選是為了在模型擬合過程中選取最重要的變量,從而提高模型的性能和泛化能力。而復雜度調整則是為了避免過擬合現象,即過度擬合訓練數據集,而導致在新的數據集上表現不佳的情況。因此,本文選擇LASSO 回歸方法進行數據降維。LASSO 回歸通過L1 正則化對回歸系數進行懲罰,可以將不重要的變量系數縮小甚至置為0,從而實現變量篩選和模型復雜度調整。因此,LASSO 回歸是一種非常有效的數據降維方法,適用于高維數據的建模和特征選擇(Tibshirani,1996)。變量系數的計算公式為其中,yi為第i個樣本(共n個),βj為第j個參數(共p個)。λ(大于0 的正數)作為調和參數,調節懲罰項(公式后半部分)權重。當λ越來越大時,懲罰項的作用將越來越強,模型的大部分回歸系數會被約束為0,因此可以通過控制λ來控制所選變量個數。
Stacking 算法是一類多重算法堆疊而成的強學習器,如同大多數強學習器一樣,它容易產生過擬合問題。不過,在構建模型并檢驗的過程中,模型最終的結果并不是適配訓練數據,而是要適配驗證數據。本文對Stacking 建模過程中可能出現過擬合的情況作出如下說明:①如果所獲取數據是原始數據,即沒有分類完成,需要有監督的學習并完成分類結果,則第一層訓練模型的選擇中應當避免選擇可能出現低方差、高偏差的模型,通常是指強學習器。第一層訓練結果通常會作為初始訓練集和測試集,使用低方差的模型有可能使最終模型輸出一個偏差極大的結果。如果多次對模型進行調整后仍得不到理想的提升,則有可能是第一層訓練模型過擬合。②在第二層訓練模型的選擇之中,除應當選擇輸出結果相關度較低的基學習器組合之外,還應當注意這部分的訓練集拆分不能使得不同的基學習器使用相同的訓練集,這會導致訓練集和測試集有交叉,影響真實的模型精確率,導致最終輸出模型擬合度過高。③在進行特征工程時,如果使用多個特征進行運算得到一個新特征,新特征的使用會顯著增強參與運算的特征在模型之中的權重。即使得到的實驗數據精確度更高,也要防范過擬合的風險。
1.數據處理
本文通過并購數據庫、網絡爬蟲等多種數據渠道共獲取了2013—2020 年45 家中國互聯網上市公司56起海外并購事件數據,并購標的涉及16 個國家及地區,包含86 個數據維度,并購信息、風險因子,對應數據處理方法分別為編碼、歸一化、One-Hot 編碼等。
2.樣本選取
關于研究樣本的分類,本文采用上市公司是否被ST 作為財務困境的判別標準,ST 公司界定為財務困境公司,非ST 公司界定為財務健康公司。從樣本公司實施海外并購后財務狀況可知(表3):財務健康公司為32 家,財務困境公司為13 家,兩者比例約為2.5∶1。現有研究對智能財務危機預測時,大多將測試樣本組和訓練樣本組的比例設為1∶2(滕曉東和宋國榮,2021)。遵循這一原則,本文從總研究樣本中隨機抽取35%作為測試樣本組,剩下65%作為訓練樣本組。因此,最終的訓練樣本組由29 家公司組成,其中財務危機公司8 家,正常公司21 家;測試樣本組由16 家公司組成,其中財務危機公司5 家,正常公司11 家。

表3 研究樣本概況
3.數據降維
經初步處理后,本文通過LASSO 回歸篩選指標,在上述86 個指標中剔除了系數為0 的指標,從中篩選出與財務危機預警較為相關的31 個主要指標作為后續變量,具體變量見表4。

表4 互聯網企業海外并購財務風險預警指標(含大數據)
4.Pearson相關性分析
Stacking 算法集成多種機器學習算法堆疊成為新的學習器,通過投票法或加權投票等方法來修正基學習器的錯誤分類。因此,在選擇基學習器時要盡可能選擇不同種類的學習器,這可以根據預測結果的二維Pearson相關系數作為參考依據。本文在計算后選取了邏輯回歸(logistic regression)、嶺回歸(ridge regression)、極端梯級 提升樹分類器(XGBoost classifier)、LGBM 分類器(LGBM classifier)及隨機森林分類器(random forest classifier)作為基學習器,各類算法的誤差Pearson 相關性分析的熱力圖見圖4。由圖4可知,除了XGBoost與Ridge算法所輸出的預測結果相關性較強外,其他算法所輸出的預測結果相關性并不明顯。因此,可以將這些算法作為基學習器組成最終的Stacking 算法。

圖4 各類機器學習算法誤差Pearson 相關性分析的熱力圖
5.模型訓練
將訓練集根據基學習器數量進行k折交叉(本文k=5)后得到訓練子集。分別使用sklean 庫中5 種基學習器LR、Ridge、XGBoost、LGBM 和RF 算法來訓練得到訓練模型。
6.模型質量的評價指標
機器學習需要建立模型來解決具體問題,通常需要使用一些指標來評估模型的性能和泛化能力,常用的模型評價指標例如準確率、精確率、召回率、F1等,而它們都建立在混淆矩陣(confusion matrix)的基礎上。
(1)混淆矩陣。混淆矩陣又被稱為錯誤矩陣,被用來呈現算法性能的可視化效果,通常是監督學習。表5 中,每一列代表預測值,每一行代表的是實際的類別,其中:TP代表將正例正確識別成正例的數量;FP代表將反例錯誤識別成正例的數量;FN代表將正例錯誤識別成反例的數量;TN代表將反例正確識別成反例的數量。

表5 混淆矩陣
(2)評價指標。通過混淆矩陣,可以得到模型的準確率等指標,具體評價指標解釋見表6。

表6 機器學習模型評價指標
7.堆疊次數
基學習器參數設置無需過于苛刻追求精度,這是由Stacking 堆疊算法的計算原理決定的。對基學習器進行五輪迭代后投票,分別輸出每輪堆疊的精確率、準確率和召回率。選擇精確率最高的一組參數并得到最終Stacking 模型的輸出結果。圖5 為五輪迭代過程中精確率、召回率和準確率的變化。最終結果使用準確率來進行比對分析,設置不同次數堆疊,會對結果產生細微影響。本文自第零次堆疊開始總計最高堆疊6 次,得到了七種結果(圖5):其中,精確率和準確率均以檢出海外并購風險互聯網企業數量為分子。由計算結果可以看出,整體的準確率隨著堆疊次數的增加呈非線性變化。在研究中,需要根據實際情況參考不同的指標。本文希望系統能盡量全面的檢出含有海外并購財務風險的互聯網企業,因此召回率和準確率是本文的主要參考指標。通過對比,本文選取的堆疊次數為1。

圖5 模型迭代次數與精確率、召回率和準確率的關系
8.輸出結果
各模型的評價指標輸出結果見表7。對比傳統的機器學習結果,Stacking 模型能夠獲取更高的準確率(93.4%),召回率(95.5%)也達到最高,說明本模型能夠最大限度檢出互聯網企業海外并購后當前是否有可能處于風險狀況;Stacking 模型的F1(86.2)高于其他模型的F1,說明其穩健性較其他模型更為突出。因此,Stacking 集成學習得到的相關指標證明該模型的可靠性,可以用于對互聯網企業海外并購財務風險的預警。

表7 各模型性能度量指標值
從測試樣本的Stacking 模型預測結果來看(表8),正常企業與ST 企業的預測正確率分別為90.9%和80.0%,預測效果良好。

表8 Stacking 模型預測結果(測試樣本16 個)
9.預警指標
Stacking 模型無法得到一個簡單的數學公式來表示預測結果,屬于“黑盒子”預測,因為它是通過多個基模型和一個次級模型的組合來得到預測結果的。但是,本文可以通過輸出特征重要性圖來分析模型中各個特征對預測結果的影響程度,以幫助理解模型對于各個特征的關注程度,幫助優化特征選擇和模型調整。
(1)重要性排序。根據Stacking 的重要性分析,得到有利于財務危機預警的15 個重要指標如圖6 所示。其中,基于國家風險維度是“投資開放度”指標,基于市場風險維度是“股價波動率”指標,基于財務能力維度是“總資產周轉率”“營業收入現金凈含量”“總資產報酬率”“經營活動產生的現金流量凈額/帶息債務”“存貨周轉率”“速動比率”“營業利潤現金凈含量”“總資產增長率”“資產負債率”這些指標,基于技術創新維度是“技術投入比率”指標,基于內部控制維度的是“內部控制質量”指標,基于大數據維度是“百度搜索詞條”指標和“T-2 積極情緒指數”指標。可見,目前影響互聯網企業國際化投資風險的預警指標主要是微觀層面,主并企業的財務能力指標有9 個,且從重要性排序來看,除了“技術投入比率”指標外,它們占據前10 位。其次是技術創新投入(技術投入比率)和股吧評論(T-2 積極情緒指數),它們分列第5、11 位。最后是市場反應(股價波動率)與新聞媒體(百度搜索詞條),它們分列第12、13 位;最后是內部控制(內部控制質量)與經濟基礎(投資開放度)。

圖6 Stacking 模型顯示的前15 個預警指標
(2)進一步研究。如果把預警指標重新分類,財務預警指標視為傳統類,非財務預警指標視為創新類,對Stacking 模型預測結果進一步分析,且將輸入模型的特征進行重要性排序,可以得到兩類新的互聯網企業海外并購風險的預警風險因子(圖7、圖8)。其中,排名前五的傳統型財務預警指標分別是:總資產周轉率、營業收入現金凈含量、總資產報酬率、經營活動產生的現金流量凈額/帶息債務、技術投入比。具體來說,以企業營運能力指標(總資產周轉率和流動資產周轉率)為主,其次是企業盈利能力指標(總資產報酬率),然后是企業負債能力指標(經營活動產生的現金流量凈額/帶息債務)、企業創新能力(技術投入比)。排名前五的創新型非財務預警指標分別是:T-2 年積極情緒指數、股價波動率、百度搜索詞條、內部控制質量、投資開放度,它們分別反映了投資者關注、股價走勢、網絡搜索、企業內控質量和東道國經濟基礎對中國互聯網企業海外并購風險具有一定的預警價值。

圖7 Stacking 模型顯示的前5 個財務預警指標

圖8 Stacking 模型顯示的前5 個創新型非財務預警指標
綜合來看,企業營運能力、現金流量、盈利能力、負債能力和技術創新等傳統型財務指標依然是互聯網企業海外并購風險預警的首選指標,但是股吧評論、股價波動率、網絡搜索、企業內控質量與東道國投資開放度等創新型非財務指標對互聯網企業海外并購風險預警也具有重要的參考價值。
數智化時代,機器學習方法與股吧評論等大數據信息為互聯網企業海外并購風險預警提供了新的思路。本文基于45 家中國互聯網企業海外并購樣本及其86 個風險預警指標,通過Stacking 集成學習模型進行機器學習,研究發現:相對于LR、Ridge、XGBoost、LGBM、RF 等機器學習模型,Stacking 集成學習模型的財務風險預警效果更好;關于互聯網企業海外并購風險預警因子的選擇,企業營運能力、現金流量、盈利能力、負債能力和技術創新等傳統型財務指標依然是首選指標,但股吧評論、股價波動率、網絡搜索、企業內控質量與東道國投資開放度等創新型非財務指標也具有重要的預警價值。
本文的不足之處在于,一是互聯網企業海外并購研究樣本只有45 家,在劃分為訓練組與測試組后,測試組樣本數量偏少;二是大數據維度的預警因子偏少,只涵蓋新聞媒體與股吧評論。下一步研究將加大樣本數量,納入更多的大數據預警因子,例如,東道國媒體輿論,上市企業年報管理者陳述語調等,且深入探討預警因子與互聯網企業海外并購風險之間的因果關系,為互聯網企業海外并購風險管控提供更多的決策參考。