張冬
近年來,探索“另類數據”應用的研究日漸興起,通過分析財務數據的局限以及“另類數據”的特點,研究重點探討了其在企業業績預測、財務困境識別與預警、財務舞弊甄別方面的應用價值,并結合應用中面臨的挑戰給出了建議。
數據作為數字經濟時代的基本元素,已被國家明確列為與土地、勞動力、資本、技術并列的第五大生產要素并受到各方關注。數字經濟環境下的數據通過計算機和互聯網等工具捕捉、管理和處理形成數據集合和信息資產[1]。在財金領域,財務數據以及由此構建的財務指標形成了財務分析的基礎,隨著信息化、智能化技術的應用,更多“另類數據”等非財務數據被納入分析框架,基于財務數據和非財務數據的綜合評價體系日漸受到青睞。“另類數據”成為熱議話題,主要得益于投資機構通過數據挖掘和檢驗發現了“另類因子”用以獲取股市超額收益。實際上,研究探討“另類數據”在企業業績預測、財務預警、財務舞弊等方面的應用存在著巨大潛力。
一、財務數據用于分析研判的局限
第一,財務數據的滯后性不利于獲悉企業的最新狀況。雖然上市公司定期披露財務季報,信息更新頻率優于非上市企業,但依舊屬于事后披露,滯后的信息一來不能體現企業實時經營動態,二來此期間若遇外因(如事件)沖擊,可能導致分析結論與企業現實狀況不符,進而影響判斷和決策。
第二,可能存在的財務數據粉飾現象無助于把握企業的真實狀態。一方面,出于美化財務報表的動機,部分企業有可能在遵守會計準則的前提下粉飾現有經營成果,隱瞞或掩蓋潛在風險;另一方面,亦有企業可能出于商業競爭和保密需要,合法合規合理的隱藏自身一些潛力或優勢。這兩類情形終將導致分析研判出現偏差。
第三,財會信息含量日趨下降使得財務分析研判的價值縮水。有學者[2]通過實證研究發現,古老的財會信息范式已漸漸不能滿足當前因技術變革、交易創新、商業模式蛻變所要求的信息需求,財務數據的有用性正在減弱,例如定期發布的財報在預測企業未來盈余方面的作用越來越弱,最為主要的三個因素歸結于商界無形資產的興起、會計估計的困難、關鍵影響因素的缺失。
第四,財務數據自身的局限導致不能直觀反映企業多維信息。財務數據不具備能夠直接反映諸如行業、市場、競爭態勢等企業發展趨勢的外在信息,也不直接體現企業內部組織效率、文化、人才優勢等內在信息。總之,財務數據及指標所能夠測度的企業狀況相對有限,無法直接體現和反映諸如風控、內部資源整合、社會責任履行等信息。
二、“另類數據”的界定及優勢
“另類數據”至今沒有統一明確的定義,摩根大通[3]將其大致分為個人活動(如社交媒體帖子、產品評論等)、商業活動(商業交易、支付數據等)和傳感器生成的數據(衛星監測數據、行人和車流量等)三類。廖理[4]認為“另類數據”泛指區別于傳統金融數據的有價值的信息和數據,該類數據多以文本、圖片、音頻、視頻等非結構化形式存在,具備大體量、實時或接近實時獲取、種類豐富多樣等特點。其主要優勢表現為:第一,拓寬了分析研判的信息維度。與財務數據相比,“另類數據”包含了更多預見和洞察力的信息,可彌補財務數據覆蓋面不廣的缺陷,有助于改進分析研判的工作質量;第二,增強了分析研判的時效性。“另類數據”獲取和傳輸的實時性大為提高,有助于及時把握或預判企業真實的經營動態、處置或化解經營風險、調整或優化經營策略,從而為企業穩健經營提供參考;第三,為智能分析研判提供了機遇。“另類數據”多樣化的數據形式和豐富的信息含量為有效運用數據挖掘、聚類分析、機器學習等研究方法提取蘊含其中的“金礦”,用以實現智能分析決策提供了創新和便利之道。
三、“另類數據”應用于其中的價值體現
(一)企業業績預測
借助線上銷量數據分析預測企業營收。電子商務的蓬勃發展提升了商貿活動的效率,大數據公司通過監測以電商業務為主的商家和企業的周度、月度商品銷量及客戶評論等數據,不僅可以實時掌握經營主體的時序銷售情況、判斷熱銷品類、獲取品牌市場占有率等信息,而且還可以實時分析預判營收動態等經營指標。信息獲取的領先程度大為提高,為相關方實時研判行業發展趨勢、調整競爭策略、增強經營的靈活性和主動性提供了幫助。
借助衛星數據分析預測上市公司業績。衛星遙感監測具有范圍廣、高效、相對精準等特點,借助衛星感知地面工廠可見光強度和溫差,可以分析預測企業經營狀況。通常而言,夜光強度和紅外溫度高,則企業生產經營活躍,最終會對業績產生積極影響。已有科技企業對特斯拉美國加州弗里蒙特工廠(整車及零部件主要生產基地)的衛星監測顯示,特斯拉夜光數據與汽車銷售營收數據的二者趨勢(2014年-2019年)高度一致,趨勢拐點相符,對于實時掌握企業生產狀況、動態預測其業績變化提供了新渠道。
借助戰略性資產分析研判企業未來業績增長潛力。巴魯克·列夫和谷豐[2]認為某些行業決定企業成長和保持競爭優勢的因素不再是衡量歷史盈利、償債能力等為導向的財務指標,而是決定企業未來業績的戰略性資產的多寡以及管理層對這些資產配置的成效,包括在研藥品臨床試驗的成功率,保險公司保單的續保模式,互聯網企業的新客戶增長率和客戶流失率,企業研發的投入和專利的轉化率、保護期以及保護范圍,勘探中油井礦藏含量的前景,航空公司飛機運載能力使用率的趨勢,企業內部科學家、明星或關鍵人物等特殊人才的數量及其貢獻等信息。這些優勢相對稀缺且更加難以模仿,是企業獲得競爭優勢并保持業績領先的關鍵變量。
挖掘文本增量信息用以分析預測企業盈虧。相較于財務數據,運用文本挖掘技術獲取前瞻性信息并構建指標來預測企業業績的研究較為新穎。例如,管理層討論與分析(MD&A)作為上市公司年報、業績說明會、招股說明書所涉及的內容,有研究文獻探討了其對企業盈利的預判價值。其中,管理層對存貨異常增加的討論可以預測企業盈利[5],管理層正(負)面語調與上市公司T+1年業績顯著正(負)相關[6],招股說明書中的負面語調與IPO 后公司業績表現顯著負相關[7],MD&A語言質量綜合指標對于預測公司未來財務業績作用明顯[8]。
(二)企業財務困境的識別與預警
涉及企業生產經營的動態信息開始用于財務風險識別。危機管理理論將一系列不佳的財務狀況稱為“財務危機”“財務困境”[9],包括企業拖欠優先股股利和債務、銀行透支、破產等現象[10]。為有效把控經濟結構調整期債券市場違約事件頻發的風險,有科技企業通過實時監測,發現部分發債企業的員工人流強度和夜班員工比例、進出廠區的卡車數量、律師活躍度和法律訴訟案件數量可用于預判企業債風險;而商場顧客和停車位車輛變化、物業出租率等指標變動,有助于預判ABS風險。實時變化的“另類指標”為相關方提前掌握更多信息并提早應對債務違約或延期償付等財務危機提供了新思路。
數據挖掘和整合得到大數據和機器學習等技術的支持。早期對于財務預警的研究多基于財務指標,新技術的應用為挖掘新的財務預警指標、探索財務預警新方法創造了條件。有研究人員[11]運用情感分析方法并統計網民信息發布的頻次,加以融合形成傳感信號,同時結合財務指標,構建基于大數據的財務風險預警模型,研究發現相對于單純使用財務指標,預警模型具有更好的前瞻性;還有學者[12]運用機器學習法對上市公司業績爆雷進行預警分析,通過將財務指標與企業商譽、并購指標適當結合,發現商譽和長期負債過高的企業業績更易爆雷,而企業收益、營運能力以及現金流也對業績爆雷產生重要影響。
已有非財務影響因素持續得到深入研究和應用。將影響企業運營的內、外部非財務信息引入財務預警模型進行研究的做法并不少見。如涵蓋外部因素的實際GDP增長率、貸款利率等[13]宏觀經濟變量,衡量行業產出變化的中觀指標[14],以及企業內部因素諸如股權結構、公司治理以及管理層激勵、投資者保護[9]或者企業重大事項、人力資本[15]等微觀指標。運用非財務數據與財務指標將兩者結合,共同構建財務困境預警分析體系(系統),改進了模型預警的效果,拓展了財務預警的研究邊界并豐富了其內涵。
(三)企業財務舞弊的甄別
數據挖掘拓展了財務舞弊甄別的信息維度。財務報表修飾和美化手段的使用,降低了單純使用財務信息識別舞弊造假的效力,數據挖掘技術為研究使用非財務信息探究財務舞弊提供了可能。研究表明,管理者特征、企業文化、內控環境、薪酬激勵等企業內部因素與企業財務欺詐相關聯[16];宏觀經濟、行業景氣、監管、關聯方交易等企業外部因素也對財務舞弊產生影響,綜合數據挖掘方法和非財務指標的模型可以獲得更好的造假識別率[17]。此外,對于第三方渠道如審計信息的非正常變更、客戶和供應商的異常、銀行賬戶和對賬單、海關報關單等信息的核實與分析,亦有助于財務舞弊的甄別。
文本挖掘有助于提升財務造假甄別的準確率。有研究人員[18]融合新聞情感指標與財務指標,依托新聞報道建立新聞“數據庫”并對上市公司進行情感分析,將生成的積極、消極情感等新聞情感指標,與5個反映公司財務狀況的指標相結合,共同構建財務造假識別模型,再與單純使用財務指標或新聞情感指標構造的模型進行比較,對比發現融合了兩類指標的模型對于造假識別的準確率最高。還有學者發現財務報告的負面、不確定性及財務訴訟詞匯占比與財務欺詐顯著相關[19];或使用決策樹模型構建最能區分虛假和真實財報的詞匯排序表,并以其中前200個詞匯為基礎采用支持向量機(SVM)技術預測財報的真實概率,得出正確的分類率約為82%[20];或從公開披露的財報等信息中提取的語言線索對比研究虛假披露和真實披露之間的差別,發現虛假披露組別更多傾向使用煽動性的語言、詞匯、比喻以增加受眾閱讀的愉悅感,不過詞匯的多樣性相對更少,但披露內容較多,目的在于看上去可信,但其中包含的實質內容卻更少[21]。
四、“另類數據”應用中面臨的挑戰
一是數據面臨倫理與治理方面的爭議。如果缺乏約束和有效規制,“另類數據”的獨特性和稀缺性,也可能對個人、企業甚至社會產生消極影響。例如,輿情數據、支付數據、醫療保險數據、地理位置信息都可能涉及隱私問題,這些數據的商業化應用與安全使用、隱私保護之間的矛盾已成為不可回避的議題,實踐中有待具體法規和政策加以持續細化。
二是數據質量問題影響研究分析的效果。由于“另類數據”來源廣泛,可能存在數據維度詛咒、數據造假或數據有偏等問題,具體表現為:樣本數量的限制與指標參數的激增,使得預測模型存在更高的過擬合風險;虛假評論、用戶刷單等不良行為增加了獲取真實數據的難度;數據覆蓋范圍、歷史長短等因素是否較好的代表了樣本整體特征等等。如果處理不妥,研究結論的可靠性就會下降。
三是數據獲取和分析的高門檻限制了推廣使用。“另類數據”來源廣泛、形式多樣、標準化程度低、挖掘提取難度較大,現有的統計方法乃至計量分析未必完全適用;自然語言處理、廣義人工智能技術的嵌入,大大超出了財經類人員的專業范疇,對研究人員的綜合能力特別是數據挖掘、清洗、編程、建模等能力提出了高要求。
五、思考與建議
第一,貫徹落實法律法規,強化數據治理。當前,國家涉及數據安全和個人信息保護的相關法規已經頒布,應當依法依規強化對于“另類數據”在內的數據采集和使用行為的監管,加大對于數據產權和個人信息的保護力度,為數據產業持續健康發展提供制度保障。同時,進一步完善“另類數據”規范使用和流通的政策措施,包括制定發布行業標準和規范,激發市場主體活力,暢通數據流通機制,建立健全數據要素市場并有效發揮其資源配置功能,培育有利于“另類數據”生產、使用和管理的良好環境。
第二,加強創新,不斷深化“另類數據”與財務數據的融合運用。一方面要持續增強研究能力,有效發揮大數據分析和人工智能等新技術的優勢,在所挖掘數據的真實性和模型適用性方面持續探索,不斷拓展“另類數據”的應用空間;另一方面要重視“另類數據”這類變量在研究中的因果關聯和解釋,特別是明晰蘊含在其中的內在經濟金融機理和邏輯關系,同時做好與財務數據的配合,建立健全適用于智能分析、預警、甄別的科學指標體系,提升分析預測的精度和效能。
第三,提升“另類數據”的標準化程度,打造更高質量的數據基礎設施。相對于傳統商業或科研數據庫中已有的標準化財務數據,以非結構化形式存在的“另類數據”,散落并隱含在浩瀚的各類信息和資料之中,亟待提取加工并形成標準化數據,用以構建日漸興起且覆蓋更廣信息維度的新型或特色數據庫,為分析研判和科學決策提供支撐。同時,實踐中還應明晰數據授權、共享和具體應用的規則,在提升“另類數據”使用便利化程度的同時,降低推廣使用成本,為學界、業界、監管方等使用者提供更加豐富、便捷的數據產品和服務。
參考文獻:
[1]何玉長,王偉. 數據要素市場化的理論闡釋[J]. 當代經濟研究,2021(4):33-44.
[2]巴魯克·列夫,谷豐. 會計的沒落與復興[M].方軍雄譯.北京: 北京大學出版社,2018.
[3]Kolanovic M., Krishnamachari R. T. Big data and AI strategies—machine learning and alternative data approach to investing[R]. J.P. Morgan Global Quantitative and Derivatives Strategy. 2017(5): 1-276.
[4]廖理. 另類數據:經濟增長的新亮點[J]. 人民論壇·學術前沿,2021(4):22-27.
[5]仇瑩,張志宏. 存貨異常增加與盈利預測相關性研究——基于“管理層討論與分析”存貨信息披露[J]. 湖南師范大學社會科學學報,2016(4):110-116.
[6]謝德仁,林樂. 管理層語調能預示公司未來業績嗎?——基于我國上市公司年度業績說明會的文本分析[J]. 會計研究,2015(2):20-27.
[7]賈德奎,卞世博. 招股說明書負面語調能預測IPO后業績表現嗎?[J]. 金融論壇,2019(10):60-69.
[8]王澤霞,潘夢雪,郜鼎.? MD&A語言特征與公司未來財務業績——基于中國創業板制造業上市公司的實證研究[J]. 財會月刊,2019(2): 78-87.
[9]田寶新,王建瓊. 基于財務與非財務要素的上市公司財務困境預警實證研究[J]. 金融評論,2017(5): 103-115.
[10]Beaver W. H. Financial rations as predictors of failures[J]. Journal of Accounting Research, 1966, 4(1): 71-111.
[11]宋彪,朱建明,李煦.基于大數據的企業財務預警研究[J]. 中央財經大學學報,2015(6):55-64.
[12]張宏斌,郭蒙. 機器學習與財務預測——來自中國上市公司業績爆雷預警應用的經驗研究[J]. 金融學季刊,2020(4):135-154.
[13]盧永艷. 宏觀經濟因素對企業財務困境風險影響的實證分析[J]. 宏觀經濟研究,2013(5):53-58.
[14]Platt H. D., Platt M. B. Development of a class of stable predictive variables: the case of bankruptcy prediction[J]. Journal of Business Finance and Accounting, 1990, 17(1):31-51.
[15]曾繁榮,劉小淇. 引入非財務變量的上市公司財務困境預警[J]. 財會月刊,2014(8):25-30.
[16]張力派,程晨,陳玲玲. 大數據時代對上市公司財務舞弊的影響——研究綜述及展望[J]. 管理現代化,2020(5):122-129.
[17]彭子坤,曾志勇. 基于非財務信息的財務舞弊識別問題綜述[J]. 財會通訊,2013(14):55-57.
[18]張春梅,趙明清,吳學子. 基于新聞情感的上市公司財務造假識別方法研究[J]. 山東科技大學學報(自然科學版),2021(1):91-99.
[19]Loughran T.,McDonald B. When is a liability not a liability? Textual analysis,dictionaries,and 10-Ks[J]. The Journal of Finance,2011, 66(1): 35-65.
[20]Purda L., Skillicorn D. Accounting variables, deception, and a bag of words: Assessing the tools of fraud detection[J]. Contemporary Accounting Research, 2015, 32(3):1193-1223.
[21]Humpherys S. L., Moffitt K. C.,Burns M.B.,Burgoon K.C., Felix W.F. Identification of fraudulent financial statements using linguistic credibility analysis[J]. Decision Support Systems, 2011,50(3): 585-594.
作者單位:中國期貨業協會,高級經濟師,博士。