河南工業貿易職業學院 趙連燈
企業的經營目的在于獲取利潤,發展自身經營和管理能力,并逐步壯大發展,創造更大的盈利。企業想要高效運轉并獲得可觀收益,必須要有危機意識和風險意識,其中財務風險意識尤其值得注意。根據復旦大學相關研究成果可知,在使用國際通用會計準則進行財務審計時,中國的上市公司78%存在財務問題,存在明顯的財務風險。根據我國國情而降低標準,30%的上市公司財務問題仍然嚴重,可見我國企業財務方面有待進一步改進,總體而言,我國企業的財務風險較大。
企業財務風險較大不僅不利于企業自身的發展,也不利于相關利益者,從財務數據中發掘出對企業財務風險有益的信息已成為許多企業面對的一個挑戰。而數據挖掘技術有利于企業的財務診斷,對企業財務風險的降低作用巨大,它是一種基于人工智能和統計學及數據庫的商業信息處理技術,從財務數據中提取提煉并自動進行分析,做出總結歸納,提出相關解決辦法,從而幫助企業管理層做出市場戰略策略,有效地降低其做出的戰略的風險。財務數據是企業財務運行的基礎,也是財務風險的來源之一,運用數據挖掘技術對財務數據進行診斷分析,能夠從中找出企業存在的財務問題,提出有效的財務風險預警措施以幫助企業穩步經營。近年來數據挖掘技術是數據庫方面的研究熱點,很多領域已經開始實際運用。
本文研究數據挖掘在財務診斷中的運用,主要研究數據挖掘技術在財務診斷、信息預警和財務診斷方案策劃決策等三個過程中的應用,建立準確有效的數據模型來指導實際的財務工作,能夠預測出企業財務風險程度并提出財務風險預警,便于企業及時地掌握財務狀況和經營狀況,適時調整企業財務戰略,提高企業經濟效益。因此,數據挖掘在財務診斷中的應用,無論在理論上還是實踐上,都有其重要意義。
數據挖掘分析有關聯分析、序列模式、聚類等方法,這方面的研究總體上成果豐碩。國外的數據挖掘分析方法發展比較成熟,有大量財務風險方面的著作,其研究主要在于財務風險預警模型的構建。國內的證券市場發展不成熟,缺乏理性的投資者,對數據挖掘分析方法研究少,主要集中在建立數學預測模型。
(一)國外研究現狀Beaver(1958)提出了單變量模型。他對80家經營公司進行一元判定預測,使用了28個財務比率作為變量。Altman(1968)在財務風險預警領域引入了多元線性判別方法,創立了Z值模型。Altman、Haldeman(1980)又提出了一種優于Z模型的ZETA模型,其更能準確預測企業財務風險。Ohlson(1990)以95家經營失敗的公司為基礎,運用Logistic回歸進行財務預警模型的建立。結果表明,與企業財務風險緊密相關的因素有企業的規模大小、財務結構、經營績效、流動性四個方面。Fyaber(1989)運用神經網絡模型,進行對銀行的首次信用風險預測。Eichengreen(1998)研究表明財務模型研究有危機管理和財務危機預警等。
(二)國內研究現狀 李一軍、金世偉(2006)在模糊聚類分析方法的基礎上,使用KPI財務指標,對上市公司進行相關分析,并在投資決策的制定時輔助性地使用到其研究結果。郭春陣(2005)運用三類挖掘分析方法——聚類、關聯規則、決策樹方法,綜合分析,構建了財務報表分析模型。呂澄、易艷紅(2006)研究數據挖掘在財務分析中的可行性,說明在財務分析運用數據挖掘技術時,XBRL語言有著有效的作用。齊中華、黃麗娜(2010)使用EXCEL實現了模糊聚類的數據分析,運用上市公司財務數據,說明了數據挖掘在財務分析中有巨大作用。張星文、梁戈夫(2006)研究發現財務危機預警的研究進展很大,企業在財務管理中已經使用到大量的模型,如人工神經網絡模型和logit回歸模型等。馮征(2007)提出了基于智能計算機的數據挖掘方法,且可用于上市公司的財務預警。
(一)應用數據挖掘的財務診斷體系流程 數據挖掘是基于財務比率分析、杜邦分析等模型運用于財務分析、預警及決策中,并進行財務診斷。故財務診斷不僅是對財務報表的分析,從系統的角度可以將財務診斷分為診斷數據系統、財務專項判斷、財務預警系統、財務決策系統四個部分。
財務診斷系統分為三個階段,分別是:數據收集階段、分析診斷階段、形成報告階段。圖1為應用數據挖掘的財務診斷模式及流程示意圖。

圖1 應用數據挖掘的財務診斷模式及流程示意圖
從圖1中可以看出,數據收集階段包括收集非財務輔助數據、三大報表數據、財務指標數據。XBRL具有實時標準性,可以有效減少錄入轉換時間,具有針對性、實用性,可以更高效地詮釋數據的內容及意義,提高了財務診斷的效率及精確度。分析診斷階段主要是將收集的數據進行專項判斷,通過XBRL與財務指標進行對比分析,再進行財務診斷并作出財務預警和決策。在此階段,對目標公司采用遺傳算法、回歸模型等進行建模,需要選擇決策樹方法、關聯分析等,高效簡單地完成數據分析。考慮到了影響企業財務的各種因素,故保證了分析結果具有完整性、實效性。通過以上兩個階段的縝密分析便可形成財務診斷決策報告,并將報告方案提交到經營管理系統。決策報告涵蓋了數據挖掘的主要判斷信息,綜合考慮到了企業的財務風險,并通過發現企業現狀問題形成解決方案,為企業經營提供了方便。
(二)應用數據挖掘的財務診斷指標體系 財務指標體系需要將企業外部和內部環境結合起來考慮,進行定性分析及定量分析來完成企業財務診斷指標的設計。在財務診斷體系中,財務指標體系構建必不可缺,有效的反映了企業的財務狀況,為數據挖掘系統提供了依據。整個診斷體系覆蓋以下幾方面:
(1)內部環境:包括一系列的定性指標,有員工素質(如知識結構、能力結構)、工作環境(主要對員工滿意度、員工忠誠度方面考察)、內部控制(包括內部控制組織、內部控制有效性等),通過考察內部環境說明企業的內部控制情況。
(2)外部環境:包括定性指標經營環境(如經濟政策、法律制度、行業發展前景、金融環境等),從宏觀角度考察企業經營所面對的外部環境狀況。除此之外還有一系列定量指標,包括產品市場(如市場占有率、產品銷售利潤率、客戶滿意度等)、社會效益(包括貸款履約率、環境保護指數、合同履約率),定量評定企業的銷售情況和經營業績。
(3)財務活動:主要包括籌資活動(有財務風險、支付能力、資本結構、資本成本等)、投資活動(包括投資收益、投資風險、資產利用率等)、經營活動(如盈利能力、經營風險、資產營運能力等)、分配活動(如股利支付率、自由資產增長率、資本金增長率)等定量指標,有效地考慮了企業經營活動中的效益及存在的財務風險。
財務指標的獲取較為容易,能夠客觀地反映企業的經營狀況及風險水平,預測企業未來的經營水平及競爭力。故選取財務指標需要考慮可操作性、全面性、靈敏性、協調性、相關性、可比性六大原則,如此分析的結果才有助于企業做出合理的投融資決策。
本文以GA房地產公司為例,進行財務診斷中的數據挖掘演示。GA公司是一家上市多年的以房地產為主業的綜合性集團公司,主營業務有房地產開發與運營、建材裝飾、建筑施工、物業管理、房地產咨詢等。對GA公司進行財務診斷的目標首先是確定其經營現狀及風險程度,其次是對其投資決策提供參考依據。
(一)數據收集 本文利用XBRL語言對GA公司2002年至2012年期間的半年報原始數據進行收集和篩選,并將其中相關性較高和負相關的財務指標剔除,如流動比率、資產收益率等,以避免信息重疊影響準確性,保留下來十七項財務指標構成GA公司財務診斷的指標體系,節選部分如表1:
(二)分析診斷
第一步,聚類分析。結合前述研究基礎,因GA公司數據量相對較少,本文采用較為快速、適合混合字段和數據集合的兩步聚類方法進行分析,按GA公司的發展階段劃分聚類,設定聚類數最小為2,最大為15,根據處理數據和GA公司經營管理信息劃分出2002年至2007年和2008年至2012年兩個聚類。建立兩步聚類模型。
第二步,財務初評。初步判斷GA公司目前財務狀況比較穩定,可通過投融資加快企業發展。模型數據顯示對GA公司發展最重要的指標主要有固定資產周轉率、資產負債率、存貨流動負債比率、流動資產周轉率、資本充足率、凈資產收益率和債務資本比率。

表1 GA 公司2002-2012 年半年報數據分析表(部分)
第三步,財務預警診斷。首先,確定對GA公司進行數據挖掘的目標需求為識別其經營財務狀況。2002年至2012年篩選出的共21組數據、17項指標進行分析,識別出財務狀況良好的年份和它們的經營財務特征,如該年的盈利能力如何,現金流如何等。其次,選擇Clementinel軟件將以上數據輸入模型,運用決策樹規則對目標變量——各年的財務狀況進行數據挖掘。
本文采用經典的財務預警模型——Z值模型作為財務狀況綜合評分的依據。鑒于數據有限,本文將Z模型據經驗值加以劃分:
Z>300,充盈,財務狀況良好;180 根據以上設定,得到各年財務狀況評分表如下: 表2 各半年財務狀況Z 值評分總表 在對數據預處理的階段,要注意將字段預先進行選項設置,以便于數據分析的導入與輸出。之后還需要對字段進行實例化,使字段的取值和類型皆直觀可見,便于分析結果的應用。 第四步,建模分析。鑒于GA公司數據有限,在分析設置時需選擇“使用推進”和“交互驗證”,以提高分析結果的準確度。然后建立C5.0預警診斷模型。運行模型決策樹顯示的結果,將根據Z值評分設置的危險、困境和正常三類狀況進行了分類, 首先按照第一重要字段即帶來最大信息增益的“每股收益”字段分為兩個節點,經不同規則路徑顯示數據。在數據重疊部分,又經次重要字段“固定資產周轉率”進一步分析確定,最終達到100%準確度的分析結果。另外還可導出散點圖更直觀地對比這兩個指標對GA公司財務狀況的貢獻程度。 第五步,結果應用。以上結果可知GA公司應在財務管理中注重每股收益的管理,積極通過融資等方式提升稅后利潤,提升股東所有者權益。GA公司固定資產以實物為主,因此變動幅度不會很大,以維持現狀為主即可。 (三)決策診斷 依據以上分析結果,以下對GA公司融資決策加以診斷分析。本文將運用關聯規則當中的財務決策分析理論,使用Clementinel2.0的Apriori算法生成頻繁項集,再據此生成關聯規則。本文自兩大證交所數據及調研樣本中選取30家與GA公司主要財務指標類似的成功融資公司作為關聯分析的樣本集,匯總出7種可選融資渠道項集,分別是: 表3 融資渠道匯總表 30家樣本公司的融資偏好如下表4: 表4 事務數據集總表 融資分析中的數據處理與前類似,需要根據“類型”節點進行實例化處理。本文按T/F的二分類變量設置類型,建立Apriori運算模型。為保障運行結果的有效性與代表性,將最小置信度設為50%,支持度為10%運行模型,步驟同上。運行結果對適合GA公司的成功率較高的一種、兩種及三種融資渠道給出多種最優組合方案,為GA公司融資活動提供了數據指導。 (四)提交報告 最后,在上述預警診斷與決策診斷的基礎上,形成預警環節與決策環節的結論性診斷報告,提交給管理者作為管理決策的重要財務依據。同時,要不斷對上述分析進行后續的跟蹤反饋與調整。 [1]趙春:《基于數據挖掘技術的財務風險分析與預警研究》,《中國投資》2012年第5期。 [2]林小菊:《中小企業財務診斷分析系統設計》,《中國鄉鎮企業會計》2010年第8期。 [3]韋偉:《汽車故障診斷數據挖掘模型的研究》,《金融會計》2011年第7期。 [4]孫英:《企業財務診斷與加強財務管理對策》,《經濟研究導刊》2013年第22期。

