[摘 要] 本文利用數據挖掘技術,設計了一個具有財務分析和數據挖掘功能的財務指標分析系統,以便為企業決策層提供快速的財務分析支持。在指標分析模塊中使用了模糊識別算法。該算法是利用訓練樣本集的模糊識別矩陣計算出模糊聚類中心矩陣,再利用模糊聚類中心矩陣反算出測試樣本集的最優模糊識別矩陣,從而克服了傳統的模糊聚類算法只能聚類的缺點。
[關鍵詞] 數據挖掘;財務指標;模糊識別
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2013 . 12. 022
[中圖分類號] F232 [文獻標識碼] A [文章編號] 1673 - 0194(2013)12-0036-02
隨著全集團ERP系統的逐步推廣,如何從海量數據中提取出對決策有價值的信息成為了財務分析的一大難題。本文將模糊識別算法引入到財務分析工作中,結合本企業實際決策分析需求在SAP BW平臺上設計一個財務指標分析系統,并對該系統進行了深入的需求分析、系統設計。該系統能夠智能挖掘出有效信息,并將結果直觀、友好地呈現出來。
1 需求分析
通過分析對各公司的經營指標,能夠即時監控企業的各項經營管理活動,發現和糾正企業管理活動的重大失誤和波動,及時發出警報,建立免疫機制,不斷提高企業抵抗財務風險的能力,使企業的財務管理活動始終處于安全、可靠的運行狀態。本系統需要對償債能力、營運能力、盈利能力和發展能力進行分析和預警。
償債能力分析包括資產負債率和流動比率。營運能力分析包括總資產周轉率和存貨周轉率。盈利能力分析包括資產凈利率和凈資產收益率。發展能力分析包括資本積累率。
2 體系結構設計
本系統的體系結構設計為4層。
最底層是數據獲取層,數據源主要是企業財務日常數據,包括財務總賬表里的各憑證數據。數據要保持一致性就必須對數據源中的數據清理、抽取、轉換,統一數據類型后再存入數據倉庫中。通過SAP BW的數據抽取機制將SAP R/3源系統數據源中的數據按定制的計劃進行分段上載,通過傳輸規則先上載到PSA(Persistent Staging Area,持續分段傳輸區域),再通過信息源的對照與更新規則的清洗轉換上載到信息提供者ODS中,最終通過轉換進入信息立方體[1]。
數據存儲層是用來存儲經過加工處理后的企業財務指標分析系統數據倉庫中的數據,并按分析需求進行重新組織,為決策支持提供大量規范的數據。
數據處理層主要是系統利用OLAP技術和數據挖掘技術對企業財務分析系統的信息立方體的數據進行分析處理,從而得到有用的知識。
數據訪問層是用戶與系統交互的入口。決策者通過這一層展現出的數據、報表和圖像可以查詢到想要的具體數據,并能根據數據分析的結果得到有用的知識,對下一步決策提供依據。
3 功能模塊設計
根據需求分析,本系統的功能模塊圖可以設計為如圖1所示。
系統共分為3大模塊,分別是數據準備模塊、指標分析模塊和報表輸出模塊。數據準備模塊用于對R/3里的數據進行標準化處理,并將處理后的數據存儲到SAP BW中,形成可以進行多維分析的數據立方體。指標分析模塊即財務數據的分析過程,包括償債能力分析、營運能力分析、盈利能力分析和發展能力分析。報表輸出模塊用于將分析挖掘后的結果直觀、友好地展現給用戶。
4 模糊識別算法設計
本文在做指標分析時引入了模糊識別算法,從而可求得各公司經營情況優劣。
模糊識別算法的核心思想是人們根據訓練樣本集的好壞輕重程度將其分為C個等級,每個樣本的等級隸屬度組成模糊識別矩陣U。同時,訓練樣本集存在m個指標。這m個指標與C個類別可以通過訓練得到模糊聚類中心矩陣S。則測試樣本集通過模糊聚類中心矩陣S可以反推出自己的模糊識別矩陣U′[2],從而得到測試樣本的好壞輕重程度等級。
由于訓練樣本的各個指標的特征值存在量綱量級上的差異,為了消除指標特征值之間量綱的影響,必須對其進行規格化處理。處理后得到該訓練樣本集的相對隸屬度矩陣R。如果企業經營指標的重要性程度有區別,則各指標應當附有權值。即各指標的權向量為
W=(w1,w2,…,wm),■wi=1(1)
式中,m為指標的個數。
訓練樣本j與樣本的類別h的特征值聚類中心間差異用廣義歐氏權距離表示為:
||wi(rj-sh)||={■[wi(rij-sih)]p}1/p(2)
式中,p為距離參數。加權后的加權廣義歐氏權距離為:
d(rj,sh)=uhj||wi(rj-sh)||(3)
為使訓練樣本集對于全體類別加權廣義歐氏權距離平方和最小,建立目標函數為:
min{F=■■{uhj[■[wi(rij-sih)]p]1/p}2}(4)
如果p=2,則目標函數可表示為:
min{F(sih)}=■min{■{u■■■[wi(rij-sih)]2}}(5)
■=2■u■■w■■sih-2■u■■w■■rij=0(6)
sih=■u■■rij /■u■■(7)
從而求出模糊聚類中心矩陣S。
由式(4)還可以得到目標函數為:
min{F(uhj)}=■min{■{u■■■[wi(rij-sih)]2}}(8)
構造拉格朗日函數為:
L(uhj,λ)=■u■■[■[wi(rij-sih)]2]-λ(■uhj-1)(9)
■=2uhj■[wi(rij-sih)]2-λ=0(10)
■=■uhj-1=0(11)
由式(10)和式(11)得[3]
uhj=■(12)
則可以得到測試樣本的模糊識別矩陣U′。
設有一個樣本集(xij)m×n,其中n表示企業樣本個數,m是財務指標個數。xij為樣本j的指標i的特征值,i=1,2,…,m; j=1,2,…,n。算法步驟如下:
(1)訓練樣本規格化處理。對訓練樣本的指標特征矩陣做規格化處理。這里用到極差規格化法,即式(13)所示。則可得到相對隸屬度矩陣R=(rij)m×n。
rij=■,(0≤rij≤1)(13)
式中,min{xi}是樣本集某一指標中的最小特征值,max{xi}是某一指標中的最大特征值。
(2)訓練樣本建立模糊識別矩陣。由專家對訓練樣本各企業的經營狀況好壞程度分為c個等級,并對各企業等級進行評估。得到等級評估樣本組成的模糊識別矩陣U=(uhj)c×n。uhj表示企業樣本j歸屬于h類的相對隸屬度。h=1,2,…,c;j=1,2,…,n。設樣本j完全屬于h類的隸屬度為1,完全不屬于h類的隸屬度為0。則
0≤uhj≤1,■uhj=1,■uhj>0(14)
(3)訓練樣本求解最優模糊聚類中心矩陣。通過相對隸屬度矩陣R和模糊識別矩陣U可以得到訓練樣本的最優模糊聚類中心矩陣S=(sih)m×c。公式如式(7)。
(4)測試樣本規格化處理。得到測試樣本的相對隸屬度矩陣R′=(rij′)m×n。公式如式(13)。
(5)測試樣本求解最優模糊識別矩陣。通過測試樣本的相對隸屬度矩陣R′和訓練樣本的最優模糊聚類中心矩陣S可以求得測試樣本的最優模糊識別矩陣U′。公式如式(12)。
模糊識別算法流程如圖2所示。
例如計算公司的償債能力情況,則需要輸入樣本的償債能力指標,即資產負債率和流動比率。在此之前,要將數據倉庫中的數據分為2個樣本集,分別是訓練樣本集和測試樣本集。其中財務指標m=2,即“資產負債率”和“流動比率”2個指標;樣本好壞等級c=2,即“正常”和“危機”2個等級。由測試樣本集最優模糊識別矩陣可以得到結論:A公司有99%的可能性為償債能力正常,B公司有99%的可能性存在償債能力危機。則決策層可以根據這個結果及時對B公司的經營狀況進行調整。
5 結果分析
將管理者對幾個公司的財務指標分析數據提交給專家評價后,發現該系統的分析結果比較符合這些公司的實際財務狀況。例如資產負債率的最優范圍是0.4~0.7之間,如果該數值大于1則說明該企業資不抵債,企業面臨償債能力的危機。流動比率大于1時說明該企業流動資本大于流動負債,企業處于比較安全的狀況;當流動比率小于1時則反映企業流動資本小于流動負債,企業無法緊急償還負債,面臨償債能力的危機。測試的結果正好印證了這一財務指標的理論,說明該系統能夠使管理者較為準確地掌握各企業的財務運行情況,而不需要學習專業的財務分析知識,為管理者實時監控各企業的經營狀況提供了技術支持。
6 改進方向
本系統雖然已經完成了財務分析的初步要求,但分析的面還太少。在將來的工作中可以加入財務的關鍵業績指標(KPI)分析,使分析更加全面具體。另外在識別出樣本集的好壞等級以后,可以使系統自動對識別結果做出結論并提出改進的意見,這樣就能夠給決策層提供更加豐富直觀的信息。
主要參考文獻
[1]Biao Fu,Henry Fu.SAP BW:A Step-by-Step Guide[M].北京:中國人民大學出版社,2003:266-267.
[2]孫星,邱菀華,唐葆君,等.基于模糊識別與聚類的企業危機預警模型設計[J].控制與決策,2006,21(3):267-275.
[3]陳守煜.工程模糊集理論與應用[M].北京:國防工業出版社,1998:120-125.