北京航空航天大學經濟管理學院 周 芳 韓立巖
公司失敗判別的研究多側重于判別模型本身的改進,每一種模型都有其適應性和局限性。在知識管理領域,隨著知識資源的開發,管理方式的創新與變革,新的知識不斷涌現,管理經驗不斷豐富,充分利用這些多源知識就成為需要解決的科學問題。多源知識融合(Multiple Source Knowledge Fusion)正是集成處理和綜合利用多源知識的一種有效工具和方法是知識管理研究領域中一個新的研究方向。知識融合將來自不同渠道的單源知識,采用一定的融合準則,綜合集成為新知識的過程。充分挖掘和綜合利用多源知識,可以克服單源知識在管理決策中的局限性。將多源知識融合方法引入到公司失敗判別中,利用多源知識融合使多種判別模型間相互支持、相互補充、相互印證,通過更充分、多角度地觀察公司失敗來降低公司失敗判別的不確定性。本文將梳理基于貝葉斯理論的知識融合算法和處理步驟,通過仿真實例驗證知識融合在公司失敗判別中的應用是有效和可行的。
在一個知識管理系統中,通常是根據知識源特點、融合環境和融合任務目標,選擇適當的融合準則和方法進行知識融合,用以實現系統的特定功能或任務。知識源是多源知識融合系統輸入知識的提供者。知識源產生和構成均十分復雜,涉及諸多影響因素。知識源具有許多特征,包括多樣性、多層次性以及無限擴展性等。知識源的多樣性是指知識來自多個不同渠道獲取的單源知識,不同渠道是指具有不同環境、不同方法、不同時空的知識獲取途徑。知識源的多樣性增加知識融合處理的難度,但卻提供了單源知識之間的互補性,利用互補性可以提高知識融合效果。知識源的多層次性是指在知識生成過程中,單源知識是從不同視角、不同進程、不同時空獲得的,由于單源知識在形成過程中地位、權重和影響不同,因而使知識源具有多層次性的特點。知識源的無限擴展性是指在知識系統中,知識是人們在實踐中積累的認知和經驗,隨著科技進步和社會發展,這種積累會不斷更新、演變和擴展,產生大量的新知識。意味著知識源可以不斷豐富和發展,具有可擴展性。從知識源的以上特征可以看到,多源知識可以為決策提供更為豐富和充分的依據。
知識融合是一種對多源知識綜合集成的方法,通常定義為在某種特定環境下,按照系統的給定任務目標,將來自不同渠道的單源知識融合成新知識。融合后的知識突破了原知識的內涵和特征,形成了層次更高、內涵更豐富的知識。融合方式可表達為

式中,Xi,i=1,2,…,K表示原知識,i表示單源知識個數,Ai表示各單源知識的融合權重,f表示融合規則,Y表示融合結果。
融合算法是實現知識融合的關鍵步驟,直接關系到融合過程的復雜程度和融合效果。通常是根據融合任務目標、融合環境以及算法復雜度優選合適的融合算法。常用的融合算法有貝葉斯(Bayes)估計理論、D-S(Dempste-shafer)證據理論、模糊集理論、神經網絡、馬爾科夫鏈等。其中基于Bayes理論的融合算法是一種經典的穩健方法,其融合效果好,判別結果的分類錯誤概率最小。
若有一類待估問題ω={ωj,j=1,2,…,N},其先驗概率為P(ωj),j=1,2,…,N,隨機序列X={Xi,i=1,2,…,R}是由R個知識源提供的觀測值。根據條件概率定義,在觀測條件下,ωj的后驗概率為:

式(2)中,P(x1,x2,…,xR)是觀測值的聯合概率分布函數。應用全概率公式,同時假定觀測值間相互統計獨立,則有:

不難看出,式(3)將一個多維度估計問題轉化成各分量的單維度估計問題,然后再融合成總的估計結果。考慮到隨機序列X={Xj,j=1,2,…,N}的完備性,即:

于是得到后驗概率為:

從式(4)看出,當先驗概率P(ωj),j=1,2,…,N,已知,并從觀測中獲得條件概率P(xi|ωj),i=1,2, …,R,j=1,2, …,N之后,就可以求得后驗概率P(ωj|x1,x2,…,xR)。應用最大后驗概率準則,于是得到貝葉斯估計準則如下:

從式(5)看出,后驗概率最大時的觀測結果即為貝葉斯估計。
為了驗證知識融合在公司失敗判別中的應用效果,選擇證券市場發展相對穩定的2002~2004年期間的5家上市公司作為試驗對象,采用具有代表性的公司失敗判別模型Z-score模型和Logit模型作為融合處理系統的雙知識源,以公司是否被實施特別處理(ST)為公司失敗認定標準。所選5家上市公司中,3家為2004年被實施特別處理的公司,2家為未被特別處理過的公司。應用5家上市公司于2002年度公開報表中的財務數據計算Z-score模型和Logit模型的判別值,然后依據判別值進行融合處理,得到融合結果tB4,之后進行公司失敗與否的判別。對比單源(Z-score模型和Logit模型)和多源的判別結果,從而驗證多源知識融合效果優于單源的結論。
(一)仿真知識源 選擇Z-score判別模型和Logit判別模型作為融合處理的兩個知識源。
Z-score模型是一種較成熟的多變量計分模型,提取公司財務數據,利用統計分析,建立評分模型,形成判決區間,判斷公司失敗判別結果。該模型選用的財務指標具有充分代表性,是考察公司財務狀況的重要經濟技術指標。Z-score是一種經典、主流的公司失敗判別模型,其數學表達式為

式中,X1,…,X5是財務比率。X1=營運資本/資產總額,X2=留存收益/資產總額,X3=EBIT/資產總額,X4=權益市價/負債總額賬面價值,X5=銷售額/資產總額。
Z-score計分模型的判別準則為

Logit模型是基于Logistic方法建立的計分模型,這種模型無需自變量服從正態分布的假設,不過其建模過程較為復雜,但它對ST的區別能力要高于Z-score模型。Logit模型的表達式為:

其中,Y1=有形資產負債率,Y2=應收賬款/流動資產,Y3=凈值報酬率,Y4=留存收益率,Y5=資本累積率,Y6=現金凈流量/總資產,Y7=Ln(總資產)。
Logit模型的判別準則為

從上述兩種模型的數學表達式看出,考察的財務指標側重點有所不同,各有特點,但反映出有各自的局限性。因此,將這兩種模型選為知識源,可以做到取長補短,是一種優化選擇。
(二)知識源原始財務數據 知識源的財務數據是從五家上市公司公開發表的年度財務報表中提取的。這里將五家公司分別記為A、B、C、D、E公司,提取的財務比率列于表1和表2中。應用公式(6)、(7)不難計算出兩種模型的判別值Z和L,如表1和表2中所示。
(三)知識融合判別模型的計算 將表1和表2中給出的公司失敗判別值Z和L作為觀測值,應用Matlab軟件,分別計算條件概率和計算結果于表3所示。

表1 Z-score方法的計算結果

表2 Logit方法的計算結果

表3 基于Bayes方法的條件概率表

表4 基于Bayes融合處理算法的結果
采用單源知識Z-score模型進行公司失敗判別時,根據五家上市公司2002年度的年報數據計算的Z值均在1.81~2.99之間,處于不確定狀態,無法判別這5家公司的公司失敗。采用單源知識Logit模型進行公司失敗判別時,根據3家上市公司2002年度的年報數據計算L值。其中A、B、C三家公司的L值均小于0.03,應判為兩家公司L值均大于0.03,應判為ST,而實際上,C公司因在2004年的近兩個會計年度審計結果顯示的凈利潤為負而被評為ST,顯然,這里判C公司為是不正確的,和該公司的實際表現不符。當采用雙源知識(Z-score源和Logit源)融合后,A、B公司被判為公司被判為ST,這種判別結果與5家上市公司在2004年度的實際情況相吻合。
可見,以單源知識進行公司失敗判別存在一定局限性,而多源知識融合明顯優于單源知識,降低了判別的不確定性,提高了判別的置信度。雖然知識融合方法的研究尚在起步階段,融合模型需要進一步完善,但多源知識判別比單元知識判別的優勢是明顯的,可作為公司失敗問題的一個新的研究思路和方向。
[1]周芳、劉玉戰、韓立巖:《基于模糊集理論的知識融合方法研究》,《北京理工大學學報(社會科學版)》2013年第6期。
[2]Sander J, Beyerer J. Bayesian Fusion: Modeling and Application [J]. Sensor Data Fusion: Trends, Solutions,Applications (SDF), 2013, 9-11 Oct: 1-6.
[3]Mohammad-Djafari, A. A Bayesian approach for data and image fusion [M]. 2003, USA: 22nd International Workshop.