摘要:為了克服模糊神經網絡的維數災難、結構復雜、局部早熟及收斂慢等缺陷,在設計一種模糊神經網絡的基礎上,將模因算法和粗糙集理論引入模糊神經網絡,提出一種模因進化型粗糙模糊神經網絡(MA-RSFNN)。新模型借助模因算法的全局搜索能力減少網絡陷入局部極值的可能性,同時利用粗糙集知識約簡對網絡輸入數據進行降維消冗,精簡輸入維度,避免“維數災難”。實例仿真結果表明MA-RSFNN模型的預測準確性較高,是一類解決金融風險管理中高維復雜問題的有效方法。
關鍵詞:信用風險預警; 模糊神經網絡; 模因算法; 粗糙集
中圖分類號:TP301.6 文獻標識碼:A文章編號:2095-2163(2013)06-0010-05
0引言
近年來,人工神經網絡已廣泛應用于信用風險預警等金融風險管理領域,研究表明神經網絡預測準確性優于統計判別分析等傳統預警方法,但其中的“黑箱”操作等缺陷卻也導致了神經網絡在信用風險管理領域的應用遭到多方質疑[1-2]。源自模糊理論與神經網絡相融合的模糊神經網絡(Fuzzy Neural Network,FNN)提高了網絡的透明性、啟發性及魯棒性,在一定程度上克服了神經網絡的“黑箱操作”,然而FNN也存在“維數災難”、結構復雜、學習算法冗長、局部早熟等問題,由此也限制了其在金融風險管理領域中的應用[3]。據此,本文試圖在對模因算法(Memetic Algorithms,MA)進行改進的基礎上,結合粗糙集(Rough Set,RS)和模糊神經網絡提出一種模因進化型粗糙模糊神經網絡(MA-RSFNN)模型,旨在利用模因算法進行模糊神經網絡的訓練學習,發揮模因算法的全局優化能力,消減網絡陷入局部早熟的可能性,使網絡具有進化和學習的雙重智能,同時借助粗糙集知識約簡精煉訓練集、降低輸入維度,避免“維數災難”現象。
1模因算法
模因算法(Memetic Algorithms,MA)由Moscato和Norman等人于1992年提出,是一種超啟發式全局搜索混合算法,主要思想源自道金斯的文化進化思想和達爾文的自然進化法則[4]。其原理是在全局搜索策略中有機集成局域搜索策略,利用局部搜索策略的局部尋優能力提高算法的性能和收斂速度。相關研究表明模因算法在搜索過程中兼顧深度和廣度,不僅有較強的全局尋優能力,同時算法收斂速度快,在許多問題上的求解獲得了比遺傳算法收斂速度更快[6-9]。
經典的模因算法通常采用遺傳算法作為全局搜索策略,因此算法流程與遺傳算法類似。根據文獻[5],模因算法的流程如圖1所示。
2模因算法改進
模糊神經網絡的訓練學習是一個連續函數優化過程,以遺傳算法為基礎的模因算法能有效求解組合優化問題,但對連續空間問題的求解則效率不高。粒子群算法是一種源自對鳥類等生物群體覓食行為進行模仿的實編碼優化算法,其概念簡單、結構簡潔,是求解實編碼優化問題的有力工具。本文提出一種以粒子群算法為全局搜索策略,BP算法為局部搜索策略的改進型模因算法,以期設計出一種高效的模糊神經網絡學習算法。
粒子群算法(Particle Swarm Optimization ,PSO)是一種基于群體智能的全局優化算法,其靈感源自鳥群、蟻群等生物群體的覓食過程[10-11]。目前,具有概念簡單、算法簡潔、隱含并行及全局收斂等優點的粒子群算法已廣泛應用到決策分析、知識發現等領域[12-13],并取得了豐碩研究成果。基本粒子群算法的數學描述如下[10]。
假設一顆微粒代表尋優空間中的一個解,算法初始化時隨機生成一定數量的微粒構成種群,而后通過不斷隨機有向迭代尋求問題最優解。在迭代過程中,微粒通過跟蹤個體及種群歷史最優值,按式(1)、(2)不斷調整個體的速度和位置以實現向最優解靠攏。
其中,式(3)為速度vij的調整量;速度vij為位置xij的調整量;w∈[0.4,0.9]為慣性因子;c1=c2=2.0為學習因子; r(·)∈(0,1)為隨機數;pij和pg分別為個體及群體歷史最優值。
2.2改進型模因算法
改進型模因算法基本流程如圖2所示。
3模因進化型模糊神經網絡
3.1網絡結構
信用風險預警通常為多輸入單輸出的問題,參照文獻[14-15]設計的模糊神經網絡拓撲結構如所圖3所示。
3.2網絡學習算法
(1)編碼。微粒的坐標值代表了模糊神經網絡的模糊參數與權值,其編碼如圖4所示。
其中,yi為實際輸出;yi為期望輸出,P為群體規模。
(3)算法步驟。學習算法的主要步驟如下:
步驟一:初始化。設置全局搜索策略和局部搜索策略的相關參數,隨機生成種群。
步驟二:BP算子。采用BP算法對每個個體進行局部尋優。
步驟三:算法終止判斷。如果算法滿足終止條件則跳轉步驟六,否則跳轉步驟四。
步驟四:PSO算子。①根據式(4)計算每個個體的適應值;②個體及群體歷史最優位置調整;③按式(1)調整微粒速度;④按式(2)調整微粒位置。
步驟五:BP算子。采用BP算法對每個個體進行局部尋優,產生新群體,跳轉步驟三。
步驟六:算法結束。
其中,算法終止條件:① MSE<ε,ε為預先給定足夠小的數;②算法迭代次數>最大進化代數。
BP算子的目標函數為式(4)所示的適應值函數,學習過程中,網絡參數與權值按以下數學公式作調整:
上述模因進化型模糊神經網絡采用模因算法對網絡進行學習與訓練,使得模型具備了學習與進化的雙重智能,但該模型也存在一般模糊神經網絡的“維數災難”現象。為此,采用粗糙集知識約簡對模型輸入數據進行前置處理,簡化訓練集、減少輸入維數,從而降低網絡結構的復雜程度,避免“維數災難”現象。前置處理的主要步驟如下:
(1)指標初選和數據預處理
在考慮數據可獲取性的前提下初步建立預警指標體系,指標體系要求涵蓋各方面的信息,力圖從全方位、多層次反映信用風險特征。
數據預處理主要是根據指標的特性,對連續型預警指標的數據進行離散化處理。數據離散化的原則是保持數據集分類或決策能力不變的前提下盡可能壓縮數據。
(2)建立決策表
以指標初選和數據預處理后的數據為基礎,建立如表1所示的決策表。
(3)知識約簡
對建立的決策表進行約簡處理,得到條件屬性的相對約簡,選取相對約簡所代表的預警指標組成指標集作為模型的輸入指標體系。
5模型在信用風險中的應用
從商業銀行的角度看,信用風險是指借款人的違約而造成的損失可能性。本文從商業銀行的企業貸款違約方面研究模型在信用風險評估中的應用,以檢驗模型在金融風險管理領域中的應用成效。
5.1指標初選與數據采集
在研究國內外相關成果的基礎上,參考相關商業銀行的企業績效評價指標體系[16-19],選擇涵蓋企業盈利能力、償債能力、成長能力及營運能力等方面的共21個指標構成初選指標集,如表2所示。
5.2粗糙集前置處理
(1)數據離散化與決策表的建立
采用等頻率劃分算法在保持數據分類能力的前提下對數據進行離散化處理,斷點集數k可通過試驗獲得,一般取k=3。在數據離散化的基礎上,以初選指標為條件屬性,屬性Bc(1:貸款違約公司,0:貸款正常公司)為決策屬性,建立信用風險預警的決策表,如表3所示。
(2)屬性約簡
5.3模型訓練學習
學習算法的相關參數初始化如下:
(1)模糊子集數設為3(代表高、中、低),則該模型為6-18-3-1結構的模糊神經網絡,輸出Y為企業違約信號(1:違約;0:不違約)。
(2)參數初始化。網絡的模糊參數及權值隨機初始化,隸屬中心∈[-1,1],隸屬寬度∈(0,1],耦合權值∈(-1,1)。
(3)模因算法的參數設置。PSO算子隨機生成規模M=30的種群,w=0.729, c1=c2=1.49,[Vup,Vdown]為[-1,1],Vmax=0.3,BP算子的學習率η=0.005。
(4)訓練終止條件:①適應值<0.000 5;② 模因算法迭代次數>10 000。
在Matlab7.0環境中,編程實現上述的模型與算法,采用訓練數據集的150份數據對模型進行訓練學習,訓練過程誤差變化如圖5所示。經過3 000多代的進化,MSE達到了0.000 281。
采用測試集的數據對預警模型進行仿真實驗,表4匯總了三類模型的實驗結果,從中可以看出MA-RSFNN模型的預測準確率高達90%,相比BP神經網絡及單純模糊神經網絡均有了大幅度提高。無論是第一類錯誤還是第二類錯誤MA-RSFNN模型的表現都最好。
6結束語
模糊神經網絡具有啟發性、透明性等特征,可處理模糊信息,能避免神經網絡的“黑箱操作”,但其存在“維數災難”現象、結構復雜及收斂性差等缺陷。本文所提出的MA-RSFNN模型將模因算法和粗糙集理論融入模糊神經網絡,發揮模因算法的全局搜索能力提升模糊神經網絡的學習能力,借助粗糙集知識約簡的降維消冗能力對訓練數據進行降維消冗處理,從而精簡網絡結構,避免網絡陷入“維數災難”。應用實例的結果表明了新模型的有效性,可望為金融風險管理提供一種新方法和新思路。
參考文獻:
[1]MIN J H, LEE Y C. Bankruptcy prediction using support vector machine with optimal choice of kernel function parameters[J]. Expert Systems with Applications, 2005, 28 :603-614.
[2]BAHRAMMIRZAEE A. A comparative survey of artificial intelligence applications in finance: artificial neural networks, expert system and hybrid intelligent systems[J].Neural Comput & Applic,2010,19:1165-1195.
[3]HAMDANI T M, ALIMI A M, FAKHRI K. Enhancing the structure and parameters of the centers for BBF fuzzy neural network classifier construction based on data structure[A]// Proceedings of the International Joint Conference on Neural Networks[C]. Piscataway NJ: IEEE, 2008: 3174-3180.
[4]MOSCATO P. On evolution, search, optimization, genetic algorithms and martial arts: towards memetic algorithms[A]//Tech. Rep. Caltech Concurrent Computation Program [C]. Pasadena, California, USA, 1989: 1-67.
[5]NORA S,CHRISTIAN S, ANDREAS Z.A memetic clustering algorithm for the functional partition of genes based on the gene ontology[C]//Proc of the 2004 IEEE Symposium on Computational Intelligence in Bioinformatics and Computational Biology.San Diego,USA,2004:252-259.
[6]DAWKINS R. The selfish gene[M].UK:Oxford University Press,1976.
[7]MOSCATO P, NORMAN M G. A memetic approach for the traveling salesman problem-implementation of a computational ecology for com-binatorial optimization on message-passing systems[C]// Proceedings of the International Conference on Parallel Computing and Transport Applications. Amsterdam:IOS Press,1992: 177-186.
[8]RADCLIFFE N J, SURRY P D. Formal memetic algorithms[J]. Evolutionary Computing, 1994,865: 1-16.
[9]XU Xin,HE H G.A theoretical model and convergence analysis of memetic evolutionary algorithms[C]//Proc of Int Conf on Natural Computation.Changsha,2005:1035-1043.
[10]KENNEDY J. EBERHART R C. Particle swarm optimization [A]// Proceedings of IEEE, International Conference on Neural Networks [C]. Piscataway NJ:IEEE, 1995: 1942-1948.
[11]KENNEDY J. The particle swarm: social adaptation of knowledge [A]//Preceedings of Evolutionary Computation [C] ,Indianapolis: IEEE, 1997:303-308.
[12]EBERHART R C, SHI Y H. Particle swarm optimization: developments, applications and resources [A]//Proceedings of the IEEE Congress on Evolutionary Computation [C]. Piscataway, USA: IEEE Service Center, 2001:81-86.
[13]吳啟迪,汪鐳. 智能微粒群算法研究及應用[M]. 南京:江蘇教育出版社,2005-04.
[14]AKAGI T, SUGENO M. Fuzzy identification of systems and its application to modeling and control[J]. IEEE Transactions on Systems, Man, and, Cybernetics, 1985,15(1): 116-132.
[15]黃福員. 金融風險預警的MPSO-FNN模型構建與應用[J]. 計算機工程與應用,2009,45(14):210-212.
[16]ALTMAN E I, MARCO G, VARETTO F. Corporate distress diagnosis: comparisons using linear discriminant Ana analysis and neural networks[J]. Journal of Banking and Finance, 1994, 18: 505-529.
[17]李志輝, 李萌. 我國商業銀行信用風險識別模型及其實證研究[J]. 經濟科學, 2005(5): 61-71.
[18]財政部統計評價司. 企業績效評價問答[M]. 北京:經濟科學出版社, 1999.
[19]章彰. 解讀巴塞爾新資本協議[M]. 北京: 中國經濟出版社, 2005.