張建珍 張秀珍 周星星
摘 要:本文以銀行業務數據為研究對象,結合聚類分析和模糊數學中模糊相似矩陣的思想,將模糊數學理論應用于聚類分析中,提出了基于模糊聚類分析的綜合排序方法,即模糊聚類法。本文采用該算法對現有銀行客戶的存、貸款、信用卡、轉賬結算等業務的總體情況進行綜合排序,以便于銀行客戶經理根據排序結果,對不同客戶采取支持、維護或淘汰等不同的分類管理策略,最大限度降低銀行的客戶管理成本。
關鍵詞:模糊聚類;銀行客戶;綜合排序;分類管理
中圖分類號:TP391.41 文獻標識號:A 文章編號:2095-2163(2014)06-
Abstract: Based on bank business data, this paper combined with clustering analysis and fuzzy similar matrix in fuzzy mathematics, applying the fuzzy mathematics theory to clustering analysis, puts forward the comprehensive sorting method based on fuzzy clustering analysis,namely the fuzzy clustering method. The algorithm is applied to order the existing bank customer deposits and loans, credit cards, the general characteristics of the transfer settlement business.According to the result of sorting,the bank customer manager will differently deal with the selected customers,which to support,and which t o maintain or eliminate.As a result,the bank customer manager takes different management strategies to save maximally customer management costs of the bank.
Keywords:Fuzzy Clustering; Bank Customers; Comprehensive Sorting; Classification Management
0 引 言
隨著市場存、貸款利率的逐步放開,銀行、小額貸款公司、投資管理公司等金融業間的競爭日益激烈,而金融業間的競爭根本上則是對客戶的爭奪。隨著信息科技的飛速發展,金融企業在自身經營中也積累了大量的業務數據。如何依托企業內部的金融數據系統通過數據挖掘技術進行數據分析,從企業內部存儲的大量數據資料中提取不同客戶的屬性,據此確認客戶的喜好和行為特征,進而對現有客戶進行分類管理,實現有針對性的營銷、維護及淘汰,如此則不僅有利于穩定和拓展銀行業績,同時,也能夠最大限度降低管理客戶的相關費用。
1 模糊聚類思想
模糊聚類包括模糊與聚類,主要是指在對現有的大量模糊、隨機的實際應用數據在挖掘[1]過程中發現(KDD)知識的方法統稱。模糊集法、以及聚類就是利用數據挖掘進行數據分析時較為常用的方法,其他還有神經網絡法、遺傳算法、決策樹法、統計分析法等。
具體來說,模糊集法是利用模糊集合理論對實際問題進行模糊評判、模糊決策、模糊模式識別和模糊分析的一組完整的研究實現技術。復雜性越高的系統,使用該方法模糊性越強,效果將會越明顯。聚類即是將一組個體按照相似性原則歸于若干類別,實現“物以類聚”[3]。其目的在于縮短同一類別個體之間的距離,但卻保持不同類別的個體間差異(距離)要盡可能大。聚類方法有統計法、機器學習法等。
基于同類別個體的隸屬度取值范圍,可將聚類分為兩類,即硬聚類算法和模糊聚類算法。在模糊聚類法中,一個樣本同時屬于所有的類,但是可通過隸屬度的大小來區分其差異。該理論操作簡便,結果可信,且在實際生活中應用廣泛。
采用模糊聚類算法對銀行客戶進行分類管理時,其基本步驟通常為[2]:
(1) 現有客戶數據的標準化;
2.4 模糊聚類
以上研究完成后,即需對樣本數據進行模糊聚類。模糊聚類就是根據給定閾值水平,將最相似的對象聚為一類。研究中,找出與Xn+1為一類的對象,記下序號,其下標即為最優對象所在行的行號,而后刪掉該行,繼續排序,直至全部完成,由此即刻就可以得到所有客戶從優到劣的完整排序。具體排序結果表2所示。
3結束語
模糊聚類方法結合了模糊數學中的模糊相似矩陣的思想,可理解性強,允許數據性質的模糊性,可以應用于具有潛在關聯的數據聚類。樣本數據通過模糊聚類,得到了樣本數據屬于各個類別的不確定性程度,進而給出了樣本對于各個類別的不確定性描述。采用這種方法,在銀行等各種行業進行客戶分類均具有很好的實用性。
參考文獻:
[1]朱明.數據挖掘[M].安徽:中國科學技術大學出版社,2002.
[2]劉夫濤,張雷,艾波.多重系統聚類挖掘算法及其實現[J].計算機工程與應用,2000 (10):41-42.
[3]何曰光.模糊聚類算法及應用[J].石油儀器,2004,18(3):43-44.
[4]周紅芳,宋姣姣,羅作民.一種改進的模糊聚類算法[J].計算機應用, 2010,30(5):77-79.
[5]丁劍敏.數據挖掘技術及其在商業銀行中的應用[J].市場周刊·財經論壇,2013 (4):58-59.
[6] 王明哲.基于數據挖掘技術的信用卡客戶的信用評價[J].商場現代化,2007(8):77-78.