周晶平
(中南民族大學 計算機科學學院,湖北 武漢 430074)
商業銀行在經營過程中,獲得了大量的業務數據和客戶信息,如何利用數據挖掘技術在這些海量數據中進行高層次的數據分析,為銀行經營提供科學的決策依據是每個商業銀行面臨的問題.對于我國的金融機構而言,數據挖掘項目不是一個新鮮的話題,卻是一個缺少成功答卷的命題.文中在分析銀行客戶關系管理系統的基礎上,研究銀行分析型CRM的體系結構、主要功能,數據挖掘過程和挖掘方法.探討數據挖掘在銀行分析型CRM應用中存在的問題和解決辦法.

圖1 銀行CRM系統結構
我國商業銀行采用計算機化管理已有多年,多種業務系統遍及省、市、縣各級業務部門,數據信息在物理上較為分散,歷史數據也極為龐大.因此,銀行CRM系統可以采用分布式數據倉庫環境,即所有分行均擁有自己的CRM系統,并與本地綜合業務系統及呼叫中心連接.在總行建有CRM中心數據倉庫,提供面向全行的分析決策功能,并為網上銀行業務提供數據查詢支持.網上銀行的客戶信息直接在總行的CRM數據倉庫中集成,各分支機構可以調用總行數據倉庫中的客戶信息,銀行CRM系統結構如圖1所示.
銀行CRM系統由業務處理、客戶聯系和客戶關系分析中心三部分組成.客戶關系分析中心則以CRM中心數據倉庫為核心,數據集成系統與業務處理部分連接,同時為銀行的管理層和業務分析人員提供客戶分析服務.

圖2 系統體系結構
2.1系統的體系結構分析型CRM系統的設計主要利用數據倉庫、數據挖掘、聯機分析等技術,其主要原理是將交易所累積的大量數據過濾,抽取到數據倉庫,再利用數據挖掘技術建立各種行為預測模型,最后利用圖表、曲線等對企業各種關鍵運行指標以及客戶市場分割情況向操作型應用發布,達到成功決策的目的[1].銀行分析型CRM系統體系結構如圖2所示.
2.2系統功能分析分析型CRM的目的是幫助銀行了解自身經營情況,準確地發現贏利客戶和具有贏利潛力的客戶,分析客戶的消費傾向,幫助銀行開發適應消費者需求的新產品,為銀行贏得客戶提供有力的保障[2].其主要功能包括:(1)對客戶進行評價.分析誰是銀行的客戶,誰對銀行貢獻度大,根據風險收益對應理論,嚴格控制風險,爭取最大收益.(2)客戶流失分析.挽留一個已有客戶的成本要遠遠低于爭取一個新客戶.銀行通過CRM系統分析客戶的嗜好、興趣和注意力,根據客戶的愛好調整自己的產品和服務,通過分析客戶的抱怨、建議、咨詢等信息不斷改進自己的服務水平,贏得客戶的滿意,防止客戶流失.通過分析客戶對產品的應用頻率、持續性等指標判斷客戶的忠誠度,從而對忠誠客戶提供優惠服務.(3)防范金融風險,提高經營效益.通過CRM對不斷發展的客戶市場進行研究和評價,找出潛在的大客戶和風險較大的客戶,適時地選擇恰當的市場準入和退出策略,及時做出積極主動響應,控制金融風險,使經濟效益最大化.(4)為銀行創新產品提供依據.通過CRM研究銀行的發展趨勢和市場的發展變化,創新金融產品和服務,爭取在競爭中立于不敗之地.

圖3 數據挖掘基本步驟
3.1數據挖掘過程在銀行分析型CRM中,數據挖掘是從大量的有關客戶數據中挖掘出隱含的、先前未知的、對金融企業決策有潛在價值的知識和規則.數據挖掘的實施并不能一蹴而就,是一個循序漸進、循環反復、不斷調整的過程.一般來說,銀行CRM中的數據挖掘主要包括[3](如圖3):(1)確定分析和預測目標.CRM在進行數據挖掘時,首先需要明確商業目標,即你想通過數據挖掘解決的問題,達到的目的.還要將準備解決的問題轉化為可以測量的目標,即數據挖掘的成功準則.(2)數據選擇.對基礎數據進行了解和選擇.比如,數據從哪里獲得?數據倉庫是否建立?內部數據是否可直接使用?數據哪些字段是必要的?通過數據選擇可以對基礎數據建立基本的可信度.(3)數據準備.對選擇的數據進行必要的預處理、轉換,以消除數據噪音,提高數據的完整性、準確性和可信度.(4)模型構造.這是數據挖掘的關鍵階段,這一階段的主要工作有:根據挖掘的商業目標,選擇相應的數據挖掘技術,建立培訓數據和測試數據,利用培訓數據采用相應算法建立模型和模型解釋.(5)模型評估和校驗.使用測試數據對建立的模型進行測試,計算誤差率,如未達到預期目標,則根據誤差原因,重新回到模型構造或數據選擇階段,重復相關過程,直至找到滿意的模型.(6)部署和應用.建立滿意的模型后,就可以在整個企業內部署和應用模型.另外,在應用的過程中還要不斷的測試模型的成功概率,從而完善模型.
3.2數據挖掘的常用分析方法在銀行分析型CRM中,金融客戶數據挖掘中的常用分析方法包括:關聯規則挖掘方法、分類方法、聚類分析聚類方法[4]以及神經網絡分析方法等.
(1)關聯規則挖掘方法.關聯規則挖掘方法主要用于發現不同事件之間的關聯性,即一個事件發生的同時,另一個事件也經常發生.關聯分析的重點在于快速發現那些有實用價值的關聯發生的事件.其主要依據是事件發生的概率和條件概率應該符合一定的統計意義.(2)分類方法.分類在數據挖掘中是一項非常重要的任務.類分析就是通過分析樣本客戶數據庫中的數據,為每個類別做出準確的描述,或建立分類模型,或挖掘出分類規則,然后用這個分類規則對其他客戶記錄進行分類.分類模型也可用于預測.預測的目的是利用客戶的歷史數據紀錄中自動推導出對給定數據的推廣描述,從而對未來的客戶數據進行預測.(3)聚類方法.聚類是把一組個體按照相似性歸成若干類別,即“物以類聚”.聚類將沒有分類的記錄,在不知道應分成幾類時,按數據內在的差異性,合理地劃分成幾類,并確定每個記錄所屬類別.它的目的是使得屬于同一類別的個體之間的距離盡可能地小,而不同類別上的個體間的距離盡可能地大.(4)神經網絡的分析方法.神經網絡具有良好的魯棒性、自組織自適應性、并行處理、分布存儲和高度容錯等特性,非常適合解決數據挖掘的問題,能產生較好的預測效果.
對于我國的金融機構而言,數據挖掘項目不是一個新鮮的話題,卻是一個缺少成功答卷的命題.數據控掘技術在銀行分析型CRM應用過程中存在一些問題,影響了系統的運用:一是銀行花了很大精力建設的數據挖掘系統,沒有用戶或很少有人使用,二是數據挖掘的結果不能讓人滿意;三是系統靈活性不夠.數據挖掘作為非平凡的發現和探索過程,其需求具有很強的不確定性,需求變更相對頻繁.需求變更會涉及數據準備、模型算法及前端應用的一系列調整,使系統陷入疲于應付的狀態等.
為實現數據挖掘在銀行分析型CRM中的成功應用,應從以下兩個方面入手.
4.1應用層面(1)加強業務部門與技術部門的聯系與協調.CRM是一項業務管理戰略,但這一戰略的實施離不開技術的支撐,這就意味著技術部門與業務部門間必須密切合作,共同確定滿足業務發展戰略需要的技術與架構.對現有業務的理解往往決定著項目建設的成敗,所以信息技術部門在部署相關技術架構時,還需要明確業務部門的需求及業務處理的優先級.因此,如果雙方缺乏必要的合作,勢必會導致CRM系統不能很好地滿足企業整體業務的需求,影響CRM應用的效益.在項目實施過程中,組建一個由技術部門與業務部門共同參與的項目小組非常必要,這樣更有利于實現業務與技術的雙向溝通.
(2)注重挖掘過程.在數據挖掘課題中,大部分時間都是對問題的理解及數據的收集、處理和整理,對數據挖掘過程的掌握很重要.因此,數據挖掘技術應用于銀行CRM系統的實踐中,應注意本3個方面問題. ①要有明確的挖掘目標.數據挖掘并非是萬能的,它必須在確定的主題下才能發揮好的效果.銀行首先應該對涉及CRM系統的各類商業問題進行分類,選定合適的商業問題來分別進行挖掘處理;其次根據商業問題,從大量的銀行業務數據中選擇和識別這些數據,便于對數據進行有效處理,使之更加適應挖掘工具. ②前期準備工作至關重要.在數據挖掘的過程中,大部分時間都花在對問題的理解及數據的收集、處理和整理過程中.數據的質量決定挖掘結果的正確與否,在采集數據時應特別注意數據的準確性.③挖掘結果及時試用并反饋修整模型.挖掘結果的解釋十分重要,結果要及時反饋到決策人,為銀行的科學決策提供支持.同時,結果使用后要及時反饋給分析人員,以便對模型進行修正,為今后的數據挖掘提供資料.
4.2技術層面在銀行分析型CRM中,數據倉庫是數據挖掘的基礎,如果數據倉庫的數據質量不能得到保證,會嚴重降低數據挖掘的使用率和可信度,還可能給決策分析帶來災難的后果.如果數據挖掘能力不強,則系統不能滿足用戶要求.數據倉庫和數據挖掘是銀行分析型CRM應用中的兩個方面.
(1)數據倉庫.數據倉庫是企業信息系統中最為復雜的部分,特別是銀行、保險等金融企業,數據倉庫系統必須匯集來自眾多業務系統的數據,支持紛繁的業務分析,而且它還必須隨著業務需求的變化而不斷調整.因此,在數據倉庫建設中,要注意的方面有:①數據倉庫規劃.數據倉庫工程是為了滿足對經營管理決策支持的需要,在整個企業范圍內,建立統一協調的全局信息環境的龐大工程,是一項復雜的信息集成工程.在數據倉庫工程中,涉及的業務和技術面都比較廣,參加的業務部門多,頭緒繁雜.如果沒有一個統一的規劃,很難保證項目的成功實施.規劃應體現超前性,具有超前性的系統才會長久,才會更容易體現技術的先進性和業務的預見性.②元數據管理.數據質量直接影響數據倉庫系統的生命力.在數據倉庫系統中,元數據機制監測每次從數據源抽取數據的過程中,記錄有關錯誤的統計信息,從而為系統管理人員提供數據質量的信息,因此,必須重視元數據的管理[5].對元數據的管理,比較完備的方式是利用現成的產品工具進行管理.沒有工具時,元數據的管理體現為文檔管理,文檔的內容就是元數據,文檔應做到多樣、齊全,才能應付后續不可預見的風險.③ETCL(抽取、轉換、清洗和加載)過程,后臺處理系統是數據倉庫系統成功的基礎,在金融數據倉庫系統中,它從其他各個業務系統中抽取數據進行轉換、清洗、匯總和聚合,并加載到數據倉庫中,時間和速度在數據倉庫的ETCL過程中非常重要[6].如果技巧和方法不當,則加載效率不高.對銀行這樣的企業,可用于加載的時間非常短,每天的后續加載壓力會很大.因此,數據倉庫設計就應充分考慮這個問題.另外,數據倉庫無論從有儲方式,組織形式還是數據類型,與源系統都是不一致的.在ETCL過程中,一方面,ETCL過程本身可能帶來數據質量問題,要通過加強ETL階段的測試工作進行排除;另一方面,ETL人員通過對源數據的詳細查看,可以發現非常全面而細節的源數據質量問題.
(2)數據挖掘.數據挖掘是根據企業的既定業務目標和對大量的企業數據進行探索和分析、揭示隱藏的、未知的、規律性,或驗證已知的規律,并將其模型化的一種先進有效的方法.在銀行分析型CRM中,客戶數據挖掘能力是CRM系統的主要技術要求之一,對數據挖掘,關鍵在于對數據挖掘的算法、分法和應用的理解和掌握.由于每一個問題常常有幾種不同的算法可以解決,每種算法也都可以用來解決不同的問題[7].因此,對每種算法和應用的理解至關重要,需要非常熟悉,才能多方法融合,有機組合互補.
基于數據挖掘的銀行分析型CRM的應用是一項復雜的系統工程,在應用過程中獲得高層領導和管理層的支持及銀行員工的理解、協作和共同認可極為重要.同時,還需加強員工培訓和對最終用戶的支持,使他們能夠成功地應用這一系統,從而提升競爭力.
參考文獻:
[1] 何榮勤.CRM原理設計實踐[M].北京:電子工業出版社,2006.
[2] 張永虎.CRM系統及其在我國銀行業的應用分析[J].中國金融電腦,2002(3):67-70.
[3] 董寧.數據挖掘技術在CRM中的應用[J].計算機工程與應用,2007(6):1429-1431.
[4] 劉同明.數據挖掘技術及其應用[M].北京:國防工業出版社,2001.
[5] 聶茹.數據倉庫元數據建設思考[J].計算機應用研究,2005(2):57-57.
[6] 王克龍.數據倉庫中ETL技術的探討與實踐[J].計算機應用與軟件,2005(11):30-32.
[7] 鄒志文.數據挖掘算法研究與綜述[J].計算機工程與設計,2005(9):2304-2308.