[摘要] 本文闡述了在CRM中應用數據挖掘的必要性,給出了CRM的體系結構,介紹了應用SQLServer2005數據挖掘工具的流程,最后總結了目前存在的主要問題。
[關鍵詞] CRM 數據挖掘 SQLServer2005
一、前言
中小企業要想在激烈的市場競爭中謀生存求發展,就要努力提升自己的核心競爭力,從以往的“以產品為中心”的管理模式轉變為“以客戶為中心”的管理模式,這就需要構建客戶關系管理系統(CRM)。數據庫技術的成熟應用已使企業積累了大量的數據,管理層渴望從數據海洋里獲得關于客戶的準確的有價值的“知識”,利用這些“知識”實現客戶細分,保持老客戶,獲得新客戶。但是傳統的數據庫管理系統是面向應用的,只處理日常的經營業務,不具備智能數據處理的功能,如何獲得這些“知識”就促成了數據挖掘技術的產生。反過來,數據挖掘技術的發展使構建智能化CRM系統成為可能。概括地講,數據挖掘的任務是從數據倉庫中提取人們感興趣的,事先未知的,有用的或潛在有用的信息。
目前,國際上主流的數據挖掘工具有:SAS的Enterprise Miner;SPSS的Clementine;IBM的Intelligent Miner;Oracle的Darwin;Cognos的4Thought以及微軟的SQLServer2005挖掘平臺。選擇什么樣的數據挖掘工具,應該視企業的實際情況來定,功能最強的不一定是最合適的。考慮到中小企業CRM系統的以下特點:軟件開發和維護成本相對低;功能不是很復雜;數據量不是很大;容易與其他系統集成等,SQLServer2005挖掘平臺是最佳的選擇。
二、CRM的體系結構
基礎層為CRM系統提供Internet,Intranet,以及數據庫,數據倉庫,數據挖掘,聯機分析處理(OLAP)和Web服務等軟硬件技術支持。
操作層主要是提供以客戶為中心的市場、銷售、服務與支持等業務流程的自動化及擴展。包括銷售力量自動化(Sales force Automation,SFA)、企業營銷自動化(Enterprise Marketing Automation,EMA)、客戶服務與支持(Customer ServiceSupport)三個基本模塊。
分析層主要是利用數據挖掘技術,從共享的客戶數據倉庫中,提取有價值的信息,準確地了解客戶行為、期望、需要、歷史和與企業全面關系,為企業的戰略決策服務。
協同層基于協同產品商務,協同性不僅體現在對客戶信息的獲得和跟蹤方面,還強調在與客戶進行的一系列業務中,內部人員之間及內部與外部之間的高效互通及協作。
三、SQLServer2005數據挖掘的流程
1.定義企業問題
確定目前企業遇到的問題。例如分析客戶的流失情況,就要考慮這些問題:現有的客戶哪些客戶即將流失?現有客戶他們的流失概率如何?哪些因素造成了客戶的流失?不同類別之間客戶的流失情況有什么差別?如果某個客戶將要流失,他會在多長時間內流失?
2.數據準備
在企業信息化建設中,“三分技術,七分管理,十二分基礎數據”,所以數據準備是最關鍵的一個環節。CRM在整個生命周期中,都以客戶為中心,準確全面的客戶信息是構建CRM系統的基石。為了進行有效的客戶分析,這些信息必須在整個企業范圍都是一致的,可靠的,并且具有統一的,便于使用的編碼。然而,來源于歷史上各個數據庫的數據往往是異構的,不一致的,分散的,同時企業在收集客戶信息的過程中,存在局部,片面,重復的現象,因此,建立一個企業范圍內全局一致的客戶數據倉庫就非常必要,這是CRM成功的基礎。
SQLServer2005提供了數據平臺整合性服務,即SSIS(SQLServer2000稱之為DTS)。這是一個全新的企業級的數據抽取、轉換和加載(ETL)平臺,SSIS 使得企業能更容易地集成和分析來自多個異類數據源的數據,并且實現了對非傳統數據(Web Services,XML)的支持。
3.建立模型及評估
SQLServer2005提供了9種數據挖掘算法。用于預測的算法包括線性回歸,羅吉斯回歸,時間序列,人工神經網絡,用于分類的算法包括決策樹,貝葉斯概率分類,此外,還有關聯規則,聚集,文本挖掘。同一個商業問題,可以用幾種算法解決,通過調整參數再從中選擇一個最優方案。模型建立后,必須對模型檢測和評估。在數據挖掘過程中,通常將數據集分為三部分:
(1)訓練集:主要用來建立最初的挖掘模型。
(2)評估集: 對同一數據集可以建立不同挖掘模型,當各個模型建立后,則需要針對不同模型效果進行比較,評估集則是用來評估不同模型的執行效果。
(3)測試集:此數據集主要用于測試模型,并對模型進行修正。在數據挖掘建模過程中,建立、測試和評估模型是一種反復循環的程序,模型的效果會隨著不同數據集而有異,因此模型建立完成后應加以測試。同一數據集可以采用不同挖掘算法建立不同的挖掘模型,對于不同模型的效果,也必須加以比較評估,選擇最適合的挖掘模型。SQLServer2005提供的評估方法有:Mining Accuracy Chart,Lift Chart-累積增益圖,Classification Matrix-錯差矩陣。
4.模型的發布與整合
將挖掘的分析結果發布到商業模型中,達到自動化預測的效果,以提升營運利潤、改善商業流程。CRM與企業資源計劃(ERP),電子商務(EC),供應鏈管理(SCM)和其他遺產系統的集成將有利于把挖掘的分析結果進一步轉換成企業經營管理實實在在可利用的信息。SQLServer2005提供了DMX、AMO 、XMLA等技術以及分析服務(Analysis Services)和報表服務(Reporting Services)。
四、結束語
構建基于SQLServer2005挖掘平臺的CRM系統,重在應用,難在應用。一個企業要想使技術投資獲得較高的收益,必須重視決策的效率和準確性問題。這是目前數據挖掘技術應用的薄弱環節。具體表現在:數據分析過程缺少方法論指導;數據挖掘過程與特定商業邏輯脫節;自動化和智能化程度低。因此,在應用數據挖掘技術的道路上,還有很多困難,難題等待我們去克服。
參考文獻:
[1]Jiawei Han:數據挖掘概念與技術.機械工業出版社,2002.9出版
[2]Alex Berson:構建面向CRM的數據挖掘應用.人民郵電出版社,2001.8 出版
[3]張阿蘭:數據挖掘任務之二:預測[J].中國統計.2004.1
[4]米天勝:數據倉庫和數據挖掘在客戶關系管理中的應用[J].情報技術,2006.9
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文