【摘要】本文闡述了研究數據挖掘技術在客戶關系管理(CRM)中所起的核心作用、對我國企業成功實施CRM戰略、提高競爭能力的意義及數據挖掘技術流程、標準化模型。
【關鍵詞】客戶關系管理;數據挖掘;流程;模型
隨著市場經濟的發展,企業將面臨強大的競爭壓力,企業的產品越來越趨向于同質化,僅僅依靠產品本身很難在日趨激烈的競爭中取勝,所以愈來愈多的先進企業將重點從以產品為中心向以客戶為中心的新型商業模式轉移,客戶關系管理(CRM)也就應運而生。客戶關系管理(Customer Relationship Management)簡稱CRM,是由美國的Gartner Group me公司于1999年首先提出的。CRM是一種以客戶為中心的經營策略,它以信息技術為手段,并對工作流程進行重組,以賦予企業更完善的客戶交流能力,最大化客戶的收益率。CRM就是企業為了保持競爭力,采取的面向客戶、客戶驅動和以客戶為中心的發展策略。而企業在與客戶交互過程中積累下來的各種客戶數據恰恰是反映客戶特征和需求的最佳載體。當今許多企業的數據庫或數據倉庫中都搜集和存儲了大量關于客戶的寶貴數據,這些數據涵蓋了從客戶基本數據、購買記錄及客戶反饋的個個環節。充分利用這些數據,深入分析、挖掘隱含在這些數據中的有用信息,將有助于企業更好地管理客戶關系,實現CRM的功能和目標。然而,由于缺乏在大量數據中發現深層次信息的能力,許多企業對于這些數據的利用還只是停留在基礎層的瀏覽、檢索、查詢和應用層的繼承、組合、整理等方面,而無法將這些數據轉化為更加有用的知識。因此,如何更加有效地管理企業數據庫中快速增長的海量數據,將數據資源的利用提高到知識創新的高級階段,已經成為企業當前需要迫切解決的問題,數據挖掘(Data Mining簡稱DM)技術的運用就可以幫助企業很好地解決這個問題。
一、數據挖掘的流程
數據挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在的和有用的信息和知識的過程,它可以按照企業既定的業務目標自動地從數據庫中提取出用以輔助企業決策的相關模式。數據挖掘的流程圖如下:
圖1中各步驟(1)確定業務對象。清晰地定義出業務問題,認清數據挖掘的目的是數據挖掘的重要一步。挖掘的最后結構是不可預測的,但要探索的問題應是有預見的,為了數據挖掘而數據挖掘則帶有一盲目性,是不會成功的。(2)數據準備。一是數據的選擇。搜索所有與業務對象有關的內部和外部數據信息,并從中選擇出適用于數據挖掘應用的數據。二是數據的預處理。研究數據的質量,為進一步的分析做準備。并確定將要進行的挖掘操作的類型。三是數據的轉換。將數據轉換成一個分析模型,這個分析模型是針對挖掘算法建立的。建立一個真正適合挖掘算法的分析模型是數據挖掘成功的關鍵。(3)數據挖掘。對所得到的經過轉換的數據進行挖掘。除了完善從選擇合適的挖掘算法外,其余一切工作都能自動地完成。(4)結果分析。解釋并評估結果,其使用的分析方法一般應作數據挖掘操作而定,通常會用到可視化技術。(5)知識的同化。將分析所得到的知識集成到業務信息系統的組織結構中去。
二、數據挖掘流程的模型
數據挖掘業內,公認的兩大模型是SAS的SEMMA和包括SPSS在內的行業協會提出的CRISP-DM。SEMMA強調的是應用的方法;CRISP-DM則從方法學的角度強調實施數據挖掘項目的方法和步驟。CRISP-DM是站在高處,在講一個總體大方向;而SEMMA在說具體應該如何著手。
1.SEMMA。(1)Sample──數據取樣。當進行數據挖掘時,首先要從企業大量數據中取出一個與企業要探索問題相關的樣板數據子集。通過數據取樣,要把好數據的質量關,一定要保證取樣數據的代表性、真實性、完整性和有效性,這樣才能通過此后的分析研究得出反映本質規律性的結果。根據具體的需求,可以創建訓練集、測試集和效驗集。(2)Explore──數據特征探索、分析和預處理。當用戶拿到了一個樣本數據集后,它是否達到用戶原來設想的要求,有沒有什么明顯的規律和趨勢,有沒有出現用戶所從未設想過的數據狀態,各因素之間有什么相關性,可區分成怎樣一些類別,這些都是首先要探索的內容。(3)Modify──數據調整和技術選擇。在問題進一步明確化的基礎上,用戶可以按照問題的具體要求來審視數據集,看它是否適應企業問題的需要。針對問題的需要,可能要對數據進行增刪,也可能按照用戶對整個數據挖掘過程的新認識,組合或者生成一些新的變量,以體現對狀態的有效描述。(4)Model──模型的研發和知識的發現。數理統計方法是數據挖掘工作中最常用的主流技術手段。應用SAS提供的多種分析工具不僅能揭示企業已有數據間的新關系、隱藏著的規律性,而且能預測事件的發展趨勢。用戶采用哪一種模型,主要取決于數據集的特征和用戶要實現的目標。另一方面,數據挖掘是一個反復的不斷深化的實踐過程,用戶可在實踐中選出最適合的模型。(5)Assess──模型和知識的綜合解釋和評價。經過以上五個步驟,用戶將會得出一系列的分析結果、模式或模型,常常是對目標問題多側面的描述。這時,就要能很好地綜合這些規律性,為企業提供合理的決策支持信息。
2.CRISP-DM。(1)業務理解(Business Understanding)。最初的階段集中在理解項目目標和從業務的角度理解需求,同時將這個知識轉化為數據挖掘問題的定義和完成目標的初步計劃。(2)數據理解(Data Understanding)。數據理解階段從初始的數據收集開始,通過一些活動的處理,目的是熟悉數據,識別數據的質量問題,首次發現數據的內部屬性,或是探測引起興趣的子集去形成隱含信息的假設。(3)數據準備(Data
Preparation)。數據準備階段包括從未處理數據中構造最終數據集的所有活動。這些數據將是模型工具的輸入值。這個階段的任務有個能執行多次,沒有任何規定的順序。任務包括表、記錄和屬性的選擇,以及為模型工具轉換和清洗數據。(4)建模(Modeling)。在這個階段,可以選擇和應用不同的模型技術,模型參數被調整到最佳的數值。一般,有些技術可以解決一類相同的數據挖掘問題。有些技術在數據形成上有特殊要求,因此需要經常跳回到數據準備階段。(5)評估(Evaluation)。在開始最后部署模型之前,重要的事情是徹底地評估模型,檢查構造模型的步驟,確保模型可以完成業務目標。此階段的關鍵目的是確定是否有重要業務問題沒有被充分的考慮。在這個階段結束后,一個數據挖掘結果使用的決定必須達成。(6)部署(Deployment)。通常,模型的創建不是項目的結束。模型的作用是從數據中找到知識,獲得的知識需要便于用戶使用的方式重新組織和展現。根據需求,這個階段可以產生簡單的報告,或實現一個比較復雜的、可重復的數據挖掘過程。
參考文獻
[1]Margaret H.Dunham.數據挖掘教程[M].清華大學出版社,2005
[2]魏兵.數據挖掘技術在客戶關系管理中的應用研究[D].南京理工大學碩士.2005
[3]章兢,張小剛.數據挖掘算法及其工程應用[M].機械工業出版社,2006(6):56~73
[4]趙閃.數據挖掘在客戶關系管理中的應用研究[D].廣東工業大學碩士學位論文.2007
[5]邵兵家,于同奎.客戶關系管理一理論與實踐[M].清華大學出版社,2004
[6]賈月娥.客戶關系管理趨勢談[J].管理信息化.2003
[7]馬剛,李洪心,楊興凱.客戶關系管理[M].東北財經大學出版社,2005
項目課題:本文系佳木斯大學大學生科技創新項目課題,課題編碼:Dz2011-097。