鄭州航空工業管理學院實驗室管理處計算中心 王海燕 李曉玲
客戶關系管理(CRM,Customer Relationship Management),可以理解為應用信息技術為企業提供全面的、個性化的客戶資料,從而使客戶與企業間所有的過程和互動能夠有助于維系和拓展這種互利關系的一種商業戰略。其核心思想來自市場營銷理論,強調以客戶為中心,通過完善的客戶服務和深入的客戶分析來滿足客戶的需求,不斷提高客戶的滿意度和忠誠度,進而實現客戶的終生價值。在過去的幾年CRM已經變成每個企業獲得成功的重要部分。
而CRM的核心是客戶理解,“正確的客戶理解和由此引導的行動可提高顧客的終身價值。不恰當的客戶理解將導致冒險盲目的行動和措施 ”。因此本文利用數據挖掘中的聚類技術對客戶進行分析,理解客戶的分布和特征。
不同的數據挖掘工具可以從客戶數據庫抽取不同目的的信息,同時通過分析顧客的問題來為企業吸引更多的客戶。在數據挖掘中最早和最簡單的分析步驟是描述數據,例如,總結它的統計特征(例如平均值和標準差),用圖表和圖形可以形象地觀察,查看數據域內值的分布情況。用數據挖掘技術中的關聯規則來詳細地分析客戶的交易數據,從中得知顧客同時會購買哪些商品,基于規則可以組合流行產品,基于規則可以讓營銷人員和企業決策者制定市場營銷策略或操作規則,并且積極提供客戶感興趣的產品[1]。用數據挖掘中的聚類來為客戶進行分群,將具有相似消費行為的客戶歸為一組,理解客戶并提供相應的個性化服務。數據挖掘中的分類可以用于客戶行為預測,挖掘潛在消費人群,刺激其消費。
聚類,顧名思義,即物以類聚,人以群分。所以聚類的定義為將物理的或抽象對象的集合分成相似的對象類的過程成為聚類(cl ust er ing)[2]。簇(cl ust er)是數據對象的集合,這些對象與同一個簇中的對象彼此相似,而與其他簇中的對象相異。簡單地說,從人類對這個社會具有認知性開始聚類活動就一直存在,我們會通過不停地改進下意識的聚類模式來學習如何識別蘋果和梨,通過尋找和區分對象所具有的特征來區植物和動物等等。
聚類分析已經廣泛應用于圖像處理、模式識別、數據分析和市場研究等領域。在商業領域聚類能夠幫助市場分析人員根據顧客的購買模式從客戶數據庫中發現不同的顧客群,總結顧客群的特征,就是我們所說的“人以群分”,比如可以識別具有高水平索賠額的汽車保險持有者組群,進而提出具有針對性的市場營銷策略。在生物領域,聚類分析可以用來推導不同物種的分類,根據相似功能對基因進行分類,獲得對種群中固有結構的認識。
由聚類所用標準的不同可以將聚類分為劃分方法、層次方法、基于密度的方法和基于網格的方法。
下面依次經過數據預處理、算法分析、結果解釋和提出針對性意見等步驟來實現將聚類分析應用到客戶關系管理中。
本文所用數據為某4s店的客戶消費數據,為了便于分析,需要將某些屬性量化處理。將分類數據進行量化處理,以上挑選出的分類屬性有“車主姓名”、“性別”、“所在行業”、“車主婚姻狀況”、“車主教育狀況”、“車主家庭收入”、“配置”等。“車主家庭收入”的屬性值取的是一個個的取值范圍,比如“3000-5999元、6000-9999元、10000-14999元……30000-50000元、50000元以上”,所以也要對其進行量化處理。對于有高低之分的屬性取值如“車主教育狀況”、“車主家庭收入”、“配置”量化時就按數字從高到低進行。
DBSCAN算法為聚類分析技術中應用廣泛且成熟的經典算法,因此本文也選用此算法建模對數據進行分群分析。DBSCAN[3](Densit y-Based Spat ial Cl ust er ing of Appl icat ions wit h Noise)可處理噪聲的基于密度的空間聚類算法是一個基于密度的聚類算法。表1描述核心對象的定義是如果一個對象的ε鄰域內包含至少MinPts個數據對象,則此對象被稱為一個核心對象。DBSCAN具體步驟如下:

表1 DBSCAN算法描述
本次建模算法運行中參數設置MinPts=4,半徑ε= 0.9。

表2 聚類結果簇特征分析
經過分析數據集被劃分成四個簇,簇1包含3578條數據,所占比例為70%;簇2包含1240條數據,所占比例為24%;簇3包含123條數據,所占比例為2%;簇4包含181條數據,所占比例為4%。最后總結各個簇的特征,并給出相應的建議,如表2所示。
本文將聚類分析應用到客戶關系管理中,目的用來理解客戶,相比傳統的統計總結而言,本方法不僅可以根據客戶特征對客戶進行分群,還能更好的總結出各個群體的特征。
下一步嘗試將關聯規則分析、分類分析也應用到CRM中,利用關聯規則來詳細地分析客戶的交易數據,基于規則組合流行產品,讓營銷人員和企業決策者制定市場營銷策略或操作規則,并且積極提供客戶感興趣的產品,利用分類可以預測客戶行為,挖掘潛在消費人群,刺激其消費。
[1]Chen R S,Wu R C,Chen J Y,Data Mining Application in Customer Relationship Management Of Credit Card Business,in proceedings of the IEEE,29th Annual International Computer Software and Applications Conference,2005.
[2]Jiawei Han,Micheline Kamber著;范明,孟小峰譯.Data Mining Concepts and Techniques[M].北京:機械工業出版社,2004.
[3]Ester M,Kriegel H P,Sander J et al.A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise,Proceedings of 2nd Int.Conf.On Knowledge Discovery and Data Mining[C].Portland,OR,1996:226-231.