[摘要] 國內外電子商務類網站日益興起。許多電子商務類網站都提供了一定程度的個性化服務,最明顯的就是提供商品推薦服務。而構成這些個性化服務的基礎主要就是數據挖掘技術。本文研究了數據挖掘技術及其在電子商務中客戶細分的應用,提出了數據挖掘在電子商務營銷服務各方面的具體應用內容。
[關鍵詞] 數據挖掘 客戶細分 聚類算法
一、數據挖掘在電子商務中的引入與應用
數據挖掘(Data Mining),又稱數據庫中的知識發現(Knowledge Discovery In Database,KDD),是指從大型數據庫或數據倉庫中提取隱含的、未知的、非平凡的及有潛在應用價值的信息或模式,它是數據庫研究中的一個很有應用價值的新領域。數據挖掘技術在電子商務領域中得到了比較普遍的應用,它是以市場營銷學的市場細分原理為基礎,其基本假定是“消費者過去的行為是其今后消費傾向的最好說明”。對所識別出來的消費群體進行特定內容的定向營銷,這與傳統的不區分消費者對象特征的大規模營銷手段相比,大大節省了營銷成本,提高了營銷效果,從而為企業帶來更多的利潤。
數據挖掘是進行數據查詢,它能夠找出過去數據之間的潛在聯系,從而促進信息的傳遞。數據挖掘工具能夠對將來的趨勢和行為進行預測,從而很好地支持人們的決策。將其運用到客戶關系管理中,就能在數據量龐大的客戶數據庫中,將看似無關聯的數據進行篩選,凈化,提取出有價值的客戶關系,對客戶需求作出恰當的回應,并預測需求趨勢。
二、聚類算法用于電子商務客戶細分
聚類是數據挖掘中的一種主要技術,是把一組個體按照相似性歸成若干類別,即“物以類聚”。它的目的是使得屬于同一類別的個體之間的距離盡可能地小,而不同類別上的個體間的距離盡可能地大。聚類和分類根本不同的是:分類問題中我們知道訓練例的分類屬性,而在聚類中,就需要我們在訓練例中找到這個分類屬性值。聚類分析問題可描述為:給m維空間Rm中的n個向量,把每個向量歸屬到S聚類中的某一個,使得每個向量與其聚類中心的“距離”最小。聚類分析問題的實質是一個全局最優問題。在這里m可認為是樣本參與聚類的屬性個數,n是樣本的個數,S是由用戶預先設定的分類數目。本文采用層次方法實現聚類分析。
層次方法就是對給定的數據對象集進行層次的分解。根據層次的分解如何形成,層次聚類分析算法分為“分解算法”和“凝聚算法”,分別體現了“自頂向下”和“自底向上”兩種互逆的思想。分解算法從整個樣本集開始,把它分成幾個子集,然后把每個子集分成更小的集合,逐步分區,最終,分區算法生成一個由粗到細的分區系列。凝聚算法首先把每個單獨的對象當作一個初始類。然后把這些特征相近的合并成一個更粗略的分區,反復合并直至得到最后一個分區,所有的對象都在一個大類內。這種聚類過程是一個自底向上的過程,分區是從細到粗。在凝聚或者分裂層次聚類方法中,通常以用戶定義希望得到的類的數目作為結束條件。在類的合并或分裂過程中,需要考察類間的距離。分解算法和凝聚算法的過程示意如圖所示:
1.聚類算法的處理流程
(1)從n個數據對象中任意選取k個對象作為初始聚類中心;
(2)循環過程3、4,直到每個聚類不再發生變化;
(3)計算每個對象與聚類中心距離,根據最小距離把對象歸到最相似的類中;
(4)重新計算整個聚類對象的均值,作為新的聚類中心。
2.聚類算法框架
(1)給出n個混合樣本,令I=1,選取K個初始聚類中心 Zj(I), j=1,2,3,…,K;
(2)計算每個樣本與聚類中心的距離
D(xi,Zj(I)), i=1,2,3,…,n, J=1,2,3,…,K
如果滿足
D(xi,Zk(I))=min{D(xi,Zj(I)), i=1,2,3,…,n}
則xi ∈wk;
(3)令I=I+1,計算新的聚類中心
Zj(2)=Xi(j), j=1,2,3,…, K
和誤差平方和準則Jc值
Jc(2)= 2
(4)判斷:若(Jc(I+1)- Jc(I))<ξ,則算法結束,否則I=I+1,返回2步。
利用以上規則可以發現對公司營銷十分有用的模式。給出分類模型后,要用測試集評估模型的預測正確率,測試集中的數據是從樣本集中隨機取出并獨立于訓練樣本的。模型的準確率可以用被模型正確分類的測試樣本的百分比表示,若模型的準確率是可以接受的,公司就可以依據模型將客戶群分類,針對不同的客戶群展開有針對性的業務。
至此,已經初步完成了一個聚類算法的分類技術用于客戶分類的簡單示例。但實際應用中大多數決策樹分類過程要復雜得多,計算量也要大很多,這主要是因為用于分類的樣本數據量往往很大,屬性字段也很多,而且決策樹的生成算法也有很多,選擇何種算法也是一個反復綜合評估的過程。
三、結論
隨著電子商務的日益興起,對電子商務進行數據挖掘,讓電子商務網站可以提供更具個性化的服務,可以提高電子商務網站的競爭力,以實現更大的商業價值。本文在探討了電子商務中引入數據挖掘技術,詳細闡述了該技術在客戶關系管理的客戶細分中的重要應用及其實現。
參考文獻:
[1]帕翠珊·B·希波爾德:客戶關系管理理念與實例[M].北京:機械工業出版社,2002
[2]周良等.客戶關系管理系統設計與研究.計算機研究與應用,2002.9(108~131)
[3]威廉·G·齊克蒙德等:客戶關系管理.北京:中國人民大學出版社,2005
[4]崔杰張穎:數據挖掘技術在CRM中的應用.遼寧工學院學報,2006
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。