任秀春,賀亞吉
(渤海大學 管理學院,遼寧 錦州 121013)
電子商務的快速發展,為社會提供了豐富的商品信息和商業模式,但是電子商務并不能像傳統的銷售模式那樣為客戶提供個性化的導購信息[1]。隨著網絡上的商品數量越來越多,客戶很難在短時間內尋找到自己感興趣的商品信息,從而使客戶瀏覽大量的不相關信息,進而客戶將失去網購的耐心而離開。因此,對客戶的購買行為進行數據挖掘,為客戶進行個性化服務已經成為電子商務發展的必然趨勢。

圖1 數據挖掘結構圖Fig. 1 Structure diagram of the data mining
數據挖掘技術在商業領域已經有了非常廣泛的應用[2],電子商務作為一種新的商業模式,每天都會產生海量的交易數據,因此,需要借助數據挖掘技術對這些數據進行整理和分析,以期尋找有價值的信息。面向電子商務的數據挖掘主要是通過網站來收集客戶信息,利用數據挖掘技術對網站內容進行改進。例如為客戶提供感興趣的產品推薦等個性化頁面,或者分析產品的銷售情況,為企業的生產及銷售提供依據,實現以數據為中心的個性化營銷方式,滿足客戶的個性化需求[3]。一個典型的數據挖掘流程如圖1所示。
利用數據挖掘技術為電子商務提供定制化和個性化的產品與服務,既可以提高客戶的滿意度,有可以擴展用戶的購買需求,從而實現利潤最大化。
一個完整的數據挖掘過程可以分為數據的清洗與集成,數據的選擇與轉換,數據挖掘、結果的評估與表示等[4]。數據挖掘過程是一個反復、迭代的過程,具體的過程如圖2所示。
依據圖2,分別討論數據挖掘的過程。
1)數據的清洗與集成
由于數據庫中存放的數據存在大量的無效和錯誤信息,因此需要對數據進行整理與合并,提取適合分析的數據信息,清理無關的記錄,并進行異構格式間的轉換。

圖2 數據挖掘的基本過程圖Fig. 2 Basic flow chart of data mining
2)數據的選擇與轉換
在這個步驟中,主要采用統計模型來分析數據規律,解釋數據間的關系,發現事物的規律。通常使用的統計方法包括線性分析、線性回歸、因子分析、單變量區限和雙變量統計等。
3)數據挖掘過程
使用人工智能、決策樹分析、遺傳算法等技術手段,對得到的模式進行數據分析,并使用分類、聚類、關聯規則等方法進行數據挖掘。
4)表示與評價
在得到數據挖掘結果以后,要將這些結果輸出并進行表示,將符合需要的知識選擇出來。例如在銷售預測模型中,對會員信息進行搜集和整理,并對這些信息使用分類模型進行預測,識別出可能產生購買行為的會員,并對這些會員進行有針對性的營銷活動。
決策樹是一種基于樹型結構的分類模型,決策樹的每個節點表示分類的屬性。使用決策樹進行分類預測時,從決策樹的根到葉子節點形成一條選擇路徑,這條路徑可以作為分類規則用來進行相應對象的類別預測[5]。
數據挖掘技術可以應用到企業管理客戶生命周期的每一個階段,能夠幫助企業對客戶進行分類,分析客戶的屬性特征,可以使企業針對客戶類別提供個性化服務,也可以使用數據挖掘技術對客戶的購買行為進行分析,防止客戶的流失,提升客戶忠誠度[6]。圖3所示的為一個面向客戶關系的數據挖掘過程。

圖3 面向客戶關系的數據挖掘過程圖Fig. 3 Flow chart of data mining orient customer relationship
某網站希望通過廣告宣傳來吸引顧客購買商品,通過網站獲取會員的購買信息,并將廣告宣傳投遞給相關會員。由于網站會員數量眾多,完全投遞的效果并不理想,因此,將廣告宣傳投放給有購買意愿的客戶就顯得尤為重要。
實驗從所有會員中隨機抽取1 000個會員,向這些會員投遞廣告宣傳冊,然后記錄這些收到廣告宣傳冊的用戶是否購買了該網站的商品,部分調查數據結果如表1所示。

表1 網站會員的部分調查結果Tab.1 Particular result of website members
在分類模型中,每個會員作為一個事例,會員的婚姻狀況、性別、收入等作為輸入列,所需預測的分類是客戶是否購買了該網站的商品。構造如圖4所示的決策樹分類模型,圖中矩形表示一個拆分節點,矩形中的文字表示拆分條件。

圖4 決策樹分類圖Fig. 4 Classification diagram of the decision tree
經過如圖4的決策樹分類后,在第一次基于年齡的拆分結果,年齡小于20歲的包含148個事例,年齡在20歲到40歲之間的有722個事例,年齡在40到60歲之間的有96個事例,年齡大于60歲的有34個事例。
經過對決策樹模型的運算,可以得到以下有用的節點:
1)年齡小于20歲,在城市生活的人有64.9%人通過網絡購買了網站產品。
2)年齡在20到40歲之間,且收入大于5 000,并且學歷是大學的人有89.1%的人參與了網購。
3)年齡在40到60歲之間的,且教育背景為大學的有43.8%的人參與了購買網站產品。
在使用該決策樹分類模型后,對于網站的會員就可以進行分類預測,計算會員購買產品可能性的概率,網站可以依據計算結果有針對性的對會員進行個性化營銷。
本文構建了一個基于決策樹分類方法的電子商務數據挖掘過程,通過實驗的方式在網絡客戶分類系統中應用決策樹方法,實驗結果表明,通過使用決策樹方法可以有效地在大量的客戶信息中尋找有價值的信息,可以有效地對網絡客戶進行分類預測。
[1] 張野, 明茹雪, 楊帆. 電子商務發展指數的測算模型構建方法[J].電子設計工程,2012(22):149-150.ZHANG Ye, MING Ru-xue, YANG Fan. Model and empirical analysis of E-commerce development index[J]. Electronic Design Engineering,2012(22):149-150.
[2] Papamiehail G P.The k-means range a1gorithm forpersona1-ized data clustering in E-commerce[J].European Journal of Operational Research,2008,176(1):1233-1250.
[3] 蔡宏艷,姚佳麗,王珊. DETECTOR: 基于關系數據庫通用的在線關鍵詞查詢系統[J]. 計算機研究與發展,2007,12(1):120-124.CAI Hong-yan,YAO Jia-li,WANG Shan.DETECTOR:base on a relational common database online keyword query sys-tem [J].Computer Research & Development,2007,12(1):120-124.
[4] 屈正庚,唐曉琴. 基于電子商務中的數據挖掘技術研究[J].電子設計工程,2009(22):37-39.QU Zheng-geng,TANG Xiao-qin.Research of data mining technology based on electronic commerce[J].Electronic Design Engineering,2009(22):37-39.
[5] 姜欣,徐六通,張雷. C4.5決策樹展示算法的設計[J].計算機工程與應用,2003,8(4):93-95.JIANG Xin,XU Liu-tong,ZHANG Lei.The design of C4.5 decision tree presentation algorithm[J].Computer Engineering and Application, 2003,8(4):93-95.
[6] 朱鎮,趙晶,谷文輝,等.傳統企業電子商務戰略感知評估研究[J].中國地質大學學報,2007(1):47-51.ZHU Zhen,ZHAO Jing,GU Wen-hui,et al.The evaluation of E-business strategic perception for traditional firms [J].Journal of China University of Geosciences,2007(1):47-51.