張勇杰,楊鵬飛,段 群,韓麗娜
(咸陽師范學院計算機學院,咸陽 712000)
?
基于關聯規則的商品智能推薦算法
張勇杰,楊鵬飛,段群,韓麗娜
(咸陽師范學院計算機學院,咸陽712000)
摘要:目前越來越多的消費者通過電子商務平臺購買商品,但是網絡購物系統提供大量的商品信息,這使得顧客無法快速地找到自己所需的商品。利用關聯規則算法完成商品的智能推薦,通過對用戶的歷史購買記錄進行分析,挖掘出客戶的購買興趣,向用戶推薦相應的關聯購買商品。實驗仿真結果表明,該文提出的算法是有效的、可行的,為用戶購買商品提供一定的輔助決策作用。
關鍵詞:關聯規則;商品推薦;數據挖掘
隨著互聯網和電子商務平臺的廣泛應用,通過網絡購物已經成為廣大消費者購買商品的主要形式之一[1-2]。但是,網絡信息過量給用戶帶來了很多不便,用戶不得不面對不同購物網站產生的大量信息,花費大量時間瀏覽或購買所需的商品。基于上述問題,用戶急需購物網站或系統具有商品智能推薦服務[3-4]。因此,本文給出了一個基于關聯規則的商品智能推薦算法,算法通過對用戶瀏覽和購買的商品信息進行分析,利用關聯規則中的Apriori算法挖掘商品之間的關聯關系,為用戶推薦喜歡的商品,達到輔助用戶決策的作用。
關聯規則概念[5]是由Agrawal、Imielinski和Swami等人提出的,是為了尋找大量商務數據庫中項集之間的有趣聯系,用來發現在同一事件中出現的不同項的相關性,即找出事務中頻繁發生的項或屬性的所有子集,以及項目之間的相互關聯性。它的原理可描述為:設項目集合I={i1,i2,…,im}由m個不同的項目組成,D是一個事務數據庫,D中的每個事務是I的一個子集。一個項目的集合稱為項集,包含k個項目的集合稱為k項集,項集X的支持度,記為s(X),表示包含該項集的交易數據的條數,如果一個項集的支持度大于用戶指定的最小支持度(min_sup),則稱它是頻繁的,長度為k的頻繁項集稱為頻繁k項集,一個頻繁項集也稱為頻繁模式。關聯規則是形如A=>B的蘊涵式,其中A∈I, B∈I,并且A∩B=?,規則A=>B的支持度s(A=>B)定義為中包含A∪B的事務所占的百分比,表示項集A∪B在D中出現的概率。規則A=>B的置信度c(min_con)定義為D中包含項集A∪B的事務數和包含項集A的事務數的比值,表示當項集A出現時,項集B出現的概率。置信度大于用戶指定的最小置信度值的規則是可信的。
關聯規則挖掘的任務是找到事務數據庫D中支持度和置信度分別滿足用戶指定的最小支持度min_sup和最小置信度min_con的規則A=>B。關聯規則挖掘問題分為兩個子問題:(1)找出D中所有的頻繁項集;(2)從頻繁項集中產生關聯規則。
Apriori算法是基于關聯規則常用的方法,此方法在分析的同時需要產生候選項集。此算法發現關聯規則的過程分為兩步:第一步是通過迭代,檢索出需測試的源數據中所有頻繁項集,即支持度不低于用戶設置閾值的項集;第二步是利用第一步中檢索出的頻繁項集構造出滿足用戶最小置信度的規則。
本文從測試商品購物系統中選取了部分顧客購買記錄,如表1所示,其中I1為香蕉,I2為梨,I3為嬰兒服飾,I4為拖把,I5為蘋果。設定最小支持度min_sup閾值為0.2,最小置信度min_con閾值為0.7。

表1 部分顧客購買記錄
利用Apriori算法發現關聯規則的實現過程為:
(1)進行第一次迭代,首先產生候選項集C1。然后計算每一個候選項集的出現次數,計算支持度。最后選擇支持度>=0.2的項目,生成頻繁項集L1,共含5個項,如表2所示。

表2 候選項集C1、頻繁項集L1
(2)進行第二次迭代,使用L1×L1產生候選項集C2。然后計算每一個候選項集的出現次數,計算支持度。最后選擇支持度>=0.2的項目,生成頻繁項集L2,共含8個項,如表3所示。

表3 候選項集C2、頻繁項集L2
(3)進行第三次迭代,使用L2×L2產生候選項集C3。然后計算每一個候選項集的出現次數,計算支持度。最后選擇支持度>=0.2的項目,生成頻繁項集L3,共含2個項,如表4所示。因為要產生一個頻繁4的項集,需要至少有3個長度為3的子集,而在L3中只有2個子集,無法產生L4,所有算法停止迭代。

表4 候選項集C3、頻繁項集L3
(4)從頻繁項集產生關聯規則。對L3中的任意一個頻繁項集,首先計算它的子集,然后計算規則的置信度,最后選擇置信度大于置信度閾值0.7的規則就是關聯規則,計算結果如表5所示。

表5 關聯規則結果表
其中,推薦結果顯示,香蕉、梨、蘋果三種水果之間的存在關聯規則,置信度為0.75,所有當顧客在購買這三種水果之一時,系統要幫用戶推薦其他另外兩種水果,尤其是當顧客購買了香蕉和蘋果時,一定要幫用戶推薦梨,因為置信度為100%。
本文提出的基于關聯規則的商品智能推薦算法經仿真實驗,推薦準確率程度較高,不用建立復雜的用戶度量模型,可行性較高,為商家的管理決策提供數據支持,有利于提高服務水平和質量,也為顧客購買商品提供了一定的依據。
參考文獻:
[1]趙耀,薛貴榮. Web Service下的商品推薦系統的研究與實現[J].臨沂師范學院學報,2003,25(6):131-134.
[2]李煊,汪曉研,莊鎮泉.基于關聯規則挖掘的個性化智能推薦服務[J].計算機工程與應用,2002,11:200-204.
[3]謝厚亮,鄧衛紅.基于Java的商品智能推薦系統設計[J].電腦編程技巧與維護,2014,20:42-44.
[4]丁雪.基于關聯規則的圖書智能推薦系統研究[J].圖書情報論壇,2010,4:48-52.
[5]張興會.數據倉庫與數據挖掘技術[M].北京:清華大學出版社,2014,8:94-101.
楊鵬飛(1995-),男,陜西人,本科,研究方向為系統設計與開發
段群(1980-),女,陜西人,碩士研究生,講師,研究方向為圖像處理
韓麗娜(1976-),女,陜西人,碩士研究生,講師,研究方向為圖像處理
An Algorithm of Intelligent Recommendation Based on Association Rules
ZHANG Yong-jie,YANG Peng-fei,DUAN Qun,HAN Li-na
(College of Computer Science, Xianyang Normal University,Xianyang 712000)
Abstract:At present, more and more consumers buy goods through the electronic commerce platform, but the online shopping system provides a large of information, which makes the customer can not quickly find their desired goods. Proposes an algorithm of intelligent recommendation based on the association rule. That through the analysis of the user's historical purchase records, mining the customer's purchase interest, to the user to recommend appropriate related to buy goods. Experiments demonstrate that algorithm is applicable and effective, and it provides a certain assistant decision for the purchase of goods.
Keywords:Association Rules; Commodity Recommendation; Data Mining
收稿日期:2015-12-22修稿日期:2016-03-05
作者簡介:張勇杰(1995-),男,河南人,本科,研究方向為系統設計與開發
文章編號:1007-1423(2016)10-0025-03
DOI:10.3969/j.issn.1007-1423.2016.10.006
基金項目:咸陽師范學院大學生創新訓練項目(No.2015005)、陜西省大學生創新訓練項目(No.2097)