

摘要:超市購物日漸成為人們生活中不可或缺的重要組成部分,因此超市購物行為研究也顯得較為重要。本文采用Apriori關聯規則算法分析超市購物清單中商品之間的關系,通過算法中兩個重要指標支持度與置信度之間的關系來衡量商品之間的關聯關系,經過算法分析獲得具有強相關性的產品組合。該結果可用于指導超市商品放置,超市購買指導等。
關鍵詞:超市商品;關聯規則分析;Apriori
中圖分類號:TP311.1 文獻識別碼:A文章編號:2096-3157(2020)04-0003-02
一、引言
隨著時代的發展,人們的物質生活質量日益提高,超市中商品質量和商品種類也呈現快速增漲趨勢,顧客可以在超市選擇購買的商品數量也隨之增加。超市中人流量非常大,超市購物也成為人們日常經濟生活中的重要組成部分。針對超市商品關聯關系的分析也顯得尤為重要,如果超市商品關聯關系強,則可以將這些商品擺放在同一位置,為超市管理者擺放商品提供依據。
基于上述背景,本文主要介紹Apriori算法關聯規則以及其計算每種籃子的獲利能力中的應用。眾多研究者應用Apriori算法分析市場籃子,并且研究者為了得到更加準確的數據在算法上進行多種改進研究,因此Apriori算法在分析超市購物習慣的研究中準確可靠。在數據經過預期處理后,利用Apriori算法對每種籃子中商品進行數據挖掘并且研究其相關性,從而得到顧客選擇購買商品間的關聯規則,進一步分析購買商品的變動情況,可以為商家的營銷策略變動提供決策支持。
本文第二部分將對于Apriori算法分析超市商品關聯規則文章進行介紹;第三部分將對實驗數據的選取和預處理進行相關介紹;第四部分講解利用Python編程,求解得到結果并對結果進行分析;第五部分為總結全文,提出 Apriori算法在超市關聯規則關系分析中具有重要作用。
二、文獻綜述
本部分研究三篇相關文獻,為本文研究提供理論支撐。
高正紅[1]通過對數據的分析得出的結論如下:通過分析數據之間的關系可以預測未來的發展趨勢,以便管理人員作出正確的決策,為企業節省大量開支,提高企業利潤。
鮑娜[2]在論文中表明,隨著人們生活水平的提高,網上超市被越來越多的人所利用,網上超市的產品組合也越來越受到關注。該論文利用Apriori算法對網上超市的商品組合進行挖掘,以女性購買者所購買的商品作為數據進行收集,利用Apriori算法找出出現次數最多的商品組合并最終得到最優的產品組合。該商品組合對網上超市的發展有一定的指導性作用。
董陽光[3]通過將關聯規則算法應用在數據挖掘中,可以從超市的購物記錄中找到放置在購物籃中的商品之間的關系,分析顧客的購物習慣,并幫助零售商了解顧客經常購買哪些產品,以便幫助他們制定更好的營銷策略。利用這種關聯規則,我們可以更具有針對性地指導超市工作人員進行商品的擺放,在方便顧客進行商品挑選的同時,增加營業收入,實現消費者與供應商的互利共贏。
三、商品數據收集與關聯規則算法介紹
1.商品數據收集
本文從Kaggle網站上獲取美國某超市的顧客購物清單,其中包含7501組客戶購物數據,每組購物數據分別代表客戶某次購物行為購買的商品種類以及數量,其中最長的一組數據包含20種商品,最短的一組數據包含2種商品。
2.數據預處理
本文采用Python進行數據預處理以及算法運算。Python的Apriori庫要求我們的數據集采用列表的形式,因此將整個數據集設置成一個很大的列表,數據集中的每個事務都是外部大列表中的內部列表,散亂的數據將被整理的更加清晰,有條理。形式如下:[[transaction1],[transaction2],…,[transaction7501]]。表1為我們的部分數據示例:
3.介紹Apriori關聯規則
Apriori算法是關聯規則算法是非常經典的一種數據挖掘的算法,應用廣泛。它包含兩個重要概念:
(1)支持度(support):代表兩個事件A,B同時發生的概率,support=P(AB)。
(2)置信度(confidence):代表在事件A發生的前提下,事件B發生的概率,conficence=P(B|A)。
使用Apriori算法分析市場籃子目的是在包含不同產品的事務的數據集上使用Apriori算法理解關聯規則及其度量。舉個例子,市場籃子分析可能幫助管理者優化不同商品的布局。如果一個顧客買牛奶可能也會同時注意到買面包,他們將牛奶靠近或者遠離面包可能會對銷售兩項商品都有幫助。市場籃子分析可以通過識別產品之間的關聯來完成,稱為關聯規則挖掘。
四、利用Apriori算法挖掘超市商品間關聯規則
結果分析。本文采用Python編程實現Apriori算法挖掘超市商品間的關聯規則,使用python根據所收集到的數據進行總結分析得出如下結論(部分結果展示):
由表2可看出,“牛肉末”與“香草和胡椒”兩種商品的支持度最高,因此這兩種商品有較高的關聯度。說明消費者同時購買這兩種商品的概率最大,因此在超市儲備貨物時可以將這兩種商品同時考慮。另外,這兩種商品的置信度為32.35,說明購買“香草和胡椒”的客戶中有32.35%的客戶會購買牛肉末,這是一個很高的比例,因此超市可以考慮將這兩種商品放在一起銷售,建議超市管理者將這兩種商品的貨架擺放在比較鄰近的位置,因此當顧客購買“牛肉末”的同時有很大的概率顧客會選擇購買“香菜和胡椒”;同理當顧客購買“香菜和胡椒”的同時也會有很大的概率去選擇同時購買“牛肉末”。或者在商家搞活動時免費贈送其中一件商品,以達到增加另一件商品銷量的目的。
五、結語
隨著人們物質生活質量日益提高,超市中商品質量和商品種類也呈現快速增漲趨勢,顧客可以在超市選擇購買的商品數量也隨之增加。本文嘗試通過消費者的購物數據,挖掘超市商品之間的關聯規則,通過查看顧客在商品購買過程中的行為習慣,來發現商品之間的關聯規則,繼而為超市管理者制定相應的營銷策略提供依據。市場購物籃分析可以幫助管理者優化不同的商店布局,對于相關性比較高的商品,例如如果購買牛肉末的顧客也傾向于同時購買番茄醬,那么將牛肉末放在番茄醬附近或對面可能有助于增加這兩種產品的銷售。
參考文獻:
[1]高正紅,沈學利.Apriori算法在超市決策中的應用[J].長春工程學院學報:自然科學版,2007,(1):63~66.
[2]鮑娜,張德賢.基于Apriori算法的網上超市產品組合研究[J].福建電腦,2008,(1):64~65.
[3]董陽光.基于Apriori算法的關聯規則超市購物推薦算法研究[J].中國戰略新興產業,2017,(48).
作者簡介:
周冠茜,北京市第十三中學學生。