999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Apriori算法的購物籃分析

2020-09-04 08:58:24司鳳娟
科學與信息化 2020年21期
關鍵詞:數據挖掘

摘 要 采用數據挖掘技術中的Apriori算法,對購物籃進行關聯規則的分析。本文首先介紹了關聯規則算法的基本概念,然后運用R軟件中arules包中的函數Apriori對選取的數據進行分析,找到商品之間的關聯,并根據模型結果給商場提出銷售建議,提高商場的競爭力。

關鍵詞 數據挖掘;Apriori算法;R軟件

引言

隨著科學技術的不斷發展 ,各個行業都產生了大量的各種形式的數據。這些數據看起來復雜抽象,好像無任何規律,但是如果對數據進行分析,會發現其背后隱藏著很多有價值的重要信息,因此數據挖掘應運而生。數據挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,通過應用聚類、分類、回歸和關聯規則等技術,挖掘潛在價值的過程[1]。

購物籃分析是零售行業最關注、最具有挑戰性的問題。本文應用關聯規則算法對顧客購買商品的種類、消費金額以及整個賣場的銷售數據進行分析,從而得到顧客的消費特征,這些特征包括顧客對商品的喜好、消費能力、品牌忠誠度以及潛在的消費需求,并根據這些特征制定行之有效的方案。

1關聯規則算法

1.1 關聯規則算法的相關概念

關聯規則的支持度和置信度是用于度量關聯規則強度的兩個指標。

支持度表示A和B同時發生的概率,如式(1)所示。

置信度為A發生的條件下B發生的概率。提升度是A發生的條件下B發生的概率和B無條件下發生的概率之比。若lift>1,則說明A對B 具有提升作用;若lift<1,則作用相反。

設I={i1,i2…i3}是二進制的集合,表示的是購物籃中商品的類別數為,其中每類商品稱為項。項的集合稱為項集,包含k項的集合為k-項集[2],其中()。每個項集都是的子集,項集的頻率等于所有包含此項集的購物籃個數與購物籃總數之比,它被稱為支持度。若項集的支持度大于或是等于預先規定的最小支持度的閾值,則此項集為頻繁項集,含有k項的頻繁項集記為Lk[1]。

1.2 Apriori算法步驟

假設共十個購物籃:{a,c,e},{b,d},{b,c},{a,b,c,d},{a,b},{b,c},{a,b},{a,b,c,e},{a,b,c},{a,c,e},運用Apriori算法步驟如下:

步驟一:確定最小支持度為0.2,最小置信度為0.5;

步驟二:確定I={a,b,c,d,e},以每樣商品為一項得到候選一項集的集合C1,根據式(1)計算每項的支持度,掃描C1,如果商品的支持度小于0.2,則刪除,得到一項頻繁項集L1;

步驟三:L1和L1連接得到候選2項集C2,這步稱為連枝。然后計算C2中每項的支持度,然后是剪枝,如果支持度小于0.2,則刪除。頻繁項集還有一項要求是:頻繁項集的子集也必須是頻繁項集。根據這兩條原則得到二項頻繁項集L2;

步驟四:L1和L2連接得到候選3項集C3,再掃描所有事務集,計算C3中每項的支持度,然后剪枝,得到三項頻繁項集L3;

步驟五:以此類推L1和L3連接得到候選項集C4,再計算支持度,得到最終的頻繁項集;

步驟六:應用R軟件求解,得到關聯規則。

2應用Apriori算法分析購物籃

某大型超市存儲了一段時間的購物籃數據,共包括4835個購物籃的數據,售出商品總數為22309件,包括168種不同的商品。首先應用R軟件對商品的銷售情況排序,全脂牛奶銷量最高,銷量為1278件,占比約為5.7%,其次為面包卷銷量為972,占比約為4.4%等。前20種商品的銷量占比約為50%,基本符合“二八原則”。通過對商品占比的分析,可以確定那些商品為主力商品,那些為輔助商品,初步確定商品的擺放順序。

R語言中的arules包中的函數apriori可以對數據集進行關聯規則分析,經過多次分析,發現運用Aprior算法,當最小支持度取0.02,最小置信度取0.35時得到的關聯規則數目適中,結果良好。已提升度從高到低排列的前5條規則如表1所示,

通過關聯規則分析,我們可以知道顧客在購買其他商品時會購買全脂牛奶,其次是購買其他蔬菜,這也和我們分析的熱銷商品相符合。因此,超市應該把這些熱銷商品放在顧客購買商品的必經之路,或是商場的中心位置,方便顧客購買。通過關聯規則還可以知道顧客會同時購買豬肉、根莖類蔬菜、其他蔬菜、蛋類等的可能性較高,因此這些物品應當放的位置比較接近,或是捆綁銷售,這樣方便了顧客,提升顧客的購物體驗,也會提高顧客對超市的忠誠度。

3結束語

隨著計算機技術和機器學習技術的不斷發展,數據挖掘技術有著廣闊的發展前景。關聯規則分析除了可以對購物籃進行分析,還可以應用到銀行客戶行為分析、學生成績關聯分析、試卷知識點關聯分析、醫療保險分析等。隨著電子商務的發展,關聯規則技術還被應用到電商平臺,根據客戶以往的購買記錄,分析他可能感興趣的商品。它還可以和其他的算法相結合運用,比如協同過濾算法 ,兩者結合,就可以向顧客推薦他們可能感興趣的商品。隨著對關聯規則認識的不斷加深,我們可以將更多的因素融入其中,來拓展關聯規則的應用廣度,讓其為更多的領域提供決策支持。

參考文獻

[1] 韓寶國,張良均.R語言商務數據分析實戰[M].北京:人民郵電出版社,2018:109.

[2] 李毅.基于Apriori算法的試卷知識點關聯分析[J].新校園,2018(7):52.

作者簡介

司鳳娟(1979-),女,山東菏澤人;學歷:碩士,職稱:講師,現就職單位:菏澤學院,研究方向:概率論與數理統計。

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 久久婷婷国产综合尤物精品| 日韩经典精品无码一区二区| 日本免费福利视频| 伊人久久久大香线蕉综合直播| 久久亚洲AⅤ无码精品午夜麻豆| 国产精品久久久免费视频| 欧美日韩精品一区二区在线线 | 国产女人水多毛片18| 福利在线一区| 国产成人欧美| 午夜国产大片免费观看| 国产一级在线观看www色| 日韩国产欧美精品在线| 日韩无码视频网站| 国产激情无码一区二区三区免费| 女人爽到高潮免费视频大全| 国产日本视频91| 国产免费久久精品99re丫丫一| 国产精品久久久久久影院| jizz国产视频| 男女男精品视频| 五月激情婷婷综合| 亚洲日本中文字幕乱码中文| 日本高清成本人视频一区| 久久亚洲黄色视频| 免费激情网址| 国产高颜值露脸在线观看| 香蕉综合在线视频91| 日本91视频| 亚洲综合二区| 二级特黄绝大片免费视频大片| 五月激激激综合网色播免费| 久久黄色毛片| 亚洲精品国产成人7777| 久久综合丝袜日本网| 日韩精品一区二区三区swag| 国产亚洲精品精品精品| 久久成人国产精品免费软件| 亚洲性一区| 九九热在线视频| 好吊日免费视频| 亚洲成网站| 国产一级二级三级毛片| 无码不卡的中文字幕视频| 亚洲AV无码一区二区三区牲色| 久久婷婷综合色一区二区| 69综合网| 午夜视频日本| 色噜噜综合网| 毛片网站免费在线观看| 国产手机在线观看| 久久精品91麻豆| 国产在线观看成人91| 沈阳少妇高潮在线| 日韩视频免费| 国产视频久久久久| 亚洲无码高清一区| 91视频国产高清| 日韩国产综合精选| 亚洲第一页在线观看| 无码啪啪精品天堂浪潮av| 深爱婷婷激情网| 97精品国产高清久久久久蜜芽 | 色妞永久免费视频| 99精品视频播放| 日本免费新一区视频| 国产精品永久久久久| 无码AV日韩一二三区| 国产无码在线调教| 国产美女91视频| 亚洲国产清纯| 在线看AV天堂| 99精品国产电影| 亚洲美女一级毛片| 国产成人午夜福利免费无码r| 中文字幕免费在线视频| 日韩一级毛一欧美一国产| 久久精品午夜视频| 国产性生大片免费观看性欧美| 国产精品专区第1页| 欧美日韩国产精品va| 9丨情侣偷在线精品国产|