999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

關(guān)聯(lián)規(guī)則挖掘在超市銷售系統(tǒng)中的應(yīng)用及實(shí)現(xiàn)

2011-01-13 03:56:50黃宏本盧雪燕
梧州學(xué)院學(xué)報(bào) 2011年3期
關(guān)鍵詞:數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則

黃宏本,盧雪燕

(1.2.梧州學(xué)院,廣西 梧州 543002)

關(guān)聯(lián)規(guī)則挖掘在超市銷售系統(tǒng)中的應(yīng)用及實(shí)現(xiàn)

黃宏本1,盧雪燕2

(1.2.梧州學(xué)院,廣西 梧州 543002)

超市購物籃分析是關(guān)聯(lián)規(guī)則挖掘的典型應(yīng)用領(lǐng)域,分析了關(guān)聯(lián)規(guī)則在超市銷售系統(tǒng)中的應(yīng)用,然后提出了一種基于二維數(shù)組的關(guān)聯(lián)規(guī)則挖掘?qū)崿F(xiàn)算法,并根據(jù)算法開發(fā)實(shí)現(xiàn)了挖掘系統(tǒng)。通過模擬的超市銷售數(shù)據(jù)進(jìn)行試驗(yàn)表明,算法及所實(shí)現(xiàn)的系統(tǒng)是可行的、高效的。

關(guān)聯(lián)規(guī)則;超市銷售;二維數(shù)組

1 引言

在當(dāng)今市場競爭激烈的時(shí)代,如何讓消費(fèi)者在購物時(shí)能感覺到方便和舒適,一次性消費(fèi)更多,產(chǎn)生更大的銷售效益,是商家必須考慮的問題。由于銷售業(yè)記錄著消費(fèi)者的所有購買記錄,商家開始通過對消費(fèi)者購物行為的分析來進(jìn)行商品的合理擺放,以及對商鋪進(jìn)行更合理的布局,使商場銷售格局更符合消費(fèi)者的消費(fèi)行為與模式,從而提高商場的銷售業(yè)績,創(chuàng)造出更多的利潤,同時(shí)也為消費(fèi)者帶來更多的方便。

消費(fèi)者在超市購物或者是在網(wǎng)上購物時(shí),每一次對購物籃的處理都能得到顧客的一次購物信息,大多數(shù)零售企業(yè)只是將這些數(shù)據(jù)進(jìn)行簡單分類,分析單一的銷量數(shù)據(jù),然后做一些統(tǒng)計(jì),實(shí)際上并沒有意識(shí)到這些數(shù)據(jù)中還包含著很多有用的信息,沒有充分利用這些能反映所有顧客購物行為最有效的數(shù)據(jù),使得寶貴的數(shù)據(jù)資源成了“數(shù)據(jù)墳?zāi)埂?。同時(shí),零售業(yè)記錄顧客的購物信息形成了海量的數(shù)據(jù),它們以TB數(shù)量級(jí)增長。要想使數(shù)據(jù)真正成為資源,必須充分利用它,讓它為業(yè)務(wù)決策和戰(zhàn)略發(fā)展服務(wù),否則大量的數(shù)據(jù)就只會(huì)成為包袱,甚至成為垃圾。

另一方面,隨著計(jì)算機(jī)技術(shù)的發(fā)展,涌現(xiàn)出了很多新技術(shù),如數(shù)據(jù)挖掘技術(shù),數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則挖掘能夠從海量數(shù)據(jù)中分析出隱藏于其中的一些規(guī)律和模式。零售業(yè)的銷售數(shù)據(jù)是以事務(wù)數(shù)據(jù)庫的形式存在的,關(guān)聯(lián)規(guī)則挖掘則主要是對事務(wù)數(shù)據(jù)庫進(jìn)行挖掘,因此關(guān)聯(lián)規(guī)則挖掘在銷售領(lǐng)域得到了廣泛的應(yīng)用。數(shù)據(jù)挖掘是一個(gè)比較專業(yè)的技術(shù),它要求使用者要具有相當(dāng)?shù)挠?jì)算機(jī)知識(shí),然而大多數(shù)商家并不是數(shù)據(jù)挖掘技術(shù)的專家,因此,如何使數(shù)據(jù)挖掘技術(shù)“平民化”,成為當(dāng)前很多學(xué)者研究的熱點(diǎn)之一[1]。

本文對關(guān)聯(lián)規(guī)則算法在購物籃分析中的應(yīng)用進(jìn)行了探討,設(shè)計(jì)了一種基于二維數(shù)組的實(shí)現(xiàn)算法,并開發(fā)實(shí)現(xiàn)了挖掘系統(tǒng)。

2 關(guān)聯(lián)規(guī)則挖掘概述

2.1 關(guān)聯(lián)規(guī)則

設(shè)I={i1,i2…,im}是項(xiàng)的集合,設(shè)任務(wù)相關(guān)的數(shù)據(jù)D是數(shù)據(jù)庫事務(wù)的集合,每個(gè)事務(wù)T是項(xiàng)的集合,使得,每個(gè)事務(wù)有一個(gè)稱作TID的標(biāo)識(shí)符。設(shè)A是一個(gè)項(xiàng)集,事務(wù)T包含A當(dāng)且僅當(dāng)關(guān)聯(lián)規(guī)則是形如A B的蘊(yùn)涵式,其中AI,BI,并且 AIB=Φ[2]。

關(guān)聯(lián)規(guī)則有兩個(gè)度量指標(biāo)。(1)支持度s,是D中事務(wù)包含AYB的百分比,是概論P(yáng)(AYB)。

(2)置信度c,是D中包含A的事務(wù)同時(shí)也包含B的百分比。

同時(shí)滿足最小支持度和最小置信度的規(guī)則稱為強(qiáng)關(guān)聯(lián)規(guī)則。

2.2 關(guān)聯(lián)規(guī)則挖掘算法

關(guān)聯(lián)規(guī)則挖掘分為兩步:(1)找出所有的頻繁項(xiàng)集,這些項(xiàng)集出現(xiàn)的頻繁性要大于等于預(yù)定的最小支持度。(2)由頻繁項(xiàng)集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則。

最早提出關(guān)聯(lián)規(guī)則挖掘算法的是Agrawal等人[3],在1993年提出的經(jīng)典算法Apriori算法,但由于Apriori算法存在需要頻繁掃描事務(wù)數(shù)據(jù)庫的缺點(diǎn),因此眾多研究者提出了改進(jìn)的算法,如韓家煒提出了不產(chǎn)生候選集的 FP-Growth算法[4],Mohammed J.Zaki等人提出了用垂直數(shù)據(jù)表示進(jìn)行挖掘的ECLAT算法[5],等等。

3 關(guān)聯(lián)規(guī)則挖掘在超市銷售中的應(yīng)用

大型超市是數(shù)據(jù)挖掘在零售業(yè)中的重要應(yīng)用領(lǐng)域,超市普遍應(yīng)用了計(jì)算機(jī)進(jìn)行貨物的采購、倉儲(chǔ)和銷售管理,在運(yùn)營過程中積累了大量的銷售數(shù)據(jù),使用數(shù)據(jù)挖掘技術(shù)對這些數(shù)據(jù)進(jìn)行分析,可以識(shí)別顧客的購買行為,發(fā)現(xiàn)顧客購買模式和趨勢,改進(jìn)服務(wù)質(zhì)量,取得更好的顧客保持力和滿意度,同時(shí)還能提高貨品銷售比率,設(shè)計(jì)出更好的貨品運(yùn)輸與分銷策略,減少商業(yè)成本等。具體應(yīng)用舉例如下。

3.1 制定交叉銷售策略

應(yīng)用關(guān)聯(lián)規(guī)則挖掘,可以有效地發(fā)現(xiàn)商品銷售之間的有趣關(guān)聯(lián),進(jìn)而知道貨物的擺放,以及產(chǎn)品的關(guān)聯(lián)促銷,提高銷售業(yè)績和客戶滿意度,提升企業(yè)競爭力。

3.2 制定促銷活動(dòng)

利用關(guān)聯(lián)規(guī)則挖掘技術(shù),確定商品銷售的關(guān)聯(lián)關(guān)系,精確制定促銷的對象,降低活動(dòng)成本[6]。

3.3 銷售、顧客、產(chǎn)品、時(shí)間和地區(qū)的分類分析

考慮到顧客的需求,產(chǎn)品的銷售,趨勢和時(shí)常,以及日用品的質(zhì)量、價(jià)格、利潤和服務(wù),根據(jù)不同維度的分類方法[7],可以了解到顧客類型,產(chǎn)品是否暢銷,以及不同時(shí)間和地域的銷售優(yōu)勢。

3.4 促銷活動(dòng)的有效性分析

通過比較促銷期間與促銷活動(dòng)前后的銷售量和交易數(shù)量來分析促銷活動(dòng)的有效性。通過關(guān)聯(lián)挖掘找出隨降價(jià)商品一同被購買的商品,特別要與促銷活動(dòng)前后的銷售相比。

3.5 顧客購買趨勢分析

通過VIP卡的信息,以同一顧客在不同時(shí)期購買的商品分組為序列。分析顧客的消費(fèi)變化,然后對商品的價(jià)格和商品的花樣加以調(diào)整,以挽留老顧客,吸引新顧客。

4 關(guān)聯(lián)規(guī)則挖掘在超市銷售中應(yīng)用的實(shí)現(xiàn)

在對關(guān)聯(lián)規(guī)則以及其在超市銷售中的應(yīng)用分析的基礎(chǔ)上,使用Microsoft Visual Basic 6.0開發(fā)了一個(gè)對超市數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則挖掘的系統(tǒng)[4]。系統(tǒng)的大小僅為200多KB,輕巧實(shí)用,易于操作,實(shí)驗(yàn)證明挖掘效果良好。

4.1 算法描述

在原始數(shù)據(jù)中抽取超市某個(gè)時(shí)間段的銷售記錄,以找出強(qiáng)關(guān)聯(lián)規(guī)則,為超市的商品擺放提供依據(jù)。對于一個(gè)顧客只購買一種商品的情況進(jìn)行篩選后,構(gòu)造僅由顧客編號(hào)和商品編號(hào)組成的數(shù)據(jù)庫,保存成.dat文件,此類文件可以用操作系統(tǒng)中的記事本直接打開、更新及編輯,十分方便。為了方便操作及存儲(chǔ),在文件中,同一個(gè)顧客購買的多個(gè)商品存儲(chǔ)在同一行,并且各個(gè)商品編號(hào)之間用空格隔開,這樣的構(gòu)造方法非常易于使用二維數(shù)組來存儲(chǔ),挖掘過程中也能方便地使用二維數(shù)組的特點(diǎn)。挖掘的算法步驟描述如下。

(1)建立一個(gè)二維數(shù)組用于存儲(chǔ)數(shù)據(jù)庫即商品的編號(hào),其元素范圍是從最小商品號(hào)到最大商品號(hào),所以先定義一個(gè)ArrStr(商品號(hào)個(gè)數(shù),商品號(hào)個(gè)數(shù))的數(shù)組,并初始化為0;

(2)讀取數(shù)據(jù)庫文本,以換行符為分割點(diǎn)將文本分割存放到一個(gè)行數(shù)組,如:RowArr=Split(StrData,Chr(13)&Chr(10),-1,vbTextCompare),然后再逐一讀取每個(gè)行數(shù)組元素,以空格符為分割點(diǎn)進(jìn)行分割,將分割后的結(jié)果存放到一個(gè)列數(shù)組,如:ColArr=Split(RowArr(i),"",-1,vbTextCompare);

(3)將關(guān)聯(lián)規(guī)則映射到ArrStr二維數(shù)組中,比如有一個(gè)顧客同時(shí)買了30號(hào)和40號(hào)商品,那么其關(guān)聯(lián)強(qiáng)度就自加1,如:ArrStr(30,40) =ArrStr(30,40)+1。這里要注意的是,在二維數(shù)組中 ArrStr(30,40)和 ArrStr(40,30)是不一樣的,但是對于商品來說都是同一種關(guān)聯(lián),所以在執(zhí)行 ArrStr(30,40)=ArrStr(30,40)+1時(shí),還要進(jìn)行 ArrStr(40,30)=ArrStr(40,30)+1運(yùn)算;

(4)從ArrStr這個(gè)二維數(shù)組中取出其右上角(也可以是左下角)的數(shù)據(jù),然后對其每個(gè)元素進(jìn)行從大到小排序并保存在TopNum數(shù)組中,再把這個(gè)元素對應(yīng)的數(shù)組下標(biāo)保存在自定義數(shù)組TopListX和TopListY中,這樣就可列出TopListX(i)商品與TopListY(i)商品的關(guān)聯(lián)強(qiáng)度為TopNum(i)。

4.2 測試結(jié)果及分析

本文的測試數(shù)據(jù)見下頁圖1,共有5000行記錄,最多的一行記錄有102列,文件大小為201KB。數(shù)據(jù)庫中最小商品號(hào)為0,最大商品號(hào)為999,共1000種商品。挖掘的結(jié)果如下頁圖2所示。

圖1 測試數(shù)據(jù)庫

圖2 挖掘結(jié)果的前7項(xiàng)

從結(jié)果可以看到,在較短的時(shí)間內(nèi)就能挖掘出較好的結(jié)果。在圖2中按照關(guān)聯(lián)強(qiáng)度的高低列出了結(jié)果。對于超市的銷售而言,針對1000種商品進(jìn)行挖掘,同時(shí)列出了兩種商品間的關(guān)聯(lián)強(qiáng)度,結(jié)果列出了兩種商品被購買的次數(shù),這樣的結(jié)果已經(jīng)足夠決策者進(jìn)行參考,從而做出決策。挖掘得到的結(jié)果清晰明了,即使數(shù)據(jù)庫進(jìn)行了更新,系統(tǒng)不需要做任何的改動(dòng),依然能高效地進(jìn)行挖掘,加上系統(tǒng)操作簡單,性能良好,說明這樣的系統(tǒng)值得推廣。且本軟件已是發(fā)布版,一個(gè).exe文件,無需安裝,可以直接運(yùn)行。操作上只需要把相應(yīng)數(shù)據(jù)庫命名后放置在相同目錄,點(diǎn)擊按鈕即可。相比于其他主流數(shù)據(jù)挖掘平臺(tái),如AlphaMiner2.0, SAS Enterprise Miner, SPSS clementine,S-Plus Insightful Miner等,本系統(tǒng)算法簡單,易于操作,且性能毫不遜色。

5 總結(jié)

本文討論了關(guān)聯(lián)規(guī)則挖掘在超市銷售中的應(yīng)用。提出了一種基于二維數(shù)組的關(guān)聯(lián)規(guī)則挖掘算法,并使用Microsoft Visual Basic 6.0編程實(shí)現(xiàn)挖掘系統(tǒng),通過模擬的超市購物數(shù)據(jù)測試表明,算法高效可行,所實(shí)現(xiàn)的系統(tǒng)輕巧,性能出色,具有相當(dāng)?shù)膶?shí)用價(jià)值。

[1]杜海濤,陳定方,張波.一種基于關(guān)聯(lián)規(guī)則的超市購物籃分析方法[J].湖北工業(yè)大學(xué)學(xué)報(bào),2008(2):53-55.

[2]Jiawei Han,Micheline Kamber.數(shù)據(jù)挖掘:概念與技術(shù)[M].2版.范明,孟小峰,譯.北京:機(jī)械工業(yè)出版社,2007.

[3]AgrawalR,SrikantR.Fastalgorithmsforminingassociationrules in large databases[C].Processings of the 20th International Conference on Very Large DataBases.San Francisco:Morgan Kaufmann Publishers Inc,1994:487-499.

[4]Han J W,Pei J,Yin YW.Miningfrequent patterns without candidate generation[C].Proc.2000 ACM SIGMOD Int.Conf.on management ofdata,Dallas:ACMPress,2000:1-12.

[5]ZakiMJ.Scalablealgorithmsforassociationmining[J].IEEETransactions on Knowledge and Data Engineering,2000,12 (3):372-390.

[6]唐敏.關(guān)聯(lián)規(guī)則挖掘算法在超市銷售分析中的應(yīng)用[J].計(jì)算機(jī)科學(xué),2006(2):149-150.

[7]沈國強(qiáng),覃征.一種新的多維關(guān)聯(lián)規(guī)則挖掘算法[J].小型微型計(jì)算機(jī)系統(tǒng),2006(2):291-294.

[8]陳茵,閃四清,劉魯,等.最小冗余的無損關(guān)聯(lián)規(guī)則集表述[J].自動(dòng)化學(xué)報(bào),2008(12):1490-1496.

Application and Implementation of Association Rules Exploited from the Selling System of Supermarkets

Huang Hongben1,Lu Xueyan2
(1.2.Department of Computer Science,Wuzhou University,Wuzhou 543002,China)

Shopping-basket analysis is a typical application area for exploiting association rules.First,this paper analyzes the application of association rules in the supermarkets.Then,it proposes an association exploiting algorithm which is based on two-dimensional array.Finally,it realizes an exploiting system by using this algorithm.The test based on sales data of a supermarket shows that the algorithm and the system is reasonable and efficient.

association rules;supermarket’s sale;two dimensional array

TP273

A

1673-8535(2011)03-0059-05

2011-03-28

廣西教育廳科研立項(xiàng)(200708MS056);梧州學(xué)院科研項(xiàng)目(2007C006)

黃宏本(1977-),男,廣西藤縣人,梧州學(xué)院教師,研究方向:數(shù)據(jù)挖掘等。

盧雪燕(1982-),女,廣西靈山縣人,梧州學(xué)院教師,研究方向:數(shù)據(jù)挖掘等。

覃華巧)

猜你喜歡
數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則
撐竿跳規(guī)則的制定
“苦”的關(guān)聯(lián)
數(shù)獨(dú)的規(guī)則和演變
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
奇趣搭配
讓規(guī)則不規(guī)則
Coco薇(2017年11期)2018-01-03 20:59:57
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規(guī)則對我國的啟示
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
主站蜘蛛池模板: 噜噜噜久久| 精品成人一区二区三区电影| 亚洲男人的天堂久久香蕉网 | 国产婬乱a一级毛片多女| 亚洲视频二| 国产免费自拍视频| 亚洲三级a| 热思思久久免费视频| 日韩成人在线一区二区| 亚洲国产一成久久精品国产成人综合| 一级毛片中文字幕| 青青草国产精品久久久久| 性做久久久久久久免费看| 永久免费精品视频| 自拍偷拍一区| 国产jizz| 亚洲高清国产拍精品26u| 久久亚洲国产视频| 亚洲码一区二区三区| 91久久青青草原精品国产| 综合五月天网| 在线观看免费黄色网址| 97se亚洲综合在线天天| 欧美69视频在线| 国产成人精品男人的天堂下载| 亚洲欧美不卡视频| 亚洲精品你懂的| 欧美三级视频在线播放| 动漫精品中文字幕无码| 国产日韩精品一区在线不卡| 国产91丝袜在线观看| 亚洲清纯自偷自拍另类专区| 国产精品jizz在线观看软件| 亚洲欧美日韩成人高清在线一区| 一级不卡毛片| 四虎影视无码永久免费观看| 亚洲AV无码一区二区三区牲色| 久久一级电影| 亚洲成年人片| 中文字幕在线播放不卡| 影音先锋亚洲无码| 熟妇无码人妻| 午夜国产在线观看| 国产在线视频自拍| 国产一级视频久久| 一本大道在线一本久道| 欧美黄色a| 亚洲日韩高清在线亚洲专区| 色婷婷成人| 国产欧美综合在线观看第七页| 欧美国产日韩在线观看| 亚洲精品高清视频| 无码内射在线| 黄色片中文字幕| 制服丝袜一区| 国产成人高清精品免费软件| 欧美精品黑人粗大| 91色爱欧美精品www| 波多野结衣一区二区三视频 | 婷婷成人综合| 亚洲国产精品久久久久秋霞影院 | 最新日韩AV网址在线观看| 这里只有精品免费视频| 亚洲精品午夜无码电影网| 国产人免费人成免费视频| www.91中文字幕| 亚洲精品无码在线播放网站| 好吊色妇女免费视频免费| 国产在线观看精品| a级毛片视频免费观看| 99青青青精品视频在线| 亚洲伊人电影| 美女无遮挡拍拍拍免费视频| 一本大道无码高清| 男女男精品视频| 人妻少妇乱子伦精品无码专区毛片| 亚洲欧州色色免费AV| 国产日韩精品欧美一区喷| 中文字幕亚洲综久久2021| 日韩国产综合精选| 日韩无码视频专区| 九九这里只有精品视频|