999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種挖掘閉頻繁項集的優(yōu)化算法研究

2014-12-31 00:00:00張振友丁鐵凡代晨旭
消費電子·下半月 2014年12期

摘 要:本文在FP-Growth算法的基礎(chǔ)上通過項合并的策略對FP-Growth做了優(yōu)化,從而減少了挖掘頻繁項集時的搜索空間,也減少了頻繁項集的數(shù)量。通過實驗可知,優(yōu)化后的挖掘閉頻繁項集算法在挖掘大量數(shù)據(jù)集上有明顯性能優(yōu)勢,挖掘的速度得到了相應(yīng)的提升。

關(guān)鍵詞:關(guān)聯(lián)規(guī)則;FP-Growth算法;閉頻繁項集;項合并

中圖分類號:TN929.5 文獻標識碼:A 文章編號:1674-7712 (2014) 24-0000-01

關(guān)聯(lián)規(guī)則算法應(yīng)用十分廣泛,然而其中主流的兩個算法分別為Apriori算法和FP-Growth算法。相比于前者,后者在性能上有一定的優(yōu)勢。Agrawal[1]提出了經(jīng)典的Apriori算法來挖掘數(shù)據(jù)集中的頻繁模式,從而挖掘出數(shù)據(jù)項集之間的關(guān)聯(lián)規(guī)則。為了更好的提高挖掘的效率,研究人員提出了基于散列的技術(shù),事務(wù)壓縮,抽樣以及動態(tài)項集計數(shù)等改進算法。但是反復(fù)地掃描數(shù)據(jù)庫和產(chǎn)生大量候選項集的缺點給開銷帶來了不平凡的影響。于是提出了挖掘全部頻繁項集卻不產(chǎn)生大量候選集的頻繁模式增長,即FP-Growth算法[2]。

一、FP-Growth算法簡介

FP-Growth算法減少了全量掃描事務(wù)數(shù)據(jù)庫的次數(shù),并且不產(chǎn)生候選集[3]。算法中的FP-tree是一種特殊的前綴樹,由頻繁項頭表和項前綴樹構(gòu)成。所謂前綴樹,是一種存儲候選項集的數(shù)據(jù)結(jié)構(gòu),樹的分支用項名標識,樹的節(jié)點存儲后綴項,路徑表示項集[4]。

二、FP-Growth算法中項合并優(yōu)化

傳統(tǒng)的FP-Growth算法有如下優(yōu)點:無需產(chǎn)生候選集,并且大大減少了存儲空間;無需要反復(fù)掃描數(shù)據(jù)庫,降低了I/O操作壓力,提高了性能。但是在挖掘FP樹的過程中迭代的次數(shù)較多,產(chǎn)生的頻繁項集也非常多。

為了進一步優(yōu)化FP-Growth算法的性能,本文通過定理1來做一個剪枝的優(yōu)化。

(一)定理

在挖掘FP-Tree樹過程中,如果出現(xiàn)如下情況進行項合并:前綴項集A的子數(shù)據(jù)庫中每個事務(wù)都包含項集B,但不包含項集B的任何真超集,那么合并項集A和項集B,即A∪B形成一個閉頻繁項集,那么無需再挖掘前綴項集A的子數(shù)據(jù)庫中不包含項集B的閉項集[5]。

FP-Growth算法主要分為兩步:第一步是構(gòu)建FP-Tree,如上簡介介紹的過程。第二步:開始挖掘第一步建立好的FP-Tree,本文提出了項合并的策略來減少挖掘FP-Tree時產(chǎn)生的條件模式基,達到剪枝的效果。

(二)試驗結(jié)果

為了驗證本文提出的基于FP-Growth算法的優(yōu)化算法的性能,利用mushroom.dat數(shù)據(jù)來做試驗。試驗通過FP-Growth算法和優(yōu)化后的FP-Growth算法作比較。在相同的最小支持度下挖掘同一份數(shù)據(jù)的速率來做衡定,其中結(jié)果的橫坐標數(shù)值為支持度閥值,那么最小支持度為整個mushroom.dat數(shù)據(jù)中包含的事務(wù)數(shù)據(jù)條數(shù)乘于支持度閥值。

下圖為試驗的結(jié)果計算速率對比圖:

Fig.1 The computation rate comparison chart.

從圖中可以看出:隨著閥值的變大,相應(yīng)的最小支持度計數(shù)也變大,從而得到的頻繁項集的總量在減少,搜索的代價也隨著降低,所以優(yōu)化后的FP-Growth算法和傳統(tǒng)的FP-Growth算法在挖掘速度上很接近。

三、結(jié)束語

本文提出了一種FP-Growth算法挖掘FP-Tree過程的優(yōu)化算法,此優(yōu)化算法利用了項合并的策略減小挖掘FP-Tree時的搜索空間,進行剪枝合并,從而大大減少挖掘過程中迭代的次數(shù)。

參考文獻:

[1]高明.關(guān)聯(lián)規(guī)則挖掘算法的研究及其應(yīng)用[D].山東師范大學(xué),2006.

[2]廖偉國,張宏書.關(guān)聯(lián)規(guī)則挖掘研究綜述[J].網(wǎng)絡(luò)財富,2009(4):26-27.

[3]黃鶴.關(guān)聯(lián)規(guī)則算法綜述[J].軟件導(dǎo)刊,2009(03):56-57.

[4]王小虎.關(guān)聯(lián)規(guī)則挖掘綜述[J].計算機工程與應(yīng)用,2003(33):190-193.

[5]Jiawei Han,Micheline Kamber.數(shù)據(jù)挖掘:概念與技術(shù)[M].北京:機械工業(yè)出版社,2013:170.

[作者簡介]丁鐵凡(1988-),男,碩士學(xué)位,研究方向:大數(shù)據(jù)、數(shù)據(jù)挖掘;張振友(1964-),男,副教授,碩士學(xué)位,研究方向:異構(gòu)數(shù)據(jù)庫、電子商務(wù);代晨旭(1988-),女,學(xué)士學(xué)位,研究方向:大數(shù)據(jù)、數(shù)據(jù)挖掘。

[基金項目]河北省自然科學(xué)基金資助項目(項目編號:F2012401050)。

主站蜘蛛池模板: 欧洲一区二区三区无码| 91精品啪在线观看国产60岁| 不卡的在线视频免费观看| 扒开粉嫩的小缝隙喷白浆视频| 青青青视频91在线 | 亚洲国产精品美女| 四虎永久免费在线| 国产欧美日韩另类精彩视频| 天天摸夜夜操| 日韩精品一区二区三区大桥未久| 国产成人精品视频一区二区电影 | 亚洲日本一本dvd高清| 久久国产精品麻豆系列| 亚洲国产天堂久久综合| 一级一级特黄女人精品毛片| 真实国产乱子伦视频| 四虎永久在线精品国产免费| 亚洲成在人线av品善网好看| 亚洲天堂日韩av电影| 成人福利在线免费观看| 中国黄色一级视频| 色综合久久久久8天国| 秋霞一区二区三区| 亚洲床戏一区| 久久综合色视频| 女同国产精品一区二区| 国产精品一区不卡| 91精品专区国产盗摄| 欧洲精品视频在线观看| 免费观看精品视频999| 久久无码高潮喷水| 性69交片免费看| 欧洲成人在线观看| 丁香亚洲综合五月天婷婷| 玖玖免费视频在线观看| 久久综合伊人 六十路| 亚洲欧美成人综合| 91小视频版在线观看www| 黄色网站不卡无码| 中文字幕日韩视频欧美一区| 黄色国产在线| 国产丝袜一区二区三区视频免下载| 亚洲日韩每日更新| 自拍亚洲欧美精品| 色噜噜狠狠狠综合曰曰曰| 九九久久精品免费观看| 香蕉视频在线精品| 极品国产在线| 国产va免费精品观看| 日本免费a视频| 久久人与动人物A级毛片| 在线观看免费国产| 国产精品久久久久久久伊一| 熟妇丰满人妻av无码区| 亚洲日本中文字幕乱码中文| 尤物成AV人片在线观看| 亚洲欧美一区二区三区麻豆| 欧美精品xx| 久久这里只有精品23| 97se亚洲综合在线天天| 国产产在线精品亚洲aavv| 亚洲精品卡2卡3卡4卡5卡区| 久久久久中文字幕精品视频| 极品私人尤物在线精品首页| 国产精品第三页在线看| 久久综合伊人77777| 亚州AV秘 一区二区三区| 亚洲永久色| 国产成人综合亚洲欧美在| 91久久性奴调教国产免费| 最近最新中文字幕免费的一页| 国产欧美精品一区二区| 亚洲最新在线| 婷婷六月综合网| 青青青伊人色综合久久| 亚洲性影院| www.亚洲国产| 综合成人国产| 欧美精品亚洲二区| 国产啪在线| 婷婷五月在线视频| 毛片网站观看|