999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于主成分分析的模糊頻繁項(xiàng)集合挖掘方法

2022-03-15 10:33:00耿立校李恒昱劉麗莎
計(jì)算機(jī)仿真 2022年2期
關(guān)鍵詞:規(guī)則方法

耿立校,李恒昱,劉麗莎

(河北工業(yè)大學(xué),天津 300401)

1 引言

模糊頻繁項(xiàng)集合的挖掘是數(shù)據(jù)挖掘的關(guān)鍵步驟[1],但通常情況下頻繁項(xiàng)集合的數(shù)量較多,導(dǎo)致挖掘過程難度較大。針對數(shù)據(jù)中最大模糊頻繁項(xiàng)集合中含有頻繁項(xiàng)的特點(diǎn),對模糊頻繁項(xiàng)集合挖掘展開研究[2,3]。

文獻(xiàn)[4]提出基于高效改進(jìn)的模糊頻繁項(xiàng)集合挖掘方法。該方法首先掃描數(shù)據(jù)庫,構(gòu)建存儲項(xiàng)集關(guān)系的"投影"數(shù)據(jù)架構(gòu),提取出頻繁1-項(xiàng)集和頻繁2-項(xiàng)集,其次構(gòu)建高階項(xiàng)集的位置索引表,在跨越式搜索和連接的基礎(chǔ)上找出模糊頻繁項(xiàng)集合,實(shí)現(xiàn)模糊頻繁項(xiàng)集合挖掘。但是由于該方法在模糊頻繁項(xiàng)集合挖掘前沒有對數(shù)據(jù)進(jìn)行預(yù)處理,無法減少數(shù)據(jù)變量中的項(xiàng),導(dǎo)致冗余數(shù)據(jù)的計(jì)算量過大,進(jìn)而加大了方法運(yùn)行內(nèi)存。文獻(xiàn)[5]提出基于DiffNodeset結(jié)構(gòu)的模糊頻繁項(xiàng)集合挖掘方法。該方法運(yùn)用數(shù)據(jù)結(jié)構(gòu)DiffNodeset求出支持度,并利用線性連接方法來降低連接的復(fù)雜度,減少無效計(jì)算量,其次在集合枚舉樹搜索空間的基礎(chǔ)上利用優(yōu)化剪枝策略減小搜索空間范圍,最后中和超集檢測技術(shù)提取模糊頻繁項(xiàng)集合,實(shí)現(xiàn)模糊頻繁項(xiàng)集合挖掘,該方法未利用主成分分析法對數(shù)據(jù)進(jìn)行降維,而是直接對數(shù)據(jù)重新運(yùn)算,只能在原始信息素排序表的基礎(chǔ)上進(jìn)行挖掘,該方法的挖掘計(jì)算量過大。文獻(xiàn)[6]提出基于AO算法的模糊頻繁項(xiàng)集合挖掘方法,該方法在滑動(dòng)窗口思想的基礎(chǔ)上對模糊頻繁項(xiàng)集合分塊挖掘,當(dāng)滿窗口有模糊頻繁項(xiàng)集合進(jìn)入時(shí),利用區(qū)域插入的方式獲取全新模糊頻繁項(xiàng)集合,并求解支持度,同時(shí)結(jié)合超集檢測,保證在最高效率下挖掘出模糊頻繁項(xiàng)集合,實(shí)現(xiàn)模糊頻繁項(xiàng)集合挖掘,該方法沒有對模糊頻繁項(xiàng)集合進(jìn)行間隔約束處理而是直接挖掘模糊頻繁項(xiàng)集合,導(dǎo)致散亂數(shù)據(jù)不能保持平衡,數(shù)據(jù)散亂程度過高,該方法的準(zhǔn)確率、召回率和F1值均均不夠理想。

為解決上述方法中存在的問題,引入主成分分析法,優(yōu)化間隔約束條件下的模糊頻繁項(xiàng)集合挖掘方法。通過實(shí)驗(yàn)驗(yàn)證了所提方法具有一定應(yīng)用優(yōu)勢,為相關(guān)領(lǐng)域的研究提供可靠依據(jù)。

2 模糊頻繁項(xiàng)集合預(yù)處理

2.1 修補(bǔ)模糊頻繁缺損數(shù)據(jù)

經(jīng)過標(biāo)準(zhǔn)化處理后的模糊頻繁數(shù)據(jù)可相互對比,進(jìn)而排除量綱帶來的影響[7],假設(shè)標(biāo)準(zhǔn)化處理后的模糊頻繁項(xiàng)集合為X,X是由n個(gè)自身帶有s維模糊頻繁項(xiàng)數(shù)據(jù)的向量X1,X2,…,Xn組成,其中向量Xj=(x1j,x2j,…,xsj)T∈Rs,j=1,2,…,n,xi0j0是模糊頻繁項(xiàng)的缺損數(shù)據(jù),即需要修補(bǔ)的模糊頻繁項(xiàng)數(shù)據(jù)。

假設(shè)向量Xj中的行向量為bi(i=1,…,s),列向量為aj(j=1,…,n),則模糊頻繁項(xiàng)集合X的矩陣表達(dá)式為

(1)

將模糊頻繁項(xiàng)集合X中的缺損數(shù)據(jù)xi0j0所在的第i0行進(jìn)行消除,獲取全新數(shù)據(jù)A,其矩陣表達(dá)式為

(2)

(3)

(4)

根據(jù)上述算法的逆過程將標(biāo)準(zhǔn)化數(shù)據(jù)還原成帶有量綱的數(shù)據(jù),最終輸出的數(shù)據(jù)就是標(biāo)準(zhǔn)化后的完整數(shù)據(jù)。

2.2 基于主成分分析法的數(shù)據(jù)降維

主成分分析法是數(shù)據(jù)降維的重要手段之一,可提高數(shù)據(jù)挖掘效率,與其它降維手段相比,主成分分析法的降維力度最強(qiáng)[8],該方法將修補(bǔ)后的完整模糊頻繁項(xiàng)數(shù)據(jù)進(jìn)行數(shù)值化處理,并按照數(shù)據(jù)類型將模糊頻繁項(xiàng)數(shù)據(jù)劃分成多個(gè)子數(shù)據(jù)集,并逐一進(jìn)行降維,保證最大程度地排除數(shù)據(jù)中的冗余特征,其大致過程為:

①構(gòu)建觀測矩陣

假設(shè)數(shù)據(jù)中含有m個(gè)變量,對所有變量進(jìn)行n次觀測后每個(gè)子數(shù)據(jù)中都會生成n條樣本數(shù)據(jù),進(jìn)而生成的觀測數(shù)據(jù)矩陣表達(dá)式為

(5)

式中,xij表示分割后的子數(shù)據(jù)集,m表示模糊頻繁項(xiàng)數(shù)據(jù)矩陣的行,即矩陣的每一行均是數(shù)據(jù)進(jìn)行數(shù)值化后的一個(gè)樣本模糊頻繁項(xiàng)數(shù)據(jù),n表示模糊頻繁項(xiàng)數(shù)據(jù)矩陣的列,即劃分后的子數(shù)據(jù)內(nèi)的主成分樣本個(gè)數(shù)。

②數(shù)據(jù)中心標(biāo)準(zhǔn)化

(6)

③求解樣本數(shù)據(jù)相關(guān)矩陣R

④特征分解矩陣R,獲取R=U∧UT

1)計(jì)算樣本相關(guān)矩陣R的特征值

經(jīng)計(jì)算發(fā)現(xiàn)矩陣R中含有m個(gè)特征值,將所有特征值自大到小的順序進(jìn)行排列后得到λ1≥λ2≥…≥λm≥0,進(jìn)而求出所有主成分的貢獻(xiàn)率,從中選取貢獻(xiàn)率在85%以上的成分,并在這些成分中篩選出符合特征值小于1的前p主成分,篩選后的成分記為主成分分析結(jié)果,則主成分貢獻(xiàn)率公式為

Cj=λj/(λ1+λ2+…+λm)

(7)

利用式(10)即可計(jì)算出每個(gè)主成分的貢獻(xiàn)率,即每種成分可提供的信息量,Cj越大說明成分中信息量越多,且每個(gè)成分各自獨(dú)立存在,即不存在信息重復(fù)的情況,因此提取滿足上式兩個(gè)要求的特征值即可。

2)計(jì)算特征向量

根據(jù)特征值的排序運(yùn)算出對應(yīng)的特征向量eig1,eig2,…,eigm,這些特征向量屬于單位向量,即|eigi|=1,且特征向量兩兩相交,即eigi⊥eigj。

3)構(gòu)建主成分載荷矩陣

根據(jù)貢獻(xiàn)率最高的前p個(gè)主成分生成主成分載荷陣Um×p=(eig1,eig2,…,eigp),則此矩陣就是主成分分析的最終結(jié)果,其中,m是特征向量的個(gè)數(shù)。

⑤將原始變量轉(zhuǎn)換為主成分變量即可實(shí)現(xiàn)特征降維,即最大程度減少模糊頻繁項(xiàng)數(shù)據(jù)數(shù)量,其表達(dá)式為

(8)

式中,ηi表示轉(zhuǎn)化后的主成分變量,其中i=1,2,…,p,ξj表示原始變量,且j=1,2,…,m。

2.3 間隔約束最大模糊頻繁項(xiàng)目集

在實(shí)際挖掘過程中,有項(xiàng)約束是最常用的約束條件[9],假設(shè)項(xiàng)目約束條件是B,且B為I內(nèi)的布爾代表公式,I是由多個(gè)不同的模糊頻繁項(xiàng)目構(gòu)成的集合,將約束條件B轉(zhuǎn)換成析取范式(DNF),即B1∨B2∨B3∨…∨Bk形式,在DNF形式下的約束條件集合為B={B1,B2,B3,…,BK},且每個(gè)Bi表示b1∧b2∧b3∧…∧b1,其中bj∈I,假設(shè)T是模糊頻繁項(xiàng)目集合的一個(gè)交易數(shù)據(jù)庫,已知布爾表達(dá)式B,則可將間隔約束條件下的模糊頻繁項(xiàng)目集合挖掘問題轉(zhuǎn)化成提取符合約束條件B的模糊頻繁項(xiàng)目集合問題,且挖掘過程中還需保證挖掘結(jié)果的支持度大于等于固定的最小支持度閾值[10]。

3 模糊頻繁項(xiàng)目集合挖掘

模糊頻繁項(xiàng)集合中的數(shù)據(jù)雖隸屬于同一數(shù)據(jù)庫,但實(shí)際上數(shù)據(jù)分散在各個(gè)場地,將模糊頻繁項(xiàng)數(shù)據(jù)利用傳統(tǒng)方法進(jìn)行分類難度較大,而蟻群優(yōu)化系統(tǒng)具有記憶性、自主性、反應(yīng)性、容錯(cuò)性、社會性、移動(dòng)性以及適應(yīng)性等優(yōu)點(diǎn)[11],基于以上優(yōu)點(diǎn)可將此方法應(yīng)用于數(shù)據(jù)挖掘中,同時(shí)可建立出一條又一條互不依賴的規(guī)則,按照歷史錯(cuò)誤更新經(jīng)驗(yàn),逐一計(jì)算得出最優(yōu)解,即生成ACO分布式分類算法,此算法首先將數(shù)據(jù)進(jìn)行初始化處理,獲取所有挖掘通道的相關(guān)信息,并計(jì)算出數(shù)據(jù)相關(guān)函數(shù),進(jìn)而生成一條有規(guī)則又互不依賴的數(shù)據(jù)挖掘通道,其次修剪規(guī)則從而修改蟻群爬行路徑的信息,最終在所有規(guī)則中提取出一條質(zhì)量最優(yōu)的規(guī)則,根據(jù)此規(guī)則挖掘出模糊頻繁項(xiàng)數(shù)據(jù)。

綜上所述可知在建立規(guī)則前必須提前求解規(guī)則內(nèi)所需的條件項(xiàng),并根據(jù)規(guī)則自身的條件項(xiàng)得出可能執(zhí)行此任務(wù)的可能性P,其表達(dá)式為

Pij(t)=Rij(t)2/θ+Rij(t)2

(9)

利用蟻群算法建立出規(guī)則后的信息素總數(shù)表達(dá)式為

τij(t)=τij(t-1)·(1-1/(1+Q))

+(1-ρ)·τij(t-1)

(10)

式中,ρ表示信息素可能損失的概率,Q表示根據(jù)蟻群算法建立的規(guī)則質(zhì)量。

參數(shù)ρ可直接反映出蟻群算法在爬行過程中信息的損失速度,因此參數(shù)ρ越大,此路徑中的信息損失速度越快。在對一個(gè)訓(xùn)練集進(jìn)行多次蟻群算法后即可獲取多條數(shù)據(jù)分類規(guī)則,利用Q選取出其中質(zhì)量最優(yōu)的規(guī)則,則Q的表達(dá)式為

Q=(TruePos/FalseNeg+TruePos)×

(TrueNeg/FalsePos+TrueNeg)

(11)

式中,TruePos代表規(guī)則路徑中滿足規(guī)則的條件項(xiàng),且此條件項(xiàng)的數(shù)量和預(yù)測出規(guī)則類型數(shù)量一致,F(xiàn)alsePos代表規(guī)則路徑中滿足規(guī)則的條件項(xiàng),但此條件項(xiàng)的數(shù)量和預(yù)測出規(guī)則類型數(shù)量不相同,F(xiàn)alseNeg代表規(guī)則路徑中不符合規(guī)則的條件項(xiàng),但此條件項(xiàng)的數(shù)量和預(yù)測出規(guī)則類型數(shù)量一致,TeueNeg代表規(guī)則路徑中不符合規(guī)則的條件項(xiàng),且此條件項(xiàng)的數(shù)量和預(yù)測出規(guī)則類型數(shù)量不相同。

根據(jù)信息素和啟發(fā)函數(shù)值選出最優(yōu)規(guī)則路徑后將條件項(xiàng)添加到規(guī)則路徑中,保證數(shù)據(jù)分類準(zhǔn)確率最高的同時(shí)還可簡化分類規(guī)則[12],將數(shù)據(jù)進(jìn)行最優(yōu)分類,實(shí)現(xiàn)模糊頻繁項(xiàng)集合挖掘。

4 實(shí)驗(yàn)與結(jié)果

為驗(yàn)證所提方法的整體有效性,對間隔約束條件下的模糊頻繁項(xiàng)集合挖掘方法、文獻(xiàn)[4]方法和文獻(xiàn)[5]方法進(jìn)行運(yùn)行內(nèi)存和挖掘有效性的測試。

4.1 運(yùn)行內(nèi)存大小測試

根據(jù)圖1可看出隨著最小支持度的增加,三種挖掘方法的運(yùn)行內(nèi)存均有所下降,進(jìn)而提高系統(tǒng)的流暢程度,但所提方法的運(yùn)行內(nèi)存最大為65M,隨著最小支持度的增加其運(yùn)行內(nèi)存一直在下降,因此所提方法的系統(tǒng)最流暢,其它兩種方法的運(yùn)行內(nèi)存過于依賴系統(tǒng)支持度,在支持度過小的情況下兩種方法的最大運(yùn)行內(nèi)存分別為105M和140M,導(dǎo)致文獻(xiàn)[4]方法和文獻(xiàn)[5]方法的系統(tǒng)比較卡頓,而所提方法可一直保證系統(tǒng)流暢是因?yàn)樵谶M(jìn)行模糊頻繁項(xiàng)集合挖掘前對數(shù)據(jù)進(jìn)行了預(yù)處理,數(shù)據(jù)變量中的項(xiàng)明顯下降,排除大量冗余數(shù)據(jù),保證了系統(tǒng)的流暢程度,降低運(yùn)行內(nèi)存使用率。

圖1 不同方法的運(yùn)行內(nèi)存使用情況

4.2 挖掘有效性測試

隨機(jī)選取了六組訓(xùn)練數(shù)據(jù),比較三種方法處理后的數(shù)據(jù)精確率、召回程度以及F1值,模糊頻繁項(xiàng)集合中的信息素比較散亂,對這種數(shù)據(jù)進(jìn)行挖掘有較大的難度,難以保證其挖掘有效性,如圖2所示,文獻(xiàn)[4]方法在挖掘時(shí)只能加大計(jì)算量進(jìn)而提高準(zhǔn)確率、召回率和F1值,文獻(xiàn)[5]方法沒有做任何處理,導(dǎo)致其挖掘有效性十分低下,而所提方法經(jīng)過對數(shù)據(jù)的間隔約束處理后進(jìn)行數(shù)據(jù)挖掘,相當(dāng)于將信息素進(jìn)行一個(gè)平衡處理,使得數(shù)據(jù)的散亂程度有所改善,因此無論是所提方法的準(zhǔn)確率、召回率還是F1值,它都是三種方法中最優(yōu)的方法,驗(yàn)證了所提方法的有效性。

圖2 不同方法的挖掘有效性

5 結(jié)束語

為解決目前方法所存在的問題,提出了間隔約束條件下的模糊頻繁項(xiàng)集合挖掘方法,該方法首先對模糊頻繁項(xiàng)集合進(jìn)行預(yù)處理和約束,其次利用蟻群算法分類項(xiàng)目,最終實(shí)現(xiàn)模糊頻繁項(xiàng)集合挖掘,解決運(yùn)行內(nèi)存過大和挖掘有效性低的問題,此方法提高項(xiàng)集查找速度,將原本需要多次完成的任務(wù)一次完成,大大縮小工作壓力,降低成本。

猜你喜歡
規(guī)則方法
撐竿跳規(guī)則的制定
數(shù)獨(dú)的規(guī)則和演變
學(xué)習(xí)方法
規(guī)則的正確打開方式
幸福(2018年33期)2018-12-05 05:22:42
讓規(guī)則不規(guī)則
Coco薇(2017年11期)2018-01-03 20:59:57
TPP反腐敗規(guī)則對我國的啟示
搜索新規(guī)則
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
主站蜘蛛池模板: 激情国产精品一区| 色AV色 综合网站| 国产精品无码制服丝袜| 在线免费观看AV| 99久久精品免费观看国产| 农村乱人伦一区二区| 亚洲精品成人福利在线电影| 欧美日韩在线国产| 高清无码一本到东京热| 欧美中文字幕在线视频| 99er这里只有精品| 色综合久久无码网| 99久久国产自偷自偷免费一区| 毛片国产精品完整版| 日韩无码视频播放| 亚洲精品色AV无码看| 91精品国产91久无码网站| 思思热在线视频精品| 久久久噜噜噜| 久综合日韩| 成年人视频一区二区| 国产高颜值露脸在线观看| 色综合激情网| 国产精品永久久久久| 在线国产毛片手机小视频| 在线精品视频成人网| 奇米影视狠狠精品7777| 国产H片无码不卡在线视频| 91蜜芽尤物福利在线观看| 中文纯内无码H| 亚洲成综合人影院在院播放| 日韩高清欧美| 爱爱影院18禁免费| 99在线视频网站| 51国产偷自视频区视频手机观看| 久久人体视频| jizz国产视频| 亚洲国产一区在线观看| 特级毛片8级毛片免费观看| 亚洲天堂免费在线视频| 欧美在线一二区| 久久国产拍爱| 无码视频国产精品一区二区| 不卡色老大久久综合网| 人妻少妇久久久久久97人妻| 国产第二十一页| 99热国产这里只有精品9九| 亚洲人成网站日本片| 国产成人乱无码视频| 亚洲天堂在线免费| 蜜桃视频一区二区| 国产午夜不卡| 国产免费福利网站| 亚洲色欲色欲www网| 亚洲国产精品久久久久秋霞影院| 国内毛片视频| 六月婷婷激情综合| 国产成人永久免费视频| 国产欧美精品午夜在线播放| 成人免费午夜视频| 国产免费黄| 亚洲国产欧美国产综合久久| 午夜激情婷婷| 亚洲视频四区| 五月天香蕉视频国产亚| 亚洲最黄视频| 思思热在线视频精品| 一本大道东京热无码av | 国产成人1024精品| 第一页亚洲| 亚洲乱伦视频| 草草影院国产第一页| 国产一区二区三区精品久久呦| 国产美女主播一级成人毛片| 国产黄在线免费观看| 91小视频在线观看免费版高清| 五月天久久婷婷| 国产成人精品亚洲77美色| 日本不卡视频在线| 亚洲男人的天堂网| 97久久精品人人做人人爽| 国产成人91精品免费网址在线|