999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數(shù)據(jù)挖掘技術與關聯(lián)規(guī)則挖掘算法

2017-03-06 21:53:39何棟
電子技術與軟件工程 2016年23期
關鍵詞:數(shù)據(jù)挖掘關聯(lián)規(guī)則

何棟

摘 要

當今是一個信息技術飛速發(fā)展的時代,人們在日常的生活和工作中產(chǎn)生的數(shù)據(jù)量越來越大,要讓人們理解和接受這些錯綜復雜的數(shù)據(jù),數(shù)據(jù)研究工作者需要采用數(shù)據(jù)挖掘技術來解決這一難題。本研究就對數(shù)據(jù)挖掘技術進行分析,并對當前運用較多的關聯(lián)規(guī)則挖掘算法進行探討。

【關鍵詞】數(shù)據(jù)挖掘 關聯(lián)規(guī)則算法

數(shù)據(jù)挖掘是對數(shù)據(jù)進行理解分析,對數(shù)據(jù)中隱藏的知識進行挖掘發(fā)現(xiàn)的技術,所以也稱為數(shù)據(jù)庫中的知識發(fā)現(xiàn)(KDD)。數(shù)據(jù)挖掘技術在近幾年來的研究越來越深入,這是數(shù)據(jù)研究工作者經(jīng)過長期在大量的應用過程中探索研究的成果。在數(shù)據(jù)挖掘技術中的關聯(lián)規(guī)則是應用較為廣泛的一種算法,數(shù)據(jù)研究工作者在大量數(shù)據(jù)中獲取微量信息時,關聯(lián)規(guī)則能發(fā)揮其重要的價值。本研究在對數(shù)據(jù)挖掘技術相關概念進行分析的基礎上,對關聯(lián)規(guī)則中的集中常用算法進行探討,以期為數(shù)據(jù)研究工作這提供可靠參考。

1 數(shù)據(jù)挖掘技術介紹

1.1 數(shù)據(jù)挖掘技術的概念

數(shù)據(jù)挖掘技術是一門包容性以及開放性較強的跨領域數(shù)據(jù)信息揭示學科,這項技術能從大量含有噪聲,且模糊不確定的實際業(yè)務數(shù)據(jù)中進行計算,在這些數(shù)據(jù)中對當前尚未發(fā)現(xiàn),或者沒有被明確認知的具有一定價值的知識信息進行揭示。在進行數(shù)據(jù)挖掘中的業(yè)務數(shù)據(jù)形式不是單一固定的,是復雜多樣的,所以數(shù)據(jù)挖掘得出的分析結(jié)果形式能以多種形式表現(xiàn)出來,可以是具有較強邏輯性的數(shù)學表達式,也可以是容易被一般用戶理解的結(jié)果。且數(shù)據(jù)挖掘技術在科學研究、市場分析等領域均得到了廣泛的應用。

1.2 數(shù)據(jù)挖掘技術分類

數(shù)據(jù)挖掘功能的分類主要是根據(jù)數(shù)據(jù)挖掘功能的不同進行的,當前的數(shù)據(jù)挖掘技術主要有關聯(lián)規(guī)則挖掘技術、分類挖掘技術、孤立點挖掘技術以及聚類挖掘技術等。本研究主要對關聯(lián)規(guī)則挖掘算法進行詳細探討。

2 關聯(lián)規(guī)則挖掘算法

2.1 關聯(lián)規(guī)則種類介紹

關聯(lián)規(guī)則按照不同的標準,能用各種不同的方法分成不同類型。將關聯(lián)規(guī)則分為挖掘頻繁項集、閉頻繁項集、被約束頻繁項集、極大頻繁項集,是根據(jù)挖掘模式的完全性分類的;將關聯(lián)規(guī)則分為多層和單層關聯(lián)規(guī)則,以及單位和多維關聯(lián)規(guī)則是根據(jù)規(guī)則所涉及的數(shù)據(jù)進行分類的;將關聯(lián)規(guī)則分為量化關聯(lián)規(guī)則和挖掘布爾型規(guī)則是根據(jù)規(guī)則處理值類型分類的;將關聯(lián)規(guī)則分為序列模式挖掘、頻繁項集挖掘以及結(jié)構(gòu)模式挖掘是根據(jù)俄關聯(lián)規(guī)則挖掘模式進行分類的;將關聯(lián)規(guī)則分為興趣度約束、知識類型約束、數(shù)據(jù)約束,是根據(jù)規(guī)則所挖掘的約束類型分類的。

2.2 關聯(lián)規(guī)則挖掘算法分析

2.2.1 Apriori算法分析

關聯(lián)規(guī)則算法中的挖掘完全頻繁項集中,Apriori算法該類型中最具有應用價值,影響力最大的算法。Apriori算法主要有兩個步驟:

(1)發(fā)現(xiàn)所有的頻繁集;

(2)生成強關聯(lián)規(guī)則。

在Apriori算法中的第一步是最為重要的步驟,該算法的核心思路是,給定一個數(shù)據(jù)庫,在第一次數(shù)據(jù)庫掃描中找出所有支持度大于等于最小支持度的項目組成頻繁1—項集,也就是L1,1—項集C1,由L1進行連接得到;接著進行第二次數(shù)據(jù)庫掃描,將C1中所有支持度大于等于最小支持度的項集組成頻繁2—項集,也就是L2,候選2—項集C2由L2連接得到。以此類推,直到找出最大項頻繁集。即在進行第N次數(shù)據(jù)庫掃描時,找出CN-1中所有支持度大于等于最小支持度的項集組成頻繁N—項集,即是LN,N—項集CN要由LN連接得出,一直到找不出新的選集為止。在這里還要用到Apriori算法性質(zhì),即是頻繁項集是頻繁項集的子集,非頻繁項集是非頻繁項集的超集。在Apriori算法中對數(shù)據(jù)庫的掃描次數(shù)需要大于最大頻繁項集的項數(shù)。

Apriori算法的操作具有兩個明顯的缺點。(1)該算法的使用需要對數(shù)據(jù)庫進行多次掃描,因此在讀寫操作上會花費很多的時間,從而增加挖掘算法的時間成本,這種成本的增加不可小覷,因為它是有數(shù)據(jù)庫存儲數(shù)據(jù)的增加,以幾何級數(shù)上升的成本;

(2)Apriori算法會出現(xiàn)眾多的候選頻繁集,頻發(fā)集的產(chǎn)生量在每一步都很大,這會使算法在廣泛度和深入度上的適應性較差。

2.2.2 FP—growth算法分析

FP—growth算法是關聯(lián)規(guī)則算法中屬于深度優(yōu)化的一種算法,這種算法是深度優(yōu)化算法中較新且具有較高成效的,不同于Apriori算法本質(zhì)的常用算法。FP?—growth算法的基本基本步驟有兩個:

(1)先將頻繁模式樹FP—tree生成;

(2)在生成的FP—tree頻繁模式樹中搜索頻繁項集。

(1)需要將項集關聯(lián)信息保留住,并采用一棵頻繁模式樹(FP—tree)用來容納壓縮后的數(shù)據(jù)庫;

(2)再將壓縮后的FP—tree再分散為幾個小的條件數(shù)據(jù)庫,再分別對這些數(shù)據(jù)庫進行信息挖掘。FP—growth算法相較于Apriori算法,只需要對數(shù)據(jù)庫進行兩次掃描,不需要多次掃描,大幅度減少了挖掘算法的時間成本;也不會出現(xiàn)大量的候選項集,大幅度減少了頻繁集的搜索空間。也就是說FP—growth算法能明顯提高時間和空間效率。但是該算法也有缺點,在對龐大且松散的數(shù)據(jù)庫進行挖掘處理過程中,不管是遞歸計算還是信息挖掘都需要占據(jù)大量的空間。

3 總結(jié)

綜上所述,本研究對對數(shù)據(jù)挖掘技術概念和分類進行了簡單的介紹,并對關聯(lián)規(guī)則的種類進行了詳細的分析,對關聯(lián)規(guī)則中常用的兩種算法FP—growth算法和Apriori算法進行了詳細的分析。兩種算法都還存在各自需要改進缺點,怎樣在挖掘過程中提高挖掘效率,滿足人們對挖掘系統(tǒng)的需求,這將是數(shù)據(jù)研究工作者仍然需要突破的重難點。

參考文獻

[1]毛國君.數(shù)據(jù)挖掘技術與關聯(lián)規(guī)則挖掘算法研究[D].北京:北京工業(yè)大學,2015.

[2]張弛,王本德,李偉等.數(shù)據(jù)挖掘技術在水文預報中的應用及水文預報發(fā)展趨勢研究[J].水文,2015,27(02):74-77,85.

[3]魏陵博,付先軍.基于Aprio關聯(lián)規(guī)則挖掘技術分析歸心經(jīng)中藥與抗心律失常藥理作用的相關因素[J].中西醫(yī)結(jié)合心腦血管病雜志,2014(05):517-518.

[4]付先軍,周永紅,王中琳等.基于頻繁項集與關聯(lián)規(guī)則挖掘技術探索王新陸臨床用藥及處方配伍規(guī)律的初步研究[J].中國中醫(yī)藥信息雜志,2015,17(09):92-94.

[5]郭濤,門瑞.關于數(shù)據(jù)挖掘技術與關聯(lián)規(guī)則挖掘算法的研究[J].無線互聯(lián)科技,2014(10):150-150,264.

作者單位

山西輕工職業(yè)技術學院 山西省太原市 030013

猜你喜歡
數(shù)據(jù)挖掘關聯(lián)規(guī)則
撐竿跳規(guī)則的制定
“苦”的關聯(lián)
當代陜西(2021年17期)2021-11-06 03:21:36
數(shù)獨的規(guī)則和演變
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
奇趣搭配
讓規(guī)則不規(guī)則
Coco薇(2017年11期)2018-01-03 20:59:57
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規(guī)則對我國的啟示
一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
主站蜘蛛池模板: 欧美三级自拍| 精品国产成人国产在线| 在线色综合| 国内精品久久人妻无码大片高| 中文字幕久久精品波多野结| 77777亚洲午夜久久多人| 91年精品国产福利线观看久久| 91久久精品国产| 欧美激情,国产精品| 日韩福利在线视频| 成人在线不卡| 免费一级全黄少妇性色生活片| 成人综合久久综合| 久久综合丝袜长腿丝袜| 99视频在线精品免费观看6| 国产精品流白浆在线观看| 欧美一区二区福利视频| 国产一区在线视频观看| 日韩免费视频播播| 日韩精品中文字幕一区三区| 日本不卡在线播放| 亚洲男人天堂网址| 国产精品福利社| 国产91高清视频| 国产精品成人AⅤ在线一二三四 | 欧美一区二区啪啪| 国产青榴视频在线观看网站| 韩日无码在线不卡| 18禁黄无遮挡网站| 永久天堂网Av| 四虎影视无码永久免费观看| 亚洲中文字幕无码爆乳| 日韩国产欧美精品在线| 福利在线一区| 欧美性精品| a级毛片免费网站| 园内精品自拍视频在线播放| 亚洲性影院| 亚洲伊人电影| 色亚洲成人| 美女被操91视频| 亚洲精品欧美日本中文字幕| 波多野结衣爽到高潮漏水大喷| 亚洲成a人片在线观看88| 精品午夜国产福利观看| 色成人综合| 激情综合婷婷丁香五月尤物| 女人18毛片一级毛片在线 | 日本欧美一二三区色视频| 国产永久无码观看在线| 91亚瑟视频| 高清国产在线| jizz国产在线| 亚洲成年人片| 久热中文字幕在线| 亚洲黄色片免费看| 成人精品免费视频| 伊人激情久久综合中文字幕| 色天天综合久久久久综合片| 亚洲无码视频一区二区三区 | 国产特级毛片aaaaaa| 区国产精品搜索视频| 毛片一级在线| 中文字幕1区2区| 欧美色亚洲| 国产精品女主播| 九九九精品成人免费视频7| 香蕉视频国产精品人| 一级毛片免费的| 特级做a爰片毛片免费69| 蜜臀av性久久久久蜜臀aⅴ麻豆| 欧美成人免费一区在线播放| 国产第二十一页| 国产麻豆精品久久一二三| 免费观看三级毛片| 亚洲精品天堂自在久久77| 久久国产精品无码hdav| 国产女人在线观看| 国产成人精品18| 幺女国产一级毛片| 日本不卡在线播放| 黄色网在线免费观看|