999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數(shù)據(jù)環(huán)境下關聯(lián)規(guī)則挖掘的應用研究

2017-09-12 23:57:18陳梅
山東工業(yè)技術 2017年18期
關鍵詞:大數(shù)據(jù)應用

摘 要:本文從大數(shù)據(jù)角度分析了現(xiàn)代數(shù)據(jù)的特點,概述了關聯(lián)規(guī)則的三種方法思想及優(yōu)缺點,并且列舉了其在幾個行業(yè)中的應用。

關鍵詞:大數(shù)據(jù);關聯(lián)規(guī)則;應用

DOI:10.16640/j.cnki.37-1222/t.2017.18.134

關聯(lián)規(guī)則用于表示對象之間的關系和規(guī)律,而數(shù)據(jù)挖掘領域中最重要的研究內容也正是規(guī)則的提取。關聯(lián)規(guī)則挖掘吸引了諸多國內外專家學者的研究興趣,并取得了良好成果,如Apriori 算法和FP-Growth算法。經(jīng)過多年多為學者的研究,商業(yè)決策、醫(yī)療數(shù)據(jù)分析等各個領域都對關聯(lián)規(guī)則相關算法進行了驗證,并產(chǎn)生了良好的經(jīng)濟和社會價值。

1 大數(shù)據(jù)

隨著網(wǎng)絡和移動互聯(lián)的發(fā)展,企業(yè)所獲得的數(shù)據(jù)越來越多、結構也越來越復雜,傳統(tǒng)的數(shù)據(jù)挖掘技術已經(jīng)不能滿足需求,這就促使企業(yè)在收集數(shù)據(jù)之余,也開始尋求新方法來解決大量數(shù)據(jù)無法存儲和處理分析的問題。由此,“大數(shù)據(jù)”應運而生。

從“Data”到“BigData”,數(shù)據(jù)的數(shù)量和質量都有了本質的區(qū)別。在“數(shù)據(jù)時代”專家學者都是用聯(lián)機分析處理(OLAP)、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘等方式處理數(shù)據(jù),而在“大數(shù)據(jù)時代”,數(shù)據(jù)已不僅僅是需要分析處理的內容,人們更看重的是使用更為高端專業(yè)的技術從大量繁雜的數(shù)據(jù)中,進行整理和分析,得出有意義的關聯(lián)信息,為社會經(jīng)濟生活中各個行業(yè)的預測、規(guī)劃和決策做出支持。

如何在大數(shù)據(jù)時代的繁雜數(shù)據(jù)中抽取出更有價值的關聯(lián)規(guī)則,對各個行業(yè)的發(fā)展決策起指導性作用就顯得尤為重要。

2 關聯(lián)規(guī)則

2.1 關聯(lián)規(guī)則定義

關聯(lián)規(guī)則是數(shù)據(jù)庫中不同數(shù)據(jù)項之間有意義和價值的聯(lián)系,可用A =>B 表示,其中 A 、B 均為非空項集。通過描述數(shù)據(jù)項之間預先未知的和被隱藏的潛在規(guī)則,找出滿足給定支持度(support)和置信度(confidence)閾值的多個數(shù)據(jù)項之間的依賴關系。例如,由R.Arawal等人首先提出的“啤酒與尿布”典型例子,就是:“80%的男士在為自己買啤酒的同時也會為孩子買尿布”。

2.2 Apriori算法

Apriori算法由R.Arawal提出,是最經(jīng)典的以概率為基礎的挖掘布爾關聯(lián)規(guī)則頻繁項集的算法。它使用逐層搜索的迭代方法:設有數(shù)據(jù)集D,算法在第一次遍歷D時僅僅計算每個項目的具體數(shù)量值,用來確定頻繁1-項目集(L1),然后,通過L1自身連接、剪枝兩個步驟,得到頻繁2-項集L2(L2),如此下去,通過L2 找出L3 ,直到k-項集(LK)不是頻繁項集為止。需要注意的是,找出每個Lk 均需要一次數(shù)據(jù)庫的完整掃描。

之后很多學者對Apriori算法進行了改進,但無論怎么改進,該類算法都有一缺憾,就是在搜索過程的連接、剪枝兩個步驟會產(chǎn)生大量的候選集,計算和存儲這些候選集會大大消耗時間、空間成本。

2.3 FP-Growth 算法

為了解決Apriori一類算法的缺憾,JiaWeihan提出了摒掉產(chǎn)生候選集的新思路—FP-Growth算法。利用高度壓縮的數(shù)據(jù)結構方式在生成頻繁項集的時候不必產(chǎn)生候選集。

該算法分為兩個步驟:

(1)構造FP樹。第一次遍歷數(shù)據(jù)庫生成全部頻繁1-項集,并按照支持度從大到小存儲在表中,在進行第二次數(shù)據(jù)庫的遍歷,將每一次的頻繁項集保存在FP樹中的相應分枝上。

(2)在上步的頻繁項集基礎上提出發(fā)現(xiàn)算法FP-Growth。具體是從頻繁i項集(記作Li)的條件模式庫中采用由底向上的搜索方法發(fā)現(xiàn)所有包含Li的頻繁項集。這樣就將一個大型樹結構分解成多個小的子樹結構,相應地就將一個大型的復雜搜索問題轉化成了多個小簡單的搜索問題。

2.4 并行關聯(lián)規(guī)則挖掘算法

FP-Growth 算法雖簡化了時間和空間成本,但是并不適用于大型的數(shù)據(jù)庫。并行計算是指能夠同時對多條指令、多個任務或者多個數(shù)據(jù)集進行處理,將并行計算應用到關聯(lián)規(guī)則挖掘中,能夠有效提高挖掘效率。

并行關聯(lián)規(guī)則挖掘算法也是僅需要掃描兩次數(shù)據(jù)庫就能挖掘頻繁項集。步驟如下:首先將整個數(shù)據(jù)庫D隨機分割成n個非重疊且大小相似的區(qū)域。以此類推,每個區(qū)域還可分別劃分成更小互不影響的區(qū)域進行挖掘,從而實現(xiàn)了挖掘過程的分層執(zhí)行。

3 關聯(lián)規(guī)則挖掘的應用

3.1 關聯(lián)規(guī)則在商業(yè)決策中的應用

將關聯(lián)規(guī)則應用商業(yè)決策中,從大量的數(shù)據(jù)中經(jīng)過深層分析,有助于從商務信息系統(tǒng)的大型數(shù)據(jù)庫中提取對企業(yè)決策者有價值的信息,會大大提升決策效率和正確度。比如,在制訂銷售配貨、產(chǎn)品目錄設計、產(chǎn)品定價和促銷以及顧客的購買行為模式等商業(yè)決策時給企業(yè)決策者予以指導,有利于提高企業(yè)經(jīng)濟效益,提升競爭優(yōu)勢。

3.2 關聯(lián)規(guī)則在醫(yī)療中的應用

隨著醫(yī)療數(shù)據(jù)的與日俱增,對臨床疾病監(jiān)測與診斷、藥物治療效果的評價及疾病預防事件的主觀判斷越來越困難,如何將關聯(lián)規(guī)則運用其中,從繁雜的醫(yī)學數(shù)據(jù)中找出其內在關聯(lián)規(guī)則,提升診斷效率和正確率,顯得尤為重要。

比如,分析醫(yī)學數(shù)據(jù)特點,使用Apriori算法對婚檢數(shù)據(jù)中各類傳染病、血液關系、肝病之間的關系,為其制定全面科學體檢方案;兒童肺炎的治療,建立治療用藥字典,從治療效果和維護患者利益的角度出發(fā),為其規(guī)范性用藥提供決策依據(jù),制定最佳用藥方案。

3.3 關聯(lián)規(guī)則在推薦系統(tǒng)中的應用

推薦系統(tǒng)是在數(shù)據(jù)挖掘的基礎上建立的一種高級商務智能平臺,根據(jù)用戶的個性化和興趣愛好,向其推薦感興趣的商品和信息。基于關聯(lián)規(guī)則的推薦系統(tǒng)是把用戶已經(jīng)購商品作為規(guī)則頭,將推薦對象作為規(guī)則體。首先經(jīng)過數(shù)據(jù)清理后計算兩兩商品或信息之間的支持度和執(zhí)行度,將低于設定的最小值的規(guī)則去掉,再找出某種商品或信息的所有規(guī)則,按置信度從大到小排序,Top-N即為與該商品或信息最相關的前N中上品或信息。

4 小結

本文從大數(shù)據(jù)角度分析了現(xiàn)代數(shù)據(jù)的特點,概述了關聯(lián)規(guī)則的三種方法思想及優(yōu)缺點,并且列舉了其在幾個行業(yè)中的應用。

課題:本文系山東協(xié)和學院校級課題:大數(shù)據(jù)環(huán)境下OLAP關聯(lián)規(guī)則挖掘在國有固定資產(chǎn)統(tǒng)計中的研究(項目編號:XHXY201616);山東省統(tǒng)計局課題:大數(shù)據(jù)環(huán)境下OLAP關聯(lián)規(guī)則挖掘在高校固定資產(chǎn)統(tǒng)計中的研究(項目編號:KT16218)。

作者簡介:陳梅(1982-),女,山東武城人,碩士研究生,講師,研究方向:大數(shù)據(jù)和教學研究。endprint

猜你喜歡
大數(shù)據(jù)應用
大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
多媒體技術在小學語文教學中的應用研究
考試周刊(2016年76期)2016-10-09 08:45:44
分析膜技術及其在電廠水處理中的應用
科技視界(2016年20期)2016-09-29 14:22:00
GM(1,1)白化微分優(yōu)化方程預測模型建模過程應用分析
科技視界(2016年20期)2016-09-29 12:03:12
煤礦井下坑道鉆機人機工程學應用分析
科技視界(2016年20期)2016-09-29 11:47:01
氣體分離提純應用變壓吸附技術的分析
科技視界(2016年20期)2016-09-29 11:02:20
基于大數(shù)據(jù)背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
會計與統(tǒng)計的比較研究
數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 亚洲V日韩V无码一区二区 | 国产第一页免费浮力影院| 不卡无码网| 成人午夜免费视频| 国产91线观看| 无码区日韩专区免费系列| 欧美色视频日本| 亚洲最大综合网| 国产成人亚洲欧美激情| 中日无码在线观看| 制服丝袜 91视频| 666精品国产精品亚洲| 亚洲人成在线精品| 久久semm亚洲国产| 国产99免费视频| 国产日韩欧美精品区性色| 婷婷色狠狠干| 日韩精品毛片| 国产精品视频导航| 精品国产Av电影无码久久久| 97视频精品全国免费观看| 污网站在线观看视频| 无码不卡的中文字幕视频| 国产精品漂亮美女在线观看| 亚洲精品第一在线观看视频| 精品亚洲麻豆1区2区3区| 亚洲六月丁香六月婷婷蜜芽| 97色伦色在线综合视频| 日韩美女福利视频| 亚洲香蕉久久| 国产精品亚洲一区二区三区z| 国产经典三级在线| 综合社区亚洲熟妇p| 欧美在线一二区| 精品福利国产| 国产黄色视频综合| 黄色一及毛片| 国产熟女一级毛片| 六月婷婷精品视频在线观看 | 欧美国产日韩一区二区三区精品影视| 999精品色在线观看| 色噜噜在线观看| 免费在线a视频| 二级特黄绝大片免费视频大片| 中文字幕乱码二三区免费| 日韩精品一区二区三区swag| 国产成人精品视频一区视频二区| 国产无人区一区二区三区| 在线亚洲精品自拍| 在线视频亚洲欧美| 在线国产91| 亚洲欧美在线综合一区二区三区 | 中文字幕久久精品波多野结| 成年人福利视频| 免费一级毛片| 2021国产乱人伦在线播放| 国产成人精品一区二区三区| 亚洲小视频网站| 国产黄在线免费观看| 欧美成人免费一区在线播放| 婷婷综合亚洲| 国产精品无码影视久久久久久久| 美女毛片在线| 亚洲一道AV无码午夜福利| 婷婷久久综合九色综合88| 鲁鲁鲁爽爽爽在线视频观看| 亚洲天堂视频在线播放| 中文字幕亚洲乱码熟女1区2区| 国产成人一级| 老色鬼欧美精品| 亚洲欧美人成人让影院| 91精选国产大片| 欧美日韩一区二区三| 伊人精品成人久久综合| 92午夜福利影院一区二区三区| 无码一区中文字幕| 国产自无码视频在线观看| 国产特一级毛片| 国产激情无码一区二区免费| 亚洲欧洲日韩久久狠狠爱| 麻豆精品国产自产在线| 久久99精品久久久久久不卡|