999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

從生活實例看大數(shù)據(jù)挖掘

2018-05-21 16:40:22
大眾科學(xué) 2018年5期
關(guān)鍵詞:數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則

超市里,牛奶到底和哪種商品擺放一起銷量更高?啤酒為什么與尿不濕擺放在一起會賣得更多?乍一看,它們似乎毫無聯(lián)系,而大數(shù)據(jù)挖掘卻能告訴你它們之間的關(guān)聯(lián)。那么,大數(shù)據(jù)挖掘是什么呢?又有哪些方法?

簡單來說,大數(shù)據(jù)挖掘即指從大量數(shù)據(jù)中自動搜索隱藏于其中的有著特殊關(guān)系性的信息的過程,其常用方法有分類、聚類、回歸分析、關(guān)聯(lián)規(guī)則、神經(jīng)網(wǎng)絡(luò)方法、Web數(shù)據(jù)挖掘等。

分類

數(shù)據(jù)被喻為蘊藏能量的煤礦,就像煤炭可以分為焦煤、無煙煤、肥煤、貧煤等一樣,每種數(shù)據(jù)也有自身的特點,比如頻率、量、速度、類型和真實性等等,從而將數(shù)據(jù)分出來。像好壞、高低、胖瘦……這些就是生活中最簡單的分類方法。

再比如,信用卡公司將持卡人信譽分為良好、一般和較差三類,如果建立“信譽良好的客戶是那些收入在5萬元以上,年齡在40至50歲之間的人士”這樣一個模型,就可以根據(jù)這個模型對新的記錄進行分類,從而判斷一個新持卡人的信譽等級是什么。

聚類

聚類與分類相似,但目的不同。聚類是針對數(shù)據(jù)的相似性和差異性將一組數(shù)據(jù)分為幾個類別。屬于同一類別的數(shù)據(jù)間相似性很大,但不同類別之間數(shù)據(jù)的相似性很小,跨類的數(shù)據(jù)關(guān)聯(lián)性很低。

比如在商務(wù)上,聚類能幫助市場分析人員從客戶基本庫中發(fā)現(xiàn)不同的客戶群,用購買模式刻畫不同的客戶群的特征;在生物學(xué)上,聚類能用于推導(dǎo)植物和動物的分類,對基因進行分類,獲得對種群中固有結(jié)構(gòu)的認識。聚類在汽車保險單持有者的分組,及根據(jù)房子的類型、價值和地理位置對一個城市中房屋的分組上也可以發(fā)揮作用。

關(guān)聯(lián)規(guī)則

什么會促進蛋撻的銷量?是颶風(fēng),颶風(fēng)天氣下蛋撻更受歡迎;啤酒與哪類產(chǎn)品擺放在一起會賣得更多?是尿不濕,父親們在購買尿不濕的時候總是喜歡再買些啤酒……這些事物彼此之間看似毫無關(guān)聯(lián),但里面卻隱藏著關(guān)聯(lián)規(guī)則。

關(guān)聯(lián)規(guī)則是隱藏在數(shù)據(jù)項之間的關(guān)聯(lián)或相互關(guān)系,即可根據(jù)一個數(shù)據(jù)項的出現(xiàn)推出其他數(shù)據(jù)項。關(guān)聯(lián)規(guī)則的挖掘過程有兩個階段:第一階段是從海量原始數(shù)據(jù)中找出所有的高頻項目組;第二階段是從這些高頻項目組產(chǎn)生關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則挖掘技術(shù)已被廣泛應(yīng)用于金融行業(yè)企業(yè)中用以預(yù)測客戶的需求,各銀行在自己的ATM機上通過捆綁客戶可能感興趣的信息供用戶了解并獲取相應(yīng)信息來改善自身的營銷。

回歸分析

回歸分析反映了數(shù)據(jù)庫中數(shù)據(jù)屬性值的特性,通過函數(shù)表達數(shù)據(jù)映射的關(guān)系來發(fā)現(xiàn)屬性值之間的依賴關(guān)系。它可以應(yīng)用到對數(shù)據(jù)序列的預(yù)測及相關(guān)關(guān)系的研究中去。在市場營銷中,回歸分析可以被應(yīng)用到各個方面。如通過對本季度銷售的回歸分析,對下一季度的銷售趨勢作出預(yù)測并做出針對性的營銷改變。

神經(jīng)網(wǎng)絡(luò)方法

神經(jīng)網(wǎng)絡(luò)作為一種先進的人工智能技術(shù),因其自身自行處理、分布存儲和高度容錯等特性非常適合處理非線性的以及以模糊、不完整、不嚴密的知識或數(shù)據(jù)為特征的處理問題。

人工神經(jīng)網(wǎng)絡(luò)首先要以一定的學(xué)習(xí)準(zhǔn)則進行學(xué)習(xí),然后才能工作。人工神經(jīng)網(wǎng)絡(luò)對手寫“A”“B”兩個字母的識別,如果規(guī)定當(dāng)“A”輸入網(wǎng)絡(luò)時,輸出“1”,而當(dāng)輸入為“B”時,輸出為“0”。通過多次的學(xué)習(xí)模擬,來強化網(wǎng)絡(luò)對上述規(guī)則的記憶,因而減少犯錯誤的可能性。一般說來,網(wǎng)絡(luò)中所含的神經(jīng)元個數(shù)越多,則它能記憶、識別的模式也就越多。

Web數(shù)據(jù)挖掘

Web數(shù)據(jù)挖掘是一項綜合性技術(shù),指Web從文檔結(jié)構(gòu)和使用的集合C中發(fā)現(xiàn)隱含的模式P,如果將C看做是輸入,P看做是輸出,那么Web挖掘過程就可以看做是從輸入到輸出的一個映射過程。當(dāng)前越來越多的Web數(shù)據(jù)都是以數(shù)據(jù)流的形式出現(xiàn)的,因此對Web數(shù)據(jù)流挖掘就具有很重要的意義。目前常用的Web數(shù)據(jù)挖掘算法有:PageRank算法,HITS算法以及LOGSOM算法。這三種算法提到的用戶都是籠統(tǒng)的用戶,并沒有區(qū)分用戶的個體。目前Web數(shù)據(jù)挖掘面臨著一些問題,包括:用戶的分類問題、網(wǎng)站內(nèi)容時效性問題,用戶在頁面停留時間問題,頁面的鏈入與鏈出數(shù)問題等。(編輯/任偉)

猜你喜歡
數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則
撐竿跳規(guī)則的制定
“苦”的關(guān)聯(lián)
數(shù)獨的規(guī)則和演變
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
奇趣搭配
讓規(guī)則不規(guī)則
Coco薇(2017年11期)2018-01-03 20:59:57
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規(guī)則對我國的啟示
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
主站蜘蛛池模板: 久久激情影院| 在线欧美日韩| 2020精品极品国产色在线观看| 在线观看的黄网| 亚洲区欧美区| 九九热精品视频在线| 成人日韩视频| 国产欧美日韩综合在线第一| 日韩黄色大片免费看| 欧美另类一区| 亚洲精品无码高潮喷水A| 黄色在线不卡| 久久青青草原亚洲av无码| 欧美成人一级| 国产成人高清亚洲一区久久| 国产在线第二页| 亚洲第一极品精品无码| 久久精品电影| 人妻丰满熟妇αv无码| 欧美一区二区自偷自拍视频| 亚洲国产精品日韩av专区| 国产精品3p视频| 国产青榴视频| 亚洲视频影院| 国禁国产you女视频网站| 国产乱码精品一区二区三区中文 | 一级成人欧美一区在线观看| 色综合中文| 亚洲无码高清一区| 91麻豆国产精品91久久久| 亚洲成人黄色在线| 中文字幕一区二区视频| 国产欧美高清| 亚洲最新地址| 日本不卡视频在线| 午夜性爽视频男人的天堂| 久久精品无码国产一区二区三区| 欧美午夜在线视频| 韩日无码在线不卡| 国产精品微拍| 99热国产这里只有精品无卡顿" | 99久久国产精品无码| 精品国产网站| 亚洲三级电影在线播放| 国产成人无码AV在线播放动漫| 欧美成人国产| 久久亚洲国产视频| 免费不卡在线观看av| 亚洲第一黄色网址| 午夜欧美理论2019理论| 欧美在线视频a| 久久久久青草线综合超碰| 国产美女在线观看| 亚洲国内精品自在自线官| 无码精品一区二区久久久| 九九精品在线观看| 国产精品无码久久久久久| 久久精品66| 成年人国产网站| 国产在线观看人成激情视频| 午夜色综合| 中国国产高清免费AV片| 欧美色丁香| 国产日本欧美在线观看| 无码不卡的中文字幕视频| 夜精品a一区二区三区| 亚洲精品图区| 一区二区三区国产| 欧美性爱精品一区二区三区 | 精品久久国产综合精麻豆| 久久福利片| 欧美综合区自拍亚洲综合绿色| 亚洲中文字幕久久无码精品A| 波多野结衣爽到高潮漏水大喷| 人与鲁专区| 国产区免费| 成人国产一区二区三区| 中文字幕人妻无码系列第三区| 欧美激情视频一区| 久久无码av三级| 92精品国产自产在线观看| 中文字幕无码制服中字|