999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于屬性特性算法的商品推薦系統(tǒng)模型

2018-07-04 16:42:20邱京偉
中國信息化 2018年6期
關(guān)鍵詞:關(guān)聯(lián)規(guī)則

邱京偉

推薦系統(tǒng)是根據(jù)用戶的興趣愛好推薦符合用戶興趣的對(duì)象,也稱為個(gè)性化推薦系統(tǒng)。商品推薦系統(tǒng)依據(jù)收集到的顧客的信息和交易記錄等有關(guān)數(shù)據(jù),查找具有某些特性的顧客與他們購買的商品間存在的關(guān)聯(lián)規(guī)則,大致確定顧客喜歡的商品的種類范圍,向客戶推薦與客戶購買的商品存在一定關(guān)聯(lián)的其他商品,既為客戶購買商品提供了方便,又可提高網(wǎng)站的銷售量。近年來,隨著人民生活水平的提高和網(wǎng)絡(luò)購物的發(fā)展,各購物網(wǎng)站中商品的數(shù)量和種類都大大增加,為了方便顧客在海量的商品中盡快尋找到所需要的商品,可靠高效的商品推薦系統(tǒng)必不可少。

在粗糙集相關(guān)理論中,知識(shí)被定義為對(duì)論域的劃分模式,知識(shí)具有顆粒性,稱為信息粒度或知識(shí)粒度,簡稱粒度。由于每個(gè)粒度都帶有一定的屬性,這使粒度間存在相互包含的關(guān)系,而粒度存在的關(guān)聯(lián)規(guī)則在其包含粒度中也同樣存在,例如,當(dāng)存在所有男人都喜歡籃球的時(shí)候,就可以推導(dǎo)出中國男人都喜歡籃球。依據(jù)粒度間屬性的特性編寫的算法稱為屬性特性算法,該算法通過組織相關(guān)包含數(shù)組等方法,避免在某個(gè)粒度的包含粒度上挖掘相同的粒關(guān)聯(lián)規(guī)則,達(dá)到節(jié)省時(shí)間,提高挖掘效率的目的。

將屬性特性算法應(yīng)用到商品推薦系統(tǒng)中,其優(yōu)點(diǎn)有:

一般顧客在超市購物時(shí),往往不會(huì)只購買一種商品,這種現(xiàn)象在網(wǎng)絡(luò)購物平臺(tái)也同樣存在。但是,現(xiàn)有推薦系統(tǒng)大多根據(jù)顧客搜索的關(guān)鍵字提供同一類型的商品。由于單個(gè)顧客面對(duì)不同商家的同一類商品時(shí)往往只會(huì)選擇其中一家的商品,這樣對(duì)購物網(wǎng)站的交易量提高幅度有限。屬性特性算法基于粒計(jì)算,關(guān)注的重點(diǎn)是帶有相同屬性的粒度間存在的關(guān)聯(lián)規(guī)則,因此不限制推薦商品的種類,其挖掘結(jié)果涉及多種商品,這樣在給顧客更多選擇的同時(shí),有利于提高購物網(wǎng)站的交易數(shù)量和交易額。

傳統(tǒng)算法雖然可以較準(zhǔn)確地推測出某位客戶感興趣的商品,但是在大數(shù)據(jù)背景下,當(dāng)數(shù)據(jù)的規(guī)模增大后,傳統(tǒng)算法所需的時(shí)間消耗隨之增加,這大大影響了系統(tǒng)的運(yùn)行速度。屬性特性算法利用某粒度存在的關(guān)聯(lián)規(guī)則在其包含粒度中同樣存在的特性,通過減少判斷關(guān)聯(lián)規(guī)則的次數(shù)的方法,提高每次比較中輸出關(guān)聯(lián)規(guī)則的數(shù)量,從而減少系統(tǒng)在運(yùn)行中的時(shí)間消耗。在有關(guān)數(shù)據(jù)集的實(shí)驗(yàn)表明,在同等要求下,屬性特性算法可以有效提高挖掘效率,有利于在數(shù)據(jù)量增加的情況下,降低系統(tǒng)反應(yīng)時(shí)間,提升系統(tǒng)性能。

一、屬性特性算法基本原理

在實(shí)際應(yīng)用中,往往根據(jù)具體要求將信息按照所含屬性的多少劃分為不同的粒度,這使各個(gè)粒度間由于所含屬性的多少而相互包含,例如粒度<種類:酒>就包含<種類:酒>∧<顏色:紅>等粒度。

源覆蓋度、目標(biāo)覆蓋度、源置信度和目標(biāo)置信度是衡量粒關(guān)聯(lián)規(guī)則強(qiáng)度的4個(gè)度量標(biāo)準(zhǔn)。在粒計(jì)算中,每個(gè)大小不一的粒度都帶有一定數(shù)量的屬性和屬性值,這些屬性和屬性值使部分粒度存在著一定的包含關(guān)系。當(dāng)源覆蓋度為100%,而目標(biāo)覆蓋度也為100%的時(shí)候,稱為完全匹配。在完全匹配的情況下,一個(gè)粒度與其他粒度間存在的所有關(guān)聯(lián)規(guī)則,在它的所有的包含項(xiàng)中同樣存在,例如,當(dāng)100%的美國人(粒度<國籍:美國>)喜歡100%的白色商品(粒度<顏色:白>)的時(shí)候,可以得出100%的美國已婚人士(粒度<婚姻:已婚>∧<國籍:美國>)喜歡100%的白色美國產(chǎn)商品(粒度<顏色:白>∧<產(chǎn)地:美國>。

利用粒度屬性的特性設(shè)計(jì)屬性特性算法,將粒度的包含項(xiàng)放入該粒度的包含數(shù)組中,當(dāng)挖掘到粒度A和粒度B建存在粒關(guān)聯(lián)規(guī)則時(shí),采用遍歷的方法直接輸出粒度A的包含粒度粒度與粒度B的包含粒度間存在同樣的粒關(guān)聯(lián)規(guī)則,這樣就節(jié)省了在其包含粒度上判斷是否存在粒關(guān)聯(lián)規(guī)則的時(shí)間,提高了挖掘的時(shí)間效率,具體做法如下:

為每個(gè)粒度開辟有關(guān)包含數(shù)組,該粒度為該數(shù)組的第1個(gè)元素;

在屬性比自身不多1的粒度中為每個(gè)粒度查找其包含粒度,并放入其包含數(shù)組中,形成該粒度的初步包含數(shù)組;

從粒度的初步包含數(shù)組第2個(gè)元素(第1個(gè)子粒度)開始,查找其初步包含數(shù)組里的粒度,把它們放入父粒度的包含數(shù)組中,形成完全包含數(shù)組,其過程如圖2所示;

按要求兩個(gè)數(shù)據(jù)集中的粒度相互比較,如果存在關(guān)聯(lián)規(guī)則,則輸出兩個(gè)粒度完全包含數(shù)組中的所有關(guān)聯(lián)規(guī)則。

算法流程圖如圖2所示,當(dāng)發(fā)現(xiàn)兩個(gè)粒度間存在粒關(guān)聯(lián)規(guī)則時(shí),屬性特性算法一次可以輸出多條粒關(guān)聯(lián)規(guī)則,與一般采用的逐個(gè)比較的方法相比,可以節(jié)省在某粒度的包含粒度上挖掘粒關(guān)聯(lián)規(guī)則的時(shí)間,提高了挖掘效率。

二、屬性特性算法的應(yīng)用

本設(shè)計(jì)基于特點(diǎn)相似的人感興趣的商品范圍也相似的理念,將粒計(jì)算的思想和屬性特性算法應(yīng)用到商品推薦系統(tǒng)里,在把數(shù)據(jù)庫中的用戶信息和商品信息根據(jù)包含屬性的多少劃分為大小不一的粒度的基礎(chǔ)上,根據(jù)近期的購買情況,結(jié)合粒度相關(guān)設(shè)定的源置信度和目標(biāo)置信度等相關(guān)要素,利用屬性特性算法查找相關(guān)粒度間的粒關(guān)聯(lián)規(guī)則,快速從海量數(shù)據(jù)中挖掘出顧客特點(diǎn)與所購買商品間的聯(lián)系,指導(dǎo)系統(tǒng)向特定顧客推薦特定范圍的商品。

三、商品推薦系統(tǒng)模型設(shè)計(jì)

基于屬性特征的粒關(guān)聯(lián)規(guī)則挖掘算法的商品推薦系統(tǒng)以網(wǎng)上購物平臺(tái)數(shù)據(jù)庫為基礎(chǔ),主要圍繞對(duì)數(shù)據(jù)的處理和分析展開設(shè)計(jì)。本商品推薦系統(tǒng)的全部功能模塊圖如圖3所示

(一)數(shù)據(jù)模型及數(shù)據(jù)庫設(shè)計(jì)

本商品推薦系統(tǒng)的系統(tǒng)的數(shù)據(jù)庫由顧客信息表、商品信息表和購買情況表3張表構(gòu)成,顧客信息表主要負(fù)責(zé)記錄網(wǎng)站注冊(cè)的會(huì)員相關(guān)信息,如年齡、籍貫和愛好等,商品信息表記錄網(wǎng)站上出售的商品的種類、顏色、價(jià)格等信息,購買情況表的數(shù)據(jù)主要記錄近一段時(shí)間內(nèi)顧客在該網(wǎng)站上購買商品的記錄。

(二)主要模塊設(shè)計(jì)

本系統(tǒng)負(fù)責(zé)數(shù)據(jù)處理的主要功能模塊有:數(shù)據(jù)導(dǎo)入模塊、粒度化處理模塊、關(guān)聯(lián)規(guī)則挖掘模塊和數(shù)據(jù)導(dǎo)出模塊。

數(shù)據(jù)導(dǎo)入模塊主要負(fù)責(zé)將數(shù)據(jù)庫里的3個(gè)數(shù)據(jù)表進(jìn)行識(shí)別后加載到系統(tǒng)中。在這個(gè)過程中。數(shù)據(jù)導(dǎo)入模塊不但要讀取數(shù)據(jù)表中的有關(guān)信息并對(duì)其進(jìn)行轉(zhuǎn)化,還要將有關(guān)數(shù)據(jù)項(xiàng)轉(zhuǎn)化為一定數(shù)據(jù)類型且?guī)в幸欢〝?shù)值的數(shù)據(jù)。

粒度化處理模塊主要涉及顧客信息表和商品信息表,它根據(jù)各個(gè)數(shù)據(jù)自身所含屬性的多少按一定順序把它們分解為一定大小的粒度,然后對(duì)所得粒度進(jìn)行一定的清洗,去除重復(fù)的數(shù)據(jù)后,完成對(duì)重要信息進(jìn)行必要的統(tǒng)計(jì)并設(shè)置相關(guān)標(biāo)志位等操作。

在關(guān)聯(lián)規(guī)則挖掘模塊中,整理好的粒度按照屬性特征算法有關(guān)步驟,首先為各粒度組織完全包含數(shù)組,再在比較中通過公式挖掘出存在的粒關(guān)聯(lián)規(guī)則,通過遍歷有關(guān)粒度的保護(hù)數(shù)組輸出相關(guān)的粒度,并設(shè)置相關(guān)標(biāo)志位,將結(jié)果記錄到系統(tǒng)中。

數(shù)據(jù)導(dǎo)出模塊通過對(duì)照當(dāng)用戶屬性和關(guān)聯(lián)規(guī)則挖掘模塊所得出的粒關(guān)聯(lián)規(guī)則,選出帶有與當(dāng)前顧客所涉及粒度相同的那些粒關(guān)聯(lián)規(guī)則,依此列出顧客可能感興趣的商品的目錄。

(三)其他模塊設(shè)計(jì)

為完善相關(guān)功能,系統(tǒng)加入用戶識(shí)別和數(shù)據(jù)分析兩個(gè)模塊。用戶識(shí)別模塊通過輸入的用戶名和密碼,分辨用戶是系統(tǒng)管理員還是顧客,從而引導(dǎo)不同用戶進(jìn)入不同頁面進(jìn)行相關(guān)操作。數(shù)據(jù)分析模塊的作用是統(tǒng)計(jì)查詢的次數(shù)和符合要求的客戶、商品數(shù)量等具有一定商業(yè)價(jià)值的相關(guān)數(shù)據(jù),對(duì)商品受關(guān)注程度等信息進(jìn)行反饋。

四、模型應(yīng)用分析

商品推薦系統(tǒng)的數(shù)據(jù)流程如圖4所示。

當(dāng)系統(tǒng)啟動(dòng)后,管理人員通過系統(tǒng)管理員界面,可以讀取有關(guān)數(shù)據(jù)的查詢統(tǒng)計(jì)結(jié)果,還可以設(shè)置需要導(dǎo)入的數(shù)據(jù)表位置,修改覆蓋率等參數(shù)。

數(shù)據(jù)表由數(shù)據(jù)導(dǎo)入模塊進(jìn)行加工,數(shù)據(jù)導(dǎo)入模塊將客戶信息表、商品信息表的數(shù)據(jù)進(jìn)行編碼,使之能被系統(tǒng)識(shí)別和處理,同時(shí)將購買情況表的數(shù)據(jù)轉(zhuǎn)化為布爾型數(shù)據(jù),方便下一步的數(shù)據(jù)挖掘。

從數(shù)據(jù)導(dǎo)入模塊得到數(shù)據(jù)后,粒度化處理模塊根據(jù)顧客信息表和商品信息表數(shù)據(jù)自身所含屬性的多少,按元組和屬性種類由少到多的順序,把表中的信息劃分為大小不同的粒度,同時(shí)計(jì)算粒度總個(gè)數(shù)。由于在已經(jīng)得到的數(shù)據(jù)中,不僅存在著許多重復(fù)的粒度,同時(shí)也缺少了如支持度等重要信息,所以要進(jìn)行近一步的整理。在這個(gè)過程中,粒度化處理模塊不僅要去除一定的冗余,還要計(jì)算每個(gè)粒度出現(xiàn)的頻率并算出每個(gè)粒度的置信度,然后根據(jù)設(shè)置的置信度度對(duì)粒度進(jìn)行篩選。最后,對(duì)只要數(shù)據(jù)設(shè)置有關(guān)計(jì)數(shù)位,為導(dǎo)出有關(guān)統(tǒng)計(jì)表格做準(zhǔn)備。

關(guān)聯(lián)規(guī)則挖掘模塊在接收處理好的粒度的基礎(chǔ)上,根據(jù)設(shè)定的條件(如源置信度和目標(biāo)置信度)和有關(guān)統(tǒng)計(jì)結(jié)果(如粒度總個(gè)數(shù)),為各個(gè)粒度組織包含數(shù)組和所需標(biāo)志位數(shù)組,然后利用有關(guān)公式挖掘各個(gè)粒度的包含項(xiàng),放入該粒度的包含數(shù)組中。在挖掘顧客有關(guān)粒度與商品有關(guān)粒度間的粒關(guān)聯(lián)規(guī)則過程中,當(dāng)發(fā)現(xiàn)兩個(gè)粒度存在關(guān)聯(lián)規(guī)則的時(shí)候,按照屬性特征算法有關(guān)步驟,輸出兩個(gè)粒度及其包含粒度間的相同粒關(guān)聯(lián)規(guī)則。

當(dāng)顧客登錄購物網(wǎng)站時(shí),數(shù)據(jù)導(dǎo)出模塊將當(dāng)前顧客所含相關(guān)粒度調(diào)出,與挖掘結(jié)果進(jìn)行對(duì)比,選擇那些帶有與顧客相同粒度的粒關(guān)聯(lián)規(guī)則,經(jīng)過數(shù)據(jù)清洗后得到推薦結(jié)果,顯示在相關(guān)頁面上。

數(shù)據(jù)分析模塊在這一過程中,收集有關(guān)數(shù)據(jù),如近一段時(shí)間內(nèi)各個(gè)粒度被推薦的次數(shù)、各商品被推薦的次數(shù)等,為有關(guān)人員下一階段的商業(yè)活動(dòng)提供必要的依據(jù)。

五、結(jié)束語

商品推薦系統(tǒng)不僅為顧客購物提供方便,也是電子購物網(wǎng)站提高銷售量和銷售額的重要手段之一。本文將粒計(jì)算的思想和屬性特性算法引入到商品推薦系統(tǒng)設(shè)計(jì)中,通過分析顧客信息粒度與商品信息粒度間的粒關(guān)聯(lián)規(guī)則來推薦有關(guān)商品,同時(shí)利用粒度屬性間的特性減少時(shí)間消耗,在擴(kuò)展推薦商品種類的同時(shí),也提高了數(shù)據(jù)挖掘速度,不僅為客戶購買商品提供了便利,還有利于提升網(wǎng)站的銷售量。

猜你喜歡
關(guān)聯(lián)規(guī)則
撐竿跳規(guī)則的制定
不懼于新,不困于形——一道函數(shù)“關(guān)聯(lián)”題的剖析與拓展
“苦”的關(guān)聯(lián)
數(shù)獨(dú)的規(guī)則和演變
“一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
規(guī)則的正確打開方式
幸福(2018年33期)2018-12-05 05:22:42
奇趣搭配
讓規(guī)則不規(guī)則
Coco薇(2017年11期)2018-01-03 20:59:57
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規(guī)則對(duì)我國的啟示
主站蜘蛛池模板: 无遮挡国产高潮视频免费观看| 99久久免费精品特色大片| 黄色片中文字幕| 视频在线观看一区二区| 日本在线视频免费| 91福利一区二区三区| 都市激情亚洲综合久久| 国产网友愉拍精品视频| 欧美亚洲第一页| 99精品视频在线观看免费播放| 国产一级毛片高清完整视频版| 欧美色丁香| 亚洲乱强伦| 亚洲美女操| 欧美色视频网站| 自拍偷拍欧美| 欧美区一区二区三| 欧洲免费精品视频在线| 青草免费在线观看| 成色7777精品在线| 无码中文AⅤ在线观看| 久久精品人人做人人| 亚洲精品爱草草视频在线| 日韩一级毛一欧美一国产| lhav亚洲精品| 精品伊人久久久久7777人| 激情综合激情| 日韩无码一二三区| 亚洲一区网站| 亚洲成人www| 大陆国产精品视频| 欧美α片免费观看| 国内精品小视频福利网址| 精品人妻系列无码专区久久| 国内精自视频品线一二区| 亚洲精品天堂自在久久77| www中文字幕在线观看| 亚洲精品制服丝袜二区| 国产乱子伦精品视频| 亚洲成在线观看| 国产精品成人第一区| 久久青草精品一区二区三区| 亚洲欧洲国产成人综合不卡| 午夜丁香婷婷| 亚洲性一区| 九九免费观看全部免费视频| 国产www网站| 国产女人爽到高潮的免费视频 | 国产一级毛片yw| 成人午夜网址| 免费高清a毛片| 日本AⅤ精品一区二区三区日| 这里只有精品在线播放| 国产小视频网站| 亚洲无码四虎黄色网站| 色婷婷成人网| 中文字幕2区| 国产亚洲现在一区二区中文| 最新国产麻豆aⅴ精品无| 无码aaa视频| 国产色网站| 国产成人精品免费av| 国产一区免费在线观看| 国产麻豆福利av在线播放| 国产精品毛片一区| 制服丝袜在线视频香蕉| 成年人视频一区二区| 久久久91人妻无码精品蜜桃HD| 国产玖玖视频| 九九线精品视频在线观看| 亚洲狼网站狼狼鲁亚洲下载| 九九香蕉视频| 国产精品va| 国产青青操| 国产香蕉在线视频| 久久综合干| 亚洲精品制服丝袜二区| 婷婷色一二三区波多野衣| 制服丝袜一区| 亚洲成在线观看 | 视频二区欧美| 97人人模人人爽人人喊小说|