999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于關聯(lián)規(guī)則挖掘的關聯(lián)檢索建議模型

2015-04-29 02:09:50黃志成
智能計算機與應用 2015年3期
關鍵詞:關聯(lián)規(guī)則建議

黃志成

摘 要:文章提出了一種基于關聯(lián)規(guī)則挖掘的關聯(lián)檢索建議模型。該模型提供關聯(lián)關鍵詞建議服務,引導用戶進行有效檢索。同時模型在用戶檢索興趣分析和圖書采購中也起到?jīng)Q策支持作用。

關鍵詞:關聯(lián)規(guī)則挖掘;關聯(lián)檢索建議;檢索興趣分析;圖書采購決策支持

分類號:TP391 文獻標識號:A 文章編號:2095-2163(2015)03-

Association Searching Suggestion based on Association Rule Mining

HUANG Zhicheng

(Information Resource Center, Guangdong Womens Polytechnic College, Guangzhou 511450, China)

Abstract: The article proposes a model of association searching suggestion based on association rule mining. The model provides association keywords suggestion service, which assists users in performing valid search. It also plays an important part in anglicizing users searching interests and decision making of books purchase.

Keywords: Association Rule Mining; Association Searching Suggestion; Analysis of Search Interest; Decision Making in Books Purchase

0 引 言

用戶使用百度搜索引擎的時候,都會留意到搜索引擎能夠提供一種稱為“相似搜索”建議的服務。當用戶因輸入的關鍵詞不夠準確而無法檢索到所需要的資料時,相似搜索服務會給出建議的關鍵詞,引導用戶進行有效檢索。相似搜索服務建議的關鍵詞都是包含用戶關鍵詞的一系列擴展短語。很多時候,用戶缺乏背景知識,對搜索意圖(關鍵詞)無法準確描述,相似搜索無法給出用戶想要的結果。基于此,本文將開展關聯(lián)規(guī)則挖掘技術的研究,通過統(tǒng)計大量用戶的搜索行為數(shù)據(jù),挖掘關鍵詞中存在的關聯(lián),并對用戶輸入的關鍵詞給出關聯(lián)建議,引導用戶進行有效檢索。

1關聯(lián)規(guī)則挖掘

關聯(lián)規(guī)則挖掘[1]采用關聯(lián)算法查找數(shù)據(jù)集中的不同屬性之間的相關性。設I是項的集合,關聯(lián)規(guī)則是形如 的蘊涵式,其中 , , ,擁有支持度support和置信度confidence,即:

(1)

在此定義,同時滿足最小支持度閾值和最小置信度閾值的規(guī)則即可稱為強規(guī)則。關聯(lián)規(guī)則的規(guī)范表示為:

其中,R是取值范圍;x是變量,在R上取值;Pm (m=1,2,…,i)和Qn (n=1,2,…,j)是謂詞變量,作為任務相關數(shù)據(jù)的一部分說明的相關屬性或維;uv (v=1,2,…,r)和tw (w=1,2,…,l)是對象變量,在關于x的謂詞上取值;s是規(guī)則的支持度,c是規(guī)則的置信度,均取百分比值。例如,一個典型的關聯(lián)規(guī)則如(3)式所示:

該規(guī)則表示,同時購買計算機游戲和影碟的人占顧客總數(shù)的40%;在購買計算機游戲的顧客中又購買影碟的概率是66%。為簡化表示,將(3)式簡化表示為“計算機游戲 影碟 [40%,66%]”。

2關聯(lián)檢索建議

與百度搜索引擎提供的“相似搜索建議”服務不同,本文提出的是“關聯(lián)檢索建議”服務。“關聯(lián)檢索建議”預先通過計算大量關鍵詞之間的關聯(lián)度,當用戶輸入關鍵詞進行搜索時,系統(tǒng)根據(jù)用戶輸入的關鍵詞,查找與其存在強關聯(lián)的關鍵詞(不一定語意相近),作為檢索建議,由此引導用戶進行有效檢索。尤其用戶缺乏背景知識,對搜索意圖(關鍵詞)無法準確描述時,“關聯(lián)檢索建議”模型可利用其它用戶的搜索知識,給用戶提供與當前關鍵詞存在一定關聯(lián)的其它內容方面的檢索建議。

3模型設計

3.1模型總體架構

模型總體架構[2]如圖1所示。系統(tǒng)收集用戶檢索時產生的關鍵詞,并經(jīng)過數(shù)據(jù)清洗操作,產生干凈的符合要求的數(shù)據(jù),把該數(shù)據(jù)按照一定的格式存放在數(shù)據(jù)庫中。關聯(lián)規(guī)則挖掘器使用關聯(lián)挖掘算法,從數(shù)據(jù)庫中讀取關鍵詞數(shù)據(jù),進而提取一系列的關鍵詞關聯(lián)規(guī)則。導航器則根據(jù)關聯(lián)規(guī)則為用戶提出檢索建議,引導用戶進行更有效和針對性的檢索。

圖1 模型總體架構

Fig.1 General framework model

3.2挖掘模型設計

研究將用戶每一次的檢索過程看作是一個事務記錄。每個事務記錄包含若干個用戶檢索產生的關鍵詞組;而同一個事務記錄里的關鍵詞之間則不分先后次序。具體來說,關鍵詞數(shù)據(jù)是以事務記錄為單位,且存儲在數(shù)據(jù)庫中。關聯(lián)規(guī)則即挖掘模型從數(shù)據(jù)庫中讀取經(jīng)過清洗的干凈數(shù)據(jù)。數(shù)據(jù)的格式如表1所示,表中各行代表一個事務記錄。

表1 事務數(shù)據(jù)

Tab.1 Transaction data

TID 關鍵詞數(shù)據(jù)

1 關聯(lián)規(guī)則挖掘,防火墻聯(lián)動

2 SQL Server,VB,信息管理

3 女性,綜合素質,就業(yè),偉人

4 余世偉,MBA

... ...

關聯(lián)規(guī)則挖掘分兩步進行:

(1)找出所有頻繁項集

(2)由頻繁項集產生強關聯(lián)規(guī)則

每個關鍵詞,可將其稱作“項”,兩個或兩個以上的關鍵詞構成“項集”。關聯(lián)規(guī)則挖掘的第一步,即找出在所有事務中出現(xiàn)次數(shù)達到某一數(shù)值的項集,而將這些項集稱為頻繁項集,并將該數(shù)值稱為最小支持度計數(shù)。產生頻繁項集的一個高效快速的算法是FP-增長算法,目前已有人在FP-增長算法基礎上提出可以實現(xiàn)增量更新的算法[3]。進一步地,當前研究也已表明:相對來說,由頻繁項集產生強關聯(lián)規(guī)則是較為簡單的。

4模型應用

4.1關聯(lián)規(guī)則解釋

關聯(lián)規(guī)則挖掘器將挖掘得到一系列的關聯(lián)規(guī)則,部分關聯(lián)規(guī)則如表2所示。對于規(guī)則1,有0.35%的低支持度,說明很少人檢索該方面內容;但卻有100%的置信度,說明該類用戶每次檢索關聯(lián)規(guī)則挖掘資料時,將必然檢索防火墻聯(lián)動方面的資料。又如規(guī)則3,有7.80%的高支持度,說明較多用戶都在檢索有關女性、綜合素質以及就業(yè)問題;另有70.25%的較高置信度則說明用戶在檢索女性和綜合素質方面資料的同時,較多人也會進一步檢索并了解有關女性綜合素質對就業(yè)、偉人等影響的文獻資料。

表2 部分關聯(lián)規(guī)則

Tab.2 Association rules

序號 關聯(lián)規(guī)則 支持度 置信度

1 關聯(lián)規(guī)則挖掘 防火墻聯(lián)動 0.35% 100.00%

2 SQL Server,VB 信息管理 1.74% 90.00%

3 女性,綜合素質 就業(yè),偉人 7.80% 70.25%

4 MBA 余世偉

1.39% 67.41%

挖掘器挖掘出來的關聯(lián)規(guī)則存放到數(shù)據(jù)庫中,供導航器參考使用。當用戶進入檢索頁面輸入關鍵詞檢索資料時,導航器實時將依據(jù)用戶輸入的關鍵詞,在關聯(lián)規(guī)則庫中查找和匹配,找出所有包含有用戶關鍵詞的關聯(lián)規(guī)則,相應地給出檢索建議。例如,當用戶要檢索有關“MBA”資料時,系統(tǒng)查找到規(guī)則4滿足要求,并給出“余世偉”的檢索建議。當然不是所有規(guī)則都有價值,只有強關聯(lián)規(guī)則才是用戶感興趣的內容。系統(tǒng)管理員可以設定最小支持度閾值和最小置信度閾值,以篩選獲取用戶所需的強規(guī)則。

4.2業(yè)務應用

(1) 用戶檢索興趣分析。關聯(lián)檢索建議模型首先收集大量用戶檢索的關鍵詞,這些關鍵詞反映用戶檢索的興趣和需求。收集和分析用戶需求有助于理解當前用戶的需求,以便搜索引擎提供更有針對性、及實用性的的搜索服務。

(2)提供關聯(lián)檢索建議。關聯(lián)檢索建議模型提供的是一種關聯(lián)搜索建議服務,只要關鍵詞之間存在一定的關聯(lián),模型就會給出與關鍵詞關聯(lián)的搜索建議,引導用戶進行更為有效的規(guī)范化科學檢索。

(3) 圖書采購決策支持[4-5]。圖書采購將在相當程度上決定一個圖書館館藏書目的質量和閱讀可能性。將關聯(lián)規(guī)則挖掘應用到圖書檢索系統(tǒng)上即可統(tǒng)計出當前大部分讀者檢索的內容,并且可以進一步計算出哪些內容之間是存在關聯(lián)的。因此,關聯(lián)規(guī)則挖掘可以作為圖書采購人員的決策支持的現(xiàn)實應用范例,從而更準確、合理地采購到讀者真正需要的圖書。

5結束語

本文討論了利用關聯(lián)規(guī)則挖掘統(tǒng)計分析用戶檢索的關鍵詞,計算關鍵詞間的關聯(lián)度,最后給出關聯(lián)檢索建議,引導用戶進行更有效檢索。關聯(lián)規(guī)則挖掘分析用戶檢索興趣,可以為后續(xù)研究進行更深層次的用戶行為挖掘[6]。

參考文獻

[1] Jiawei Han, Micheline Kamber. Data Mining Con-cepts and Techniques[M]. Beijing: Higher Education Press, 2001:227-242.

[2] 錢智勇.基于數(shù)據(jù)挖掘的重點學科專題知識庫開發(fā)[J].圖書館,2004(3):50-53.

[3] 朱玉全,孫志揮,季小俊.基于頻繁模式樹的關聯(lián)規(guī)則增量式更新算法[J].計算機學報, 2003(1): 91-96.

[4] 羅鳳莉.圖書流通數(shù)據(jù)的關聯(lián)規(guī)則挖掘[J]. 情報探索,2006(8):40-41.

[5] 白新勤.基于數(shù)據(jù)倉庫的高校圖書館數(shù)據(jù)管理[J].圖書館工作與研究,2014(11): 31-33.

[6] 黃日茂,葉琳莉.基于日志分析的用戶搜索行為研究[J].莆田學院學報,2010(4):70-73.

猜你喜歡
關聯(lián)規(guī)則建議
撐竿跳規(guī)則的制定
“苦”的關聯(lián)
當代陜西(2021年17期)2021-11-06 03:21:36
數(shù)獨的規(guī)則和演變
接受建議,同時也堅持自己
學生天地(2020年32期)2020-06-09 02:57:54
好建議是用腳走出來的
人大建設(2018年9期)2018-11-18 21:59:16
奇趣搭配
讓規(guī)則不規(guī)則
Coco薇(2017年11期)2018-01-03 20:59:57
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規(guī)則對我國的啟示
建議答復應該
浙江人大(2014年4期)2014-03-20 16:20:16
主站蜘蛛池模板: 日本一区中文字幕最新在线| 亚洲人成网站观看在线观看| 国产一级二级在线观看| 国产精品视频导航| 亚洲三级a| 亚洲无卡视频| 日本色综合网| 亚洲日韩精品欧美中文字幕| 国产成人免费手机在线观看视频| 在线播放精品一区二区啪视频| 久久不卡精品| 波多野结衣无码视频在线观看| 国产一级无码不卡视频| 久久国产亚洲偷自| 99在线视频精品| 国产裸舞福利在线视频合集| 国产拍在线| 亚洲精品日产AⅤ| 国产永久免费视频m3u8| 亚洲精品视频网| 美女毛片在线| 欧美曰批视频免费播放免费| 国产视频a| 国产杨幂丝袜av在线播放| 日韩国产综合精选| 免费午夜无码18禁无码影院| 亚洲乱伦视频| 午夜福利网址| 97在线国产视频| 欧美自慰一级看片免费| 国产人妖视频一区在线观看| 午夜福利在线观看成人| 日韩AV无码一区| 久久香蕉欧美精品| 狠狠色丁香婷婷| 日韩av手机在线| 国产一级片网址| 99在线观看精品视频| 国产一在线观看| 国产精品免费p区| 欧美精品三级在线| 91极品美女高潮叫床在线观看| 国产视频欧美| 久久精品一品道久久精品| 国产日产欧美精品| 亚洲伊人电影| 国产成人免费高清AⅤ| 日韩一级毛一欧美一国产| 波多野结衣在线se| 日韩成人午夜| 亚洲中文字幕在线精品一区| 男女猛烈无遮挡午夜视频| 97se亚洲综合不卡| 亚洲三级网站| 蜜桃视频一区二区三区| 亚洲天天更新| 亚洲无线一二三四区男男| 亚洲日本一本dvd高清| 国产亚洲日韩av在线| 免费一级α片在线观看| 永久免费AⅤ无码网站在线观看| 91福利在线观看视频| 欧美一道本| 99re热精品视频国产免费| 天天综合亚洲| 亚洲欧美一区二区三区图片| 国产成人在线无码免费视频| 理论片一区| 欧美有码在线| 国产主播喷水| 国产成人做受免费视频| 日韩免费毛片视频| a级毛片网| 日韩高清欧美| 伊人久久久大香线蕉综合直播| 播五月综合| 99视频精品在线观看| 亚洲天堂777| 青青国产在线| 精品无码专区亚洲| 久久国产热| 天天爽免费视频|