(山東科技大學 信息科學與工程學院,山東 青島 266590)?基于網絡日志的用戶查詢推薦王靜> (山東科技大學信息科學與工程學院,"/>
999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于網絡日志的用戶查詢推薦

2016-08-18 05:47:34王靜山東科技大學信息科學與工程學院山東青島266590
河南科技 2016年7期
關鍵詞:搜索引擎用戶信息

王靜>(山東科技大學 信息科學與工程學院,山東 青島 266590)

?

基于網絡日志的用戶查詢推薦

王靜>
(山東科技大學信息科學與工程學院,山東青島266590)

隨著Internet的迅速發展,人們面對信息爆炸的現實。因此,需要根據用戶的查詢意圖進行推薦。基于此,提出一種計算查詢詞相似度的方法,利用K-means對查詢詞進行聚類并計算聚類簇中心,當用戶輸入查詢詞后計算該查詢詞與每個聚類簇中心的相似度并降序排列,選取相似度最大的兩個聚類簇對其進行查詢推薦。

查詢意圖;K-means聚類;查詢日志;查詢推薦

Internet的迅速發展使得人們從未像現如今一樣能夠輕易獲取數量如此龐大的信息,一方面數量豐富的信息極大地滿足了人們對知識的渴望,另一方面海量涌現的信息使人們無法直接得到自己真正感興趣的信息[1]。對于普通用戶來說,Internet上的“信息迷航”和“信息過載”已經成為日益嚴重的問題。用戶興趣建模正是在這樣的背景下產生的。

用戶興趣建模的關鍵是分析用戶在互聯網上訪問數據的歷史信息及行為信息,因為該信息隱藏了用戶的目的與興趣。根據用戶興趣模型,為其提供個性化、針對性的信息服務。而如何得到用戶在互聯網上訪問數據的相關信息也是至關重要的。

1 相關工作

查詢日志是大量用戶長期使用搜索引擎產生的用戶行為數據,在很多研究方向上都有著重要價值。為改善搜索引擎性能,可以在信息檢索過程中進行查詢擴展、查詢推薦等;為加強自然語言理解,可以進行命名實體識別、文本分類等;也可以根據日志數據建立用戶興趣模型,進行個性化服務等。

近年來,許多研究工作開始使用查詢日志中的clickthrough data來挖掘查詢之間的語義相關關系。例如,段建勇等人[2]提取基于查詢詞的QueryRank算法對網絡日志的用戶進行興趣建模,缺點是對網絡日志的處理仍采用傳統的文本處理的方法不具有針對性;Beeferman等人通過對query-URL二部圖上使用凝聚聚類算法來發現相關查詢;Wen等人同時考慮使用click-through data和查詢文檔的內容信息來確定相似查詢,缺點是工作量比較大且不具有通用性。

2 查詢日志

在當今的搜索引擎中,關于查詢者和搜索引擎之間的交互關系會被記錄下來,從而形成了用戶查詢日志。盡管搜索引擎各不相同,但完整的用戶查詢日志至少包含5個方面的信息:用戶標識、該查詢提交的時間、用戶輸入的查詢詞、該查詢返回的結果以及用戶的點擊行為。本文使用搜狗實驗室提供的用戶查詢日志,每條記錄的內容如表1所示。

表1 查詢日志的記錄內容

3 查詢詞相似度

式(1)中,n(q,lj)表示針對查詢詞q點擊lj的次數。

根據該向量形式,定義相似度函數,這里使用余弦相似度,如式(2)所示。

4 查詢詞推薦模型

制定基于相似度的相異度(準則函數值)計算公式,利用該公式將相似度較高的查詢詞歸到某一個聚類簇中,相異度計算公式如式(3)所示。

式(3)中,sim(q,ci)是聚類簇ci中的任意一個查詢詞q與聚類簇中心ci的相似度。

每次聚類之后聚類簇中心的計算如式(4)所示。

式(4)中,nci是聚類簇ci中包含的query總個數。

當兩次準則函數值的差值不超過0.01時,即達到我們的聚類結果,使用詞頻方法提取每個聚類簇的特征查詢詞,如式(5)所示。

式(5)中,nqi是查詢詞qi在聚類簇ci中出現的總次數,nci是聚類簇ci中所有查詢詞的總個數。

當用戶輸入查詢詞后,計算該查詢詞與每個聚類簇中心ci的相似度如式(6)所示。

根據相似度大小進行降序排列,選取排在最前面的兩個聚類簇中的查詢詞,實現用戶查詢推薦。

5 結果與分析

由已有研究可知,在一段時間內用戶的興趣是比較穩定的,因此可以利用前面建好的查詢詞推薦模型對用戶進行推薦。例如,當用戶輸入“數碼科技”時,計算出與其相似度較高的兩個聚類簇分別是“數碼家電”和“科技信息”,推薦的序列對比如表2所示。

表2 關于“數碼家電”和“科技信息”的查詢推薦序列

為了測試該方法的準確性,從這150個聚類簇中隨機選取30個,由3位專業人員對這30個聚類簇中排在前N(這里N取200)的查詢詞進行投票選取,計算其準確率和召回率,結果如表3所示。

表3 準確率和召回率

6 結語

由表3的結果可知,該方法提出的查詢推薦模型是可行的,并且推薦效果良好。

本文通過對搜索引擎查詢日志的結構進行分析,挖掘該結構下查詢詞之間的關系,根據該關系對查詢詞進行聚類并提取每個聚類簇的特征詞。針對用戶輸入的查詢詞,利用本文的查詢推薦模型對其進行推薦,更好地服務于用戶。由于網絡日志的數量龐大,所以在未來的工作中需要對聚類算法進行改進,提高聚類的效果和速度。

[1]呂新波,關毅.基于聚類的隱式用戶興趣建模[J].智能計算機與應用,2013(1):17-20.

[2]段建勇,魏曉亮,張梅,等.基于網絡日志的用戶興趣模型構建[J].情報科學,2013(9):78-82.

User Query Recommendation Based on Web Log

Wang Jing
(College of Information Science and Engineering,Shandong University of Science and Technology,Shandong Qingdao 266590)

With the rapid development of Internet,people are facing the reality of information explosion. Therefore,we need to recommend according to the user's query intention.Based on this,a computation methods of query similarity was introduced,which used k-means to query clustering and calculate the clustering center,then calculated the similarity between query and each cluster center when the user input query and ranked in descending order,then selected the queries of the maximum similarity of two clusters to recommendation.

query intention;K-means cluster;query log;query recommendation

TP3

A

1003-5168(2016)04-0050-02

2016-03-23

王靜(1991-),女,碩士,研究方向:人工智能。

猜你喜歡
搜索引擎用戶信息
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
網絡搜索引擎亟待規范
中國衛生(2015年12期)2015-11-10 05:13:38
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
基于Nutch的醫療搜索引擎的研究與開發
廣告主與搜索引擎的雙向博弈分析
搜索,也要“深搜熟濾”
主站蜘蛛池模板: 亚洲福利视频一区二区| 色噜噜久久| 日韩欧美中文亚洲高清在线| 在线观看国产精美视频| 欧美成人影院亚洲综合图| 91福利国产成人精品导航| 亚洲第一极品精品无码| 色综合天天综合中文网| 一级毛片免费高清视频| 婷五月综合| 999福利激情视频| 亚洲色图另类| 国产三级成人| 久久精品国产在热久久2019| 在线观看免费AV网| 亚洲Va中文字幕久久一区| 色哟哟精品无码网站在线播放视频| 丁香六月综合网| 国产剧情伊人| 无码日韩视频| 国产麻豆福利av在线播放| 欧美另类精品一区二区三区| 日韩免费毛片| 亚洲国产黄色| 天天综合色网| 国产国产人成免费视频77777| 日韩在线影院| 91 九色视频丝袜| 亚洲色图狠狠干| 一本大道视频精品人妻 | 亚洲精品桃花岛av在线| 激情无码视频在线看| 99久久精品免费视频| aa级毛片毛片免费观看久| 成人a免费α片在线视频网站| 99精品视频在线观看免费播放| 亚洲AⅤ无码国产精品| 国产精品粉嫩| 国产在线精彩视频二区| 国产69囗曝护士吞精在线视频| 97国内精品久久久久不卡| 久久香蕉国产线看精品| 九九久久99精品| 国产噜噜噜视频在线观看 | 午夜在线不卡| 97精品久久久大香线焦| 2020国产免费久久精品99| 亚洲日韩久久综合中文字幕| 亚洲熟女偷拍| 亚洲国产日韩在线成人蜜芽| 久久青青草原亚洲av无码| 曰韩人妻一区二区三区| 国产草草影院18成年视频| 中文字幕在线不卡视频| 免费观看男人免费桶女人视频| 国产日韩欧美黄色片免费观看| 欧美h在线观看| 国产人免费人成免费视频| 亚洲啪啪网| 亚洲成人精品| 久久久久国产一区二区| 国产九九精品视频| 51国产偷自视频区视频手机观看| 亚洲日韩精品欧美中文字幕| 在线色综合| 老司国产精品视频91| 亚洲第一黄片大全| 亚洲码在线中文在线观看| 国产后式a一视频| 毛片网站观看| 少妇露出福利视频| 在线不卡免费视频| 久久精品日日躁夜夜躁欧美| 在线日韩一区二区| 人妻精品全国免费视频| 国产成人综合在线观看| 亚洲国内精品自在自线官| 亚洲综合香蕉| 欧美成在线视频| 白浆视频在线观看| 欧美伦理一区| 熟妇人妻无乱码中文字幕真矢织江 |