999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

高校圖書館搜索引擎中Web使用記錄挖掘研究

2013-03-29 02:11:22趙靜
現代電子技術 2013年2期
關鍵詞:搜索引擎高校圖書館

趙靜

摘 要:針對高校的信息資源檢索的命中率低問題提出了運用Web使用記錄挖掘的高校圖書館搜索引擎。通過采用Web使用記錄挖掘技術和Clementine對高校圖書館網站的Web訪問日志記錄進行挖掘。在Web使用記錄挖掘流程中,提出一個基于用戶IP、登陸時間、網站的拓撲圖、引用網頁和Agent來識別出單個用戶的新算法,獲得有效提高識別用戶的實驗結果。最后用路徑分析來挖掘模式,優化網站結構,從而提高高校圖書館搜索引擎的命中率。

關鍵詞:Web使用記錄挖掘; 搜索引擎; 路徑分析; 高校圖書館; 用戶識別

中圖分類號:TN911?34 文獻標識碼:A 文章編號:1004?373X(2013)02?0001?05

0 引 言

高校圖書館使用數字技術進行信息資源的組織和管理,能夠存儲海量的信息。高校圖書館的搜索引擎部分地解決了資源發現的問題,但是它可能會返回給用戶成千上萬檢索到的網頁,而其中很大一部分與用戶的要求無關,用戶不能快速、準確地得到所需的有價值的信息。因此,運用Web使用記錄挖掘的高校圖書館搜索引擎隨之產生。運用Web使用記錄挖掘的高校圖書館搜索引擎是專門針對高校的信息資源進行檢索的搜索引擎,是實現高校教學資源共享提高搜索命中率必不可少的工具,所以高校圖書館搜索引擎中Web使用記錄挖掘的應用研究具有非常重要的科學意義和應用價值。

Web使用記錄挖掘[1]是從用戶“訪問痕跡”中獲取有價值的信息,是對Web上日志數據及相關數據的挖掘。Web使用記錄挖掘技術和工具可分為2大類:訪問模式的追蹤和個性化的使用記錄的追蹤。一般的訪問模式追蹤通過分析使用記錄來了解用戶的訪問模式和傾向,以改進站點的組織結構;個性化的使用記錄追蹤則傾向于分析個別用戶的偏好,其目的是根據不同用戶的訪問模式,為用戶提供定制的服務。其目的是預測用戶網上的行為,比較網站的實際使用與期望的差別,根據用戶的興趣調整網站結構。通過Web使用記錄挖掘技術對高校圖書館網站的Web訪問日志記錄進行挖掘,挖掘出用戶訪問模式、頻繁訪問路徑等信息,從而優化站點結構、獲取和分析用戶需求信息、為用戶提供高校圖書館搜索引擎系統服務以及為圖書館管理層提供決策支持。

1 高校圖書館搜索引擎中Web使用記錄挖掘 流程分析

在高校圖書館系統中,運用Web使用記錄挖掘的Web訪問日志數據為核心分析高校圖書館搜索引擎系統。高校圖書館的日志文件采用SQL Server數據庫來完成相應的挖掘操作,又用Clementine挖掘工具作以補充。

Clementine挖掘工具[2]是ISL公司開發的數據挖掘工具平臺。Clementine結合Web使用記錄挖掘技術可以快速建立預測性模型,進而應用到高校搜索引擎系統中,幫助高校圖書館改進圖書館搜索引擎系統的結構,為讀者提供個性化服務。

整個高校圖書館搜索引擎系統提出了一套適合Web使用記錄挖掘的流程圖,根據這個流程圖,進行數據收集,數據準備,建立用戶興趣模型,模式挖掘等操作。如圖1高校圖書館搜索引擎中Web使用記錄挖掘的流程圖所示。

圖1 高校圖書館搜索引擎中Web使用記錄挖掘的流程圖

1.1 數據收集

用戶瀏覽信息被Web服務器自動收集并保存在訪問日志、引用日志和代理日志中。基于高校圖書館網站自身特點,主要研究Web訪問日志。根據高校圖書館的Web服務器訪問日志,通過訪問路徑C:/WINDOWS/System32/LogFiles 收集需要的信息。Web訪問日志記錄用戶訪問信息。下面是一段收集的Web服務器訪問日志:

#Software: Microsoft Internet Information Services 6.0

#Version: 1.0

#Date: 2012?05?21 07:06:45

#Fields: date time s?sitename s?ip cs?method cs?uri?stem cs?uri?query s?port cs?username c?ip cs(User?Agent) sc?status sc?substatus sc?win32?status

2012?05?21 07:06:45 W3SVC894523 192.168.16.86 GET /index.htm ? 80 ?192.168.16.80Mozilla/4.0+(compatible;

+MSIE+7.0;+Windows+NT+5.1;+Trident/4.0;+GTB6.6;

+.NET+CLR+2.0.50727;+360SE) 200 0 0

上述日志的數據包含的主要項的含義如下:

(1)date time:時間戳。

(2)s?sitename: 系統服務。

(3)s?ip: 被訪問服務器的IP地址。

(4)cs?method: 客戶訪問的方式,有GET和POST。

(5)cs?uri?stem: 請求文檔的URL,即所訪問的頁面。

(6)cs?uri?query: URL查詢,用戶預進行的查詢。

(7)s?port: 被訪問服務器的端口。

(8)cs?username: 用戶ID,是在被訪問頁面需要進行用戶注冊時才有的。

(9)c?ip: 客戶主機的IP地址。

(10)cs(User?Agent): 表示客戶機的瀏覽器類型、版本即所運行的操作系統。

(11)sc?status: 返回碼。200代表成功,404代表找不到所請求的頁面。

猜你喜歡
搜索引擎高校圖書館
高校圖書館閱讀推廣案例分析
科技視界(2016年21期)2016-10-17 19:32:37
微信公眾平臺在高校圖書館信息服務中的應用研究
科技視界(2016年21期)2016-10-17 19:25:20
高校圖書館閱讀推廣活動研究
商(2016年27期)2016-10-17 06:38:27
試論高校圖書館在網絡環境沖擊下的人文建設
商(2016年27期)2016-10-17 06:30:59
高校圖書館閱讀推廣實踐探討
科技視界(2016年20期)2016-09-29 13:17:57
高校圖書館電子資源的宣傳與推廣
科技視界(2016年20期)2016-09-29 11:22:45
網絡搜索引擎亟待規范
中國衛生(2015年12期)2015-11-10 05:13:38
Nutch搜索引擎在網絡輿情管控中的應用
警察技術(2015年3期)2015-02-27 15:37:09
基于Nutch的醫療搜索引擎的研究與開發
廣告主與搜索引擎的雙向博弈分析
主站蜘蛛池模板: 国产美女精品一区二区| 亚洲国产综合第一精品小说| 国产91精选在线观看| 日韩毛片在线视频| 欧美日韩一区二区在线免费观看| 少妇人妻无码首页| 国产日韩欧美一区二区三区在线 | 亚洲乱强伦| 成人毛片免费在线观看| 全裸无码专区| 久久久久亚洲Av片无码观看| 一级不卡毛片| 亚洲精品图区| 国产69囗曝护士吞精在线视频| 国产理论最新国产精品视频| 日韩视频精品在线| 亚洲av无码片一区二区三区| 久久香蕉国产线看精品| 尤物在线观看乱码| 99这里只有精品免费视频| 高清精品美女在线播放| 亚洲性视频网站| 国产精品无码AV中文| 久久久受www免费人成| 色视频国产| 55夜色66夜色国产精品视频| 国产情精品嫩草影院88av| 国产精品永久在线| 国产欧美高清| 无码视频国产精品一区二区| 99久久免费精品特色大片| 国产原创演绎剧情有字幕的| 性欧美精品xxxx| 国模视频一区二区| 亚洲综合中文字幕国产精品欧美 | 欧美日本不卡| 国产精品综合色区在线观看| 国产精品天干天干在线观看| 中文无码精品a∨在线观看| 免费国产小视频在线观看| 久久永久视频| 亚洲美女一区| 69av免费视频| 日韩精品亚洲一区中文字幕| 国产成人精品男人的天堂| 日韩成人高清无码| 婷婷六月综合网| 狠狠做深爱婷婷久久一区| 亚洲综合欧美在线一区在线播放| 精品国产美女福到在线不卡f| 九九久久精品免费观看| 欧美精品在线免费| 欧美性色综合网| 国产亚洲欧美在线视频| 亚洲人成人无码www| 日本不卡在线视频| 成人一级黄色毛片| 永久免费精品视频| 嫩草国产在线| 免费观看成人久久网免费观看| 91免费在线看| 欧美中文字幕在线二区| 久久久久亚洲精品成人网| 亚洲区视频在线观看| 老司机aⅴ在线精品导航| 成人午夜免费视频| 亚洲av色吊丝无码| 亚洲欧美精品在线| 91久久夜色精品| 中文字幕一区二区视频| 99久久免费精品特色大片| 国产日韩精品欧美一区灰| 日韩高清在线观看不卡一区二区| 欧美日本在线观看| 欧美福利在线| 国产极品美女在线观看| 伊人久久大香线蕉综合影视| 欧美成人影院亚洲综合图| 亚洲色图综合在线| 日本五区在线不卡精品| 农村乱人伦一区二区| 欧美激情首页|