999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

圖書館用戶行為數據挖掘分析與應用

2023-01-07 05:42:35
數字通信世界 2022年3期
關鍵詞:數據挖掘分類圖書館

喬 婷

(中國消防救援學院,北京 102202)

隨著云計算技術、大數據技術和各種傳感器技術的迅猛發展,圖書館數據中心的基礎設施架構及用戶服務模式發生了根本性改變,數據資源已經成為圖書館信息系統重要的組成部分和圖書館服務能力的重要保障因素。如何高效利用大數據資源對用戶需求、用戶信息行為、用戶社會關系、圖書館服務方法和圖書館業務模式進行準確感知和識別,是圖書館提高對用戶需求的洞察力以及改善用戶閱讀體驗的前提,也是圖書館開展用戶精準的個性化服務和提高自身的服務競爭力的有力保證。

1 圖書館用戶行為數據分析的意義

隨著網絡信息技術的發展,圖書館的用戶服務模式與服務能力的評估標準有了根本性的變革,用戶服務能力的建設重點已由以資源建設為核心,向以滿足用戶需求為中心的個性化服務能力建設轉變。因此,圖書館在用戶服務過程中,能否全面準確掌握用戶的信息行為、信息獲取的社會關系、信息需求和信息獲取方式變化趨勢等數據,已成為圖書館個性化服務安全、高效、準確和經濟開展的關鍵。

圖書館的服務價值來源于對用戶需求的實現。認知科學研究發現,用戶是書館服務的主體,圖書館僅僅是用戶信息活動的外在工具之一,是用戶信息需求在物理或現實世界的延伸[1];而用戶信息需求過程是一種“以我為主”的自組織過程,有著內在的秩序,并獨立于圖書館而存在。因而,圖書館管理者不應以專家自居,而應重視用戶需求的內在規律性。圖書館具有不同的用戶主體,而他們工作及學習的領域、身份、年齡等差異使他們對資源有著不同的需求及偏好[1]。把所有用戶的行為轉化為可度量的數據,并對原本難以捉摸的用戶信息行為活動及其關系進行分析、描述、和預測,獲取到的新知識,對圖書館在管理方面進一步改進服務決策、提升服務能力具有指導性意義。

2 圖書館用戶行為數據的定義及獲取

圖書館用戶行為是指為獲取圖書館信息資源而受思想支配而施行的一切活動??茖W高效采集用戶行為數據,是分析用戶信息行為需求模式,提高圖書館用戶服務滿意度的關鍵。

根據用戶資源獲取方式的不同,用戶數據行為可以分為紙質資源的獲取和電子資源的獲取。紙質資源獲取方面主要涉及用戶基本信息、OPAC檢索記錄、館藏書目、流通歷史記錄;電子資源獲取主要涉及讀者對網站及移動客戶端中數字資源的訪問,具體包含用戶基本信息、數字資源類型、名稱、訪問利用方式及所利用詳細電子資源的歸屬分類。另外,根據用戶需求還應包括用戶信息咨詢方面,具體包括用戶線上線下的業務咨詢、意見建議、紙質及電子資源薦購等方面[2]。

3 圖書館用戶行為數據的處理

圖書館用戶行為數據的獲取渠道多樣,從不同的數據庫表中獲取的數據包含大量的冗余和噪聲,并且不同數據表中的字段格式各不相同,因此必須對采集到的數據進行數據清洗、轉換集成、數據裝入等工作[3]。

3.1 用戶行為數據清洗

用戶行為數據清洗是指對采集到的用戶行為數據進行處理,核實數據的完備性,過濾掉和用戶行為分析沒有關聯的垃圾數據,以減少數據冗余和噪音對用戶行為分析的不良影響。隨著對戶行為探索的進一步加深,用戶信息行為數據的采集范圍和采集深度不斷增長,這些被采集的用戶行為數據中包含許多數據噪音。如果數據庫中這些不良數據一直存在,會對數據分析的結果造成影響,降低用戶信息行為數據的可用性和價值密度。數據清洗過程通過技術和手動操作相結進行,主要有對拼寫錯誤的更正,對缺失數據值的補充,對不同的系統中的重復數據進行處理、刪除噪聲數據。

3.2 用戶行為數據轉換集成

由于用戶行為分析的數據獲取來自不同的數據庫、數據表,這些數據可能會有不同的數據存儲格式與類型,因此需要對某些數據表中存儲的數據字段類型進行修改,實現數據字段格式、類型的統一,以便數據挖掘過程的順利進行。數據轉換的目的是將收集抽取到的不同結構的數據轉換成集成的、統一標準的數據,形成一個集成的統一標準的數據集合。另外,在首次裝入數據后,還需實時監測數據源的變化,將更新的所需數據加載到數據倉庫中。

3.3 圖書館用戶行為數據挖掘分析的模型

3.3.1 聚類模式

聚類分析模式是利用對象的不同特征,根據對象的相似性,將數據分為不同的分類的集合[2]。不同分類中的對象差別較大,而同一個類中的對象具有高度的相似性。例如,根據圖書館的用戶身份不同可以分為學生類、教員類、帶隊干部類、教輔員類??梢酝ㄟ^對圖書館的用戶屬性進行分類來研究用戶的行為習慣,如年齡、身份、專業、籍貫等,通過對用戶行為數據的聚類分析,從而找出對象與對象、對象與各屬性之間的關系,從而分析并獲得用戶的行為知識。

3.3.2 關聯規則

關聯規則是用來描述數據庫中不同數據項之間存在的關系規則,可以根據一個對象中某些屬性的出現推導出另一些屬性也會屬于這個對象[3]。通過關聯規則可以從海量數據中發現存在于數據中的隱藏的一些關聯和相互的關系,可以發現用戶和其不同屬性之間的關聯類型,進而可以制定以用戶需求為中心的服務策略,提高用戶滿意度。例如,通過用戶數據關聯規則可以實現以下應用:①通過分析某個用戶的屬性特征,分析用戶的閱讀偏好,可以將于此用戶所需圖書的同一類圖書進行推薦。②通過分析同一類集合中的用戶屬性,分析用戶的閱讀偏好,將相同性質的圖書推薦給集合用戶。③通過分析得知具有相同閱讀偏好和閱讀方式的用戶屬性。

3.3.3 時間序列分析模式

時間序列分析是一組按照時間順序發生的事件,其在多個固定時間段內的記錄的集合,在這些時間序列集合中獲取在一定時間間隔內某事件發生的變化、規律[4]。例如,通過分析圖書館每天固定時間段內的人數變化、借閱變化等,可以調整圖書館借閱室及閱覽室的開放時間及服務策略。

3.3.4 分類模式

分類模式是在已有定義好的類的基礎上,對大數據樣本進行分析,得到決定數據樣本屬于不同類的規則和方法,進而將數據中的數據項映射到應該歸屬的類上。通過分類模式可以實現數據的應用與預測。

例如,通過對圖書館用戶的數據樣本進行分析,可以對每個用戶基本進行統計分析,獲取數據的分類規則,建立一個用戶分類模型,將所有職別分類為學生的數據定義為學生類,所有職別分類為教員的定義為教師類,進而將所有的用戶數據使用此分類規則進行分類。

3.4 圖書館用戶行為數據挖掘分析的服務應用

3.4.1 基于用戶行為數據挖掘分析提供個性化服務模式

用戶個性化服務是指以用戶為中心,利用數據挖掘技術對用戶行為數據進行挖掘分析,獲取圖書館用戶的信息行為、習慣、偏好、特點及用戶特定的需要,提供給用戶滿足其個性化需求的針對性、主動性服務。①針對不同的用戶所提出的不同的信息需求提供有針對性的信息服務包括信息咨詢、信息結果推送等。②通過對用戶信息或者用戶的信息需求行為進行分析而發現的用戶需求偏好[5],從而實現對用戶進行主動的、符合其要求的、有用的信息服務。因此,圖書館用戶的行為、習慣、偏好和特點是圖書館個性化服務的基礎,先進的數據挖掘技術是圖書館個性化服務的重要手段,針對性、主動性是圖書館個性化服務的特點。

圖書館個性化服務充分利用各種信息網絡技術,可以實現對用戶行為偏好的數據推送,對于用戶個性化推薦的應用可分為以下幾個方面:

(1)基于用戶信息綁定規則的推薦,是指根據事先設定好的規則標準來向用戶推薦的方式;比如,用戶借閱的圖書為叢書類,那么在用戶再次進行信息獲取行為時,系統會對用戶未獲取的剩余叢書進行推薦。

(2)基于用戶偏好內容的推薦,是指通過比較信息資源與用戶模型的相似程度進而向用戶推薦信息的方式;比如,用戶獲取的信息類型為人物傳記,則在用戶獲取信息時,會通過相似性分類推薦人物傳記類型書目。

(3)基于合作推薦,是指通過用戶的聚類分析,將某一用戶的行為信息推薦給用戶類中的用戶。比如,院校中計算機系的教員為一個用戶類,其中一個用戶研究的文獻的相似文獻便可推薦給此用戶類中的其他用戶。

3.4.2 基于用戶行為數據挖掘分析優化館藏資源采購建設

無論是傳統圖書館還是現代新型圖書館,館藏資源是圖書館服務的基礎,采購書目的確定,是圖書館建設管理的重要組成部分。然而采購書目的確定存在著以下弊端:①采購書目一般由采購人從個人角度對用戶行為數據進行分析,具有個人主觀性,結果并不準確。②實際用戶需求調研難以開展,統計具有片面性,搜集數據并不準確。③圖書館用戶信息中不明確個人對資源的需求。這造成了圖書資源利用率低下,一些不被利用的圖書長期壓架,而某些用戶卻存在無書可讀的情況。

利用數據挖掘技術對圖書館用戶的借閱流通記錄、OPAC檢索數據進行分析、挖掘,通過分類模式統計資源拒借集和頻繁借閱集,進而對信息資源有針對性的進行補充。并且可以以此為依據分析出資源的利用率并及時剔除過時、老化的資源信息。另外,通過信息檢索數據獲取“0檢索”的圖書文獻資源,作為采購書目的備選項[6]。通過用戶實際需求進行館藏資源的采購建設使購書的質量提高了,針對性和實用性加強了,盲目性減少了,大大提高了圖書的借閱率,是提高館藏資源文獻利用率,提高用戶服務質量的重要環節。

3.4.3 基于用戶行為數據挖掘分析調整圖書館人員服務結構

圖書館服務人員是圖書館服務整體中的重要組成部分,如何合理的安排調配圖書館服務人員的服務時間及服務類型是提高整個圖書館服務效率和用戶滿意度的關鍵。圖書館服務的對象為讀者用戶,通過聚類模式技術和時間序列分析技術對不同類型用戶到館的時間段進行挖掘分析,然后通過分析結果合理地調整圖書館開放時間、圖書館工作人員服務時間及服務類型,可以節省必要的資源,提高圖書館利用效率,更好地提高圖書館的服務滿意度[7]。

3.4.4 基于用戶行為數據挖掘分析評估服務效率

用戶的行為信息可以充分體現出圖書館對用戶提供服務的情況,進而可以通過對圖書館用戶行為的數據進行挖掘分析,進行圖書館服務效率的評估。其中,用戶對圖書館的滿意度、圖書的借閱量、到館訪問人次的數據量、數字圖書館訪問的情況、用戶的意見建議、用戶的參考咨詢記錄等都可以反應出圖書館的服務效率[8]。用戶行為數據的分析對圖書館服務效率的評估應用包含以下幾個方面。

(1)通過利用時間序列分析規則對近一年的用戶到館人次數及圖書借閱量進行統計分析,對比得到用戶到館人次及圖書借閱數量的趨勢。

(2)通過利用時間序列模型對數字圖書館文獻的在線閱讀量及文獻數據下載量進行統計分析,進而得到數字圖書館的利用情況趨勢。

(3)通過對OPAC中的檢索信息進行挖掘分析,通過時間序列分類模式統計分析用戶“0檢索”的數據,分析資源覆蓋率變化趨勢[9]。

4 結束語

隨著大數據挖掘技術的深入發展和圖書館用戶服務需求的增加,圖書館的大數據環境和用戶行為分析過程將會更加復雜。因此,對圖書館用戶行為數據的挖掘分析必須從大數據視角出發,進一步獲得新的應用、預測和分析能力,才能保證圖書館用戶行為數據分析結果科學、全面、精確和可用,才能為圖書館用戶個性化數據服務提供可靠的數據支撐??傊瑘D書館用戶行為數據的挖掘分析,對于提高圖書館用戶的個性化服務質量,滿足用戶的信息需求具有極其重要的現實意義。

猜你喜歡
數據挖掘分類圖書館
分類算一算
探討人工智能與數據挖掘發展趨勢
分類討論求坐標
數據分析中的分類討論
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
教你一招:數的分類
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
飛躍圖書館
一種基于Hadoop的大數據挖掘云服務及應用
圖書館里的是是非非
主站蜘蛛池模板: 欧美不卡在线视频| 中文字幕在线看视频一区二区三区| 日本一本在线视频| 男女精品视频| 国产女人在线观看| 精品欧美视频| 国产一区在线视频观看| 国产最爽的乱婬视频国语对白| 五月综合色婷婷| 亚洲中文字幕在线一区播放| 国产一在线| 高清乱码精品福利在线视频| 九九视频免费在线观看| 亚洲第一极品精品无码| 综合久久五月天| 91精品小视频| 日本爱爱精品一区二区| а∨天堂一区中文字幕| 2021国产v亚洲v天堂无码| 国产极品粉嫩小泬免费看| 99这里精品| 韩国v欧美v亚洲v日本v| 欧美日韩久久综合| 日韩在线永久免费播放| 国产精品无码一二三视频| 97免费在线观看视频| 2020极品精品国产| 激情在线网| 亚洲日韩精品综合在线一区二区| 在线观看视频99| 成人福利在线视频| 精品人妻系列无码专区久久| 国产三级精品三级在线观看| 国产麻豆福利av在线播放 | 国产成人在线无码免费视频| 国产香蕉一区二区在线网站| 亚洲欧美不卡视频| 免费黄色国产视频| 久热re国产手机在线观看| 国产91高清视频| 国产欧美又粗又猛又爽老| 波多野结衣视频一区二区| 日韩av手机在线| 自拍亚洲欧美精品| 9966国产精品视频| 久久国产精品嫖妓| 国产成熟女人性满足视频| 青青草一区| 亚洲天堂网2014| 午夜精品久久久久久久无码软件| 午夜a级毛片| 制服丝袜国产精品| 福利视频一区| 99热这里只有精品2| 91综合色区亚洲熟妇p| 国产精品成人免费视频99| 久久国产精品国产自线拍| 久久狠狠色噜噜狠狠狠狠97视色| 欧美在线国产| 国产超碰在线观看| 国产三级毛片| 国产欧美日韩资源在线观看| 国产成人区在线观看视频| 99re精彩视频| 91视频国产高清| 永久在线播放| 91欧美亚洲国产五月天| 色婷婷国产精品视频| 人妻少妇久久久久久97人妻| 免费午夜无码18禁无码影院| 亚洲愉拍一区二区精品| 国产在线小视频| 黄片一区二区三区| 特级欧美视频aaaaaa| 国产精品第一区| 国产欧美在线| 日韩av资源在线| 久久免费视频播放| 四虎影视库国产精品一区| 99视频免费观看| 99精品国产自在现线观看| 一区二区三区高清视频国产女人|