顏琪媛

摘要:應(yīng)用大數(shù)據(jù)技術(shù),可以讓圖書館在新時(shí)期得到進(jìn)一步地發(fā)展,可以讓信息服務(wù)水平得到提升。本文首先對(duì)大數(shù)據(jù)對(duì)圖書館帶來(lái)的影響進(jìn)行分析,然后從信息服務(wù)的角度,對(duì)大數(shù)據(jù)在圖書館中的應(yīng)用特點(diǎn)進(jìn)行闡述,最后結(jié)合實(shí)例,提出幾點(diǎn)大數(shù)據(jù)在圖書館的應(yīng)用策略。
關(guān)鍵詞:大數(shù)據(jù)技術(shù);數(shù)字圖書館;信息服務(wù)
前言:
大數(shù)據(jù)是一種較為抽象的概念,主要指的是因?yàn)樽陨砭哂休^大的容量、較快的增長(zhǎng)速度、較為復(fù)雜的關(guān)系而需要新的處理模式才可以讓其決策力得到提升的海量信息資產(chǎn)。其本身具有規(guī)模大、結(jié)構(gòu)多樣、價(jià)值密度低的特點(diǎn),其流程可以概括為數(shù)據(jù)采集、數(shù)據(jù)分析與數(shù)據(jù)解釋三個(gè)環(huán)節(jié)。
一、大數(shù)據(jù)對(duì)圖書館帶來(lái)的影響
(一)借助大數(shù)據(jù)建立知識(shí)服務(wù)導(dǎo)航機(jī)制
在傳統(tǒng)圖書館中,讀者在帶有明確目的的情況下,按照類別去尋找自己所需的書籍往往存在很多困難,需要工作人員提供幫助。非但讀者不夠方便,工作人員的工作量也被加大了。借助大數(shù)據(jù)技術(shù),可以建立起良好的知識(shí)服務(wù)導(dǎo)航機(jī)制,可以讓此問(wèn)題得到徹底解決。可以利用移動(dòng)應(yīng)用程序?qū)^內(nèi)地圖和OPAC進(jìn)行有機(jī)整合,讓讀者在找尋資料時(shí)可以明確位置。
(二)借助大數(shù)據(jù)完善新的知識(shí)服務(wù)方式
借助大數(shù)據(jù)技術(shù),圖書館可以完成用戶數(shù)據(jù)信息的分析工作,不但可以明確用戶的信息行為,還能夠?qū)τ脩魸撛谛枨髷?shù)據(jù)予以深度挖掘。讀者的閱讀習(xí)慣、讀者的構(gòu)成部分、讀者的潛在需求以及相關(guān)的借閱數(shù)據(jù)都是極具價(jià)值的信息,通過(guò)對(duì)這些信息的分析,可以對(duì)讀者展開針對(duì)性的服務(wù)。如某位讀者經(jīng)常在圖書館內(nèi)借閱文學(xué)類的圖書,那么在其登錄數(shù)字化借閱端口時(shí),就會(huì)出現(xiàn)多種此類圖書,起到良好的推薦作用[1]。
(三)大數(shù)據(jù)讓圖書館數(shù)據(jù)存儲(chǔ)和計(jì)算面臨挑戰(zhàn)
在大數(shù)據(jù)時(shí)代,數(shù)據(jù)的數(shù)量與類型都在不斷增多,非結(jié)構(gòu)化與結(jié)構(gòu)化的數(shù)據(jù)信息會(huì)隨著用戶的網(wǎng)絡(luò)活動(dòng)而不斷產(chǎn)生,這無(wú)疑會(huì)提高圖書館數(shù)據(jù)存儲(chǔ)、計(jì)算、分析的要求,存儲(chǔ)能力和運(yùn)算能力的限制會(huì)讓圖書館數(shù)據(jù)在應(yīng)用過(guò)程中出現(xiàn)困難,讓圖書館面臨挑戰(zhàn)。
二、大數(shù)據(jù)在圖書館的應(yīng)用特點(diǎn)
從信息服務(wù)角度來(lái)看,大數(shù)據(jù)在圖書館進(jìn)行應(yīng)用的過(guò)程中,服務(wù)對(duì)象、服務(wù)技術(shù)和服務(wù)模式均有所改變。現(xiàn)階段,智能手機(jī)已然成為了閱讀信息的主要載體,習(xí)慣使用智能手機(jī)的年輕人也隨之成為圖書館的主要服務(wù)對(duì)象;在服務(wù)技術(shù)方面,利用網(wǎng)絡(luò)化技術(shù)可以對(duì)傳統(tǒng)信息資源予以轉(zhuǎn)化,將其存儲(chǔ)于虛擬空間,對(duì)其進(jìn)行處理的客觀技術(shù)在不斷更新,不斷轉(zhuǎn)變,而技術(shù)的轉(zhuǎn)變帶動(dòng)了圖書館工作人員的轉(zhuǎn)變,要求工作人員需要掌握更多的服務(wù)技能;在服務(wù)模式方面,大數(shù)據(jù)在圖書館應(yīng)用之后,可以不用親身到圖書館就可以完成信息的查找工作,信息服務(wù)模式發(fā)生了極大轉(zhuǎn)變,通過(guò)檢索功能,可以很快查找到所需信息,服務(wù)效率得到極大增強(qiáng)。同時(shí),因?yàn)榫W(wǎng)絡(luò)通信技術(shù)的迅速崛起,如果圖書館建立起相應(yīng)的APP,那么還可以通過(guò)軟件來(lái)為讀者提供個(gè)性化的信息推送服務(wù)[2]。
三、大數(shù)據(jù)在圖書館的應(yīng)用策略
(一)選擇合理的大數(shù)據(jù)處理技術(shù)
隨著信息技術(shù)的發(fā)展,數(shù)據(jù)格式漸漸變得豐富多樣,如視頻、音頻都已成為常見格式。在對(duì)圖書館大量數(shù)據(jù)進(jìn)行存儲(chǔ)時(shí),可以利用聯(lián)網(wǎng)方便、速度很快的硬盤存儲(chǔ)方式。圖書館在數(shù)據(jù)處理時(shí),涉及到的信息大部分為結(jié)構(gòu)化數(shù)據(jù)信息,對(duì)有價(jià)值信息進(jìn)行挖掘時(shí)具有很大的難度,圖書館應(yīng)該對(duì)數(shù)據(jù)處理方式進(jìn)行及時(shí)改變,對(duì)用戶的信息行為、借閱記錄等信息都需要予以深入分析,讓基礎(chǔ)設(shè)施得到改善,讓服務(wù)方案得到提升。就目前來(lái)看,圖書館可以選擇的數(shù)據(jù)處理方法主要可分為四種,第一種為Map Reduce技術(shù),這種技術(shù)可以把復(fù)雜的運(yùn)行在大規(guī)模集群上的并行計(jì)算過(guò)程轉(zhuǎn)化為兩個(gè)函數(shù)的映射與簡(jiǎn)化,對(duì)于編程人員來(lái)說(shuō)十分方便,其處理流程可以概括為,編號(hào)代碼、配置作業(yè)、提交作業(yè)、分配和執(zhí)行Map任務(wù)、處理中間結(jié)果、分配和執(zhí)行Reduce任務(wù);第二種為No Only SQL數(shù)據(jù)庫(kù),這種數(shù)據(jù)庫(kù)的模型較為簡(jiǎn)單,元數(shù)據(jù)、應(yīng)用數(shù)據(jù)為分開狀態(tài),系統(tǒng)管理十分靈活;第三種為Hadoop技術(shù),這種技術(shù)具有易用性與開源性,其主要模塊分為兩部分,即MapReduce與分布式系統(tǒng),它們是處理核心,使用者能夠通過(guò)Hadoop完成計(jì)算機(jī)資源的組織工作,讓分布式計(jì)算平臺(tái)得以搭建;第四種為云計(jì)算技術(shù),無(wú)論是硬件還是軟件都是信息資源,都可以利用互聯(lián)網(wǎng)提供給用戶,同時(shí),它可以讓信息資源結(jié)構(gòu)得到擴(kuò)展,讓動(dòng)態(tài)信息得到更新。
(二)解決圖書館信息資源組織問(wèn)題
在應(yīng)用大數(shù)據(jù)技術(shù)的過(guò)程中,信息資源組織面對(duì)的問(wèn)題包含兩個(gè)方面,即信息特征的揭示困難和具體組織對(duì)象的選擇困難。為解決這兩大難點(diǎn),需要著眼于流程設(shè)計(jì)和方法實(shí)施這兩個(gè)方面。
1.信息資源組織流程
信息人員利用多種信息技術(shù)可以完成分散、雜亂、大量的元數(shù)據(jù)選擇工作,對(duì)信息予以優(yōu)化和處理可以形成一個(gè)整體流程,非結(jié)構(gòu)化數(shù)據(jù)、結(jié)構(gòu)化數(shù)據(jù)與半結(jié)構(gòu)化數(shù)據(jù)是大數(shù)據(jù)的主要來(lái)源,對(duì)半結(jié)構(gòu)化數(shù)據(jù)與結(jié)構(gòu)化數(shù)據(jù)予以存儲(chǔ),對(duì)非結(jié)構(gòu)化數(shù)據(jù)與半結(jié)構(gòu)化數(shù)據(jù)予以流處理,讓并行數(shù)據(jù)庫(kù)和關(guān)系數(shù)據(jù)庫(kù)經(jīng)過(guò)批處理后可以完成數(shù)據(jù)的應(yīng)用工作。
2.信息資源組織方法
在圖書館信息資源中,無(wú)論是網(wǎng)絡(luò)信息還是館藏信息都會(huì)在發(fā)展到一定程度后迅速增長(zhǎng),組成大數(shù)據(jù),現(xiàn)階段,數(shù)據(jù)庫(kù)方式、主題樹方式、超媒體方式與文件方式不能讓信息的收集和分析足夠高效,不能給用戶提供良好的服務(wù)體驗(yàn)。信息資源組織方式中的批處理和流處理可以對(duì)非結(jié)構(gòu)化數(shù)據(jù)產(chǎn)生良好的信息資源組織效果。
(三)建立個(gè)性化、智能化的信息檢索系統(tǒng)
1.個(gè)性化搜索
如前文所說(shuō),在用戶信息收集基礎(chǔ)之上,建立起信息檢索系統(tǒng),用戶信息包含了學(xué)習(xí)信息、個(gè)人信息與行為信息,利用這些信息可以讓圖書館清楚用戶需求,形成推薦目錄。為實(shí)現(xiàn)個(gè)性化搜索,必須要確保搜索引擎的智能化,根據(jù)用戶輸入的關(guān)鍵詞,按照相關(guān)度、瀏覽數(shù)量等順序來(lái)呈現(xiàn)給用戶,查全率和查準(zhǔn)率都要有所保障。搜索引擎應(yīng)該具有人機(jī)對(duì)話功能和相應(yīng)的分析能力,需要針對(duì)用戶搜索做出快速反應(yīng)。同時(shí),圖書館需要對(duì)搜索引擎予以定期評(píng)估,建立起以用戶為中心的搜索機(jī)制。endprint
2.智能化搜索
為實(shí)現(xiàn)智能化搜索,需要做好三方面的工作。首先,圖書館應(yīng)該在系統(tǒng)搜索引擎中建立起機(jī)器學(xué)習(xí)的功能;其次,圖書館應(yīng)該利用此功能,讓搜索引擎得到擴(kuò)展,除了文字檢索之外,還可以擴(kuò)展到視頻檢索、圖片檢索等;最后,搜索引擎應(yīng)該具有自動(dòng)更新功能,數(shù)據(jù)數(shù)量與類型在不斷增長(zhǎng),搜索引擎對(duì)平臺(tái)中的海量數(shù)據(jù)需要做到實(shí)時(shí)更新,確保結(jié)果的全面與準(zhǔn)確。除此之外,在更新搜索引擎時(shí)應(yīng)該結(jié)合用戶對(duì)信息的進(jìn)行搜索的習(xí)慣。
(四)設(shè)計(jì)圖書館公共數(shù)據(jù)庫(kù)
1.設(shè)計(jì)圖書館公共數(shù)據(jù)庫(kù)的重要性
圖書館資料建設(shè)分為三個(gè)階段,第一階段為藏書建設(shè),第二階段為文獻(xiàn)資源建設(shè),第三階段為圖書館信息資源建設(shè)。完善圖書館公共數(shù)據(jù)庫(kù)是第三階段的主要內(nèi)容,公共資源建設(shè)包含三個(gè)方面,搜集制作資源、管理組織資源和資源服務(wù)體系,利用大數(shù)據(jù)技術(shù)可以完成資源的搜索、存儲(chǔ)與篩選工作,可以讓讀者需要得到滿足,并擴(kuò)大圖書館自身的發(fā)展范圍。
2.設(shè)計(jì)圖書館公共數(shù)據(jù)庫(kù)的方法
以我國(guó)沈陽(yáng)市圖書館為例,在公共數(shù)據(jù)庫(kù)結(jié)構(gòu)功能設(shè)計(jì)中其主線為使用者,E-R模型圖如圖1所示。
如圖1所示,通過(guò)網(wǎng)絡(luò)信息采集器,圖書管理員可以完成社交網(wǎng)、公共信息網(wǎng)等方面的信息采集工作,讓其在公共數(shù)據(jù)庫(kù)中得到儲(chǔ)存。而在用戶登錄模塊,圖書管理員在輸入密碼與用戶名之后,可以進(jìn)入后臺(tái)管理界面,在此界面,可操作項(xiàng)包含了期刊管理、典藏管理等內(nèi)容。而在讀者檢索界面,可以進(jìn)行圖書檢索、期刊檢索、模糊檢索和類別檢索。在公共數(shù)據(jù)庫(kù)管理框架的設(shè)計(jì)上,可分成三個(gè)步驟進(jìn)行,首先需要使用網(wǎng)絡(luò)數(shù)據(jù)采集工具完成資源信息的采集工作,然后需要對(duì)采集的信息進(jìn)行儲(chǔ)存和組織,最后需要對(duì)信息資源進(jìn)行分析,結(jié)合當(dāng)前情況,資源信息分析出現(xiàn)在移動(dòng)終端設(shè)備與互聯(lián)網(wǎng)設(shè)備的情況較多。在網(wǎng)絡(luò)平臺(tái)公共信息數(shù)據(jù)存儲(chǔ)時(shí),把組織之后的信息數(shù)據(jù)以列式存儲(chǔ)的方法存放在hbase數(shù)據(jù)庫(kù)里,一個(gè)存儲(chǔ)列對(duì)應(yīng)一個(gè)頁(yè)鏈接。
(五)提高圖書館信息服務(wù)水平
1.學(xué)科知識(shí)服務(wù)
為提高圖書館信息服務(wù)水平,需要加強(qiáng)學(xué)科知識(shí)服務(wù)水平,需要為用戶提供具有個(gè)性化、科學(xué)化的圖書信息。無(wú)論是高校圖書館還是公共圖書館,這種學(xué)科知識(shí)服務(wù)都是必要的。在大數(shù)據(jù)的應(yīng)用過(guò)程中,圖書館的信息服務(wù)內(nèi)容會(huì)產(chǎn)生變化,信息服務(wù)模式也會(huì)隨之變化,學(xué)科知識(shí)在迅速增長(zhǎng),在不斷更新,已然組成了學(xué)科生態(tài)系統(tǒng),在此基礎(chǔ)上,對(duì)這些數(shù)據(jù)信息進(jìn)行采集與分析,利用處理工具與相關(guān)技術(shù)可以讓數(shù)據(jù)的潛在價(jià)值被挖掘出來(lái),以學(xué)科為基礎(chǔ),分析專業(yè)信息資源的檢索系統(tǒng)中的瀏覽下載頻率,可以找出不同時(shí)間段內(nèi)用戶的興趣點(diǎn),對(duì)數(shù)據(jù)信息進(jìn)行統(tǒng)計(jì)和挖掘可以找到圖書、用戶與信息資源之間的網(wǎng)絡(luò)結(jié)構(gòu),進(jìn)而完成網(wǎng)絡(luò)的構(gòu)建工作。
2.一站式資源服務(wù)
在圖書館中應(yīng)用大數(shù)據(jù)技術(shù),需要提供給用戶一站式資源服務(wù)。在當(dāng)前環(huán)境下,數(shù)字化的信息資源十分龐大,數(shù)據(jù)的類型繁多且結(jié)構(gòu)相對(duì)復(fù)雜。在圖書館中,信息資源包含了兩個(gè)方面,即虛擬館藏資源與現(xiàn)實(shí)館藏資源。虛擬館藏資源包括了在線出版物、網(wǎng)絡(luò)數(shù)據(jù)庫(kù)和網(wǎng)絡(luò)動(dòng)態(tài)信息,利用Hadoop、Map Reduce、云計(jì)算等技術(shù)可以讓用戶在復(fù)雜的數(shù)據(jù)中快速找到所需信息,將多種信息資源予以開放式存儲(chǔ),可以讓用戶成為信息的主動(dòng)發(fā)布者。同時(shí),圖書館在數(shù)據(jù)信息整合的時(shí)候應(yīng)該對(duì)重復(fù)數(shù)據(jù)予以去除,讓數(shù)據(jù)的可依賴性更高,利用大數(shù)據(jù)智能化檢索技術(shù)可以完成一站式資源服務(wù)的提供工作。
3.信息可視化服務(wù)
信息可視化程度和用戶面對(duì)信息的直觀性是緊密相關(guān)的。在大數(shù)據(jù)中,包含了大量信息,且這些信息的價(jià)值密度點(diǎn)不是很高,結(jié)合大數(shù)據(jù)分析技術(shù)可以將有價(jià)值信息予以找出,然后利用可視化技術(shù)(如歷史流、標(biāo)簽云、空間信息)可以將此信息變得更為直觀。讓用戶的檢索、評(píng)價(jià)速度提升,進(jìn)而使得圖書館對(duì)自身系統(tǒng)進(jìn)行優(yōu)化。同時(shí),信息可視化技術(shù)可以與學(xué)科計(jì)量學(xué)方法相結(jié)合,生成學(xué)科知識(shí)地圖,讓作者、學(xué)科以及著作之間的關(guān)系得到直觀表現(xiàn),讓學(xué)科知識(shí)的結(jié)構(gòu)得到闡述,讓各個(gè)領(lǐng)域的發(fā)展動(dòng)態(tài)得到反映。以上海市圖書館為例,該圖書館在應(yīng)用大數(shù)據(jù)過(guò)程這能夠推出了手機(jī)APP,且使用了iBeacon技術(shù),這種技術(shù)能夠?qū)⒍S碼、位置定位等移動(dòng)手段和圖書館的服務(wù)結(jié)合,在借紙質(zhì)圖書時(shí),利用手機(jī)APP還可以幫助讀者快速找到圖書所在位置,而在查詢圖書時(shí),無(wú)論讀者身在何處,都可以對(duì)其進(jìn)行查看。
4.智慧服務(wù)
在知識(shí)服務(wù)的基礎(chǔ)上,對(duì)其進(jìn)行升華和創(chuàng)新可以形成智慧服務(wù)。瀏覽信息時(shí)產(chǎn)生的日志,借還書產(chǎn)生的數(shù)據(jù),書目查詢時(shí)產(chǎn)生的檢索目錄共同形成了用戶的信息來(lái)源,在數(shù)字圖書館中應(yīng)用大數(shù)據(jù)的挖掘技術(shù),可以讓用戶對(duì)信息服務(wù)的滿意度得到提升,針對(duì)用戶的實(shí)際需求,可以為用戶提供具有主動(dòng)性的定制化服務(wù)。以汕頭市圖書館為例,汕頭市圖書館在2017年6月份正式啟動(dòng)了大數(shù)據(jù)服務(wù)平臺(tái),并將圖書館入門處的智慧墻與之連接,智慧墻中顯示了每個(gè)小時(shí)的圖書館人次,圖書館的借還量、圖書借閱榜單以及新書的推薦等,就目前來(lái)看,在排行榜上,“東野圭吾”、“我的前半生”為熱門檢索詞,實(shí)現(xiàn)了智慧服務(wù)的目標(biāo)。
結(jié)論:
綜上所述,通過(guò)選擇合理的大數(shù)據(jù)處理技術(shù)、解決圖書館信息資源組織問(wèn)題、建立個(gè)性化智能化的信息檢索系統(tǒng)、設(shè)計(jì)圖書館公共數(shù)據(jù)庫(kù)和提高圖書館信息服務(wù)水平可以讓大數(shù)據(jù)技術(shù)在圖書館中得到良好的應(yīng)用,進(jìn)而推動(dòng)圖書館的進(jìn)一步發(fā)展,讓讀者獲得更為舒適的服務(wù)體驗(yàn)。
參考文獻(xiàn):
[1]高曉東,周建.高職院校圖書館大數(shù)據(jù)在學(xué)業(yè)預(yù)警中的應(yīng)用[J].圖書館學(xué)刊,2015,3701:115-117.(2015-01-30)
[2]羅芳.大數(shù)據(jù)在圖書館的應(yīng)用[J].科技廣場(chǎng),2015,03:132-135.endprint