張雙雙
(長春財經(jīng)學(xué)院 吉林 長春 130000)
大數(shù)據(jù)時代最早由全球知名咨詢公司麥肯錫,在2011年5月發(fā)表的一篇報告《大數(shù)據(jù):創(chuàng)新、競爭和生產(chǎn)力的下一個前沿》中提出,從這一刻起,大數(shù)據(jù)開始備受各行各業(yè)的關(guān)注。2012年,美國政府認(rèn)為大數(shù)據(jù)已經(jīng)能夠影響國家經(jīng)濟結(jié)構(gòu)和產(chǎn)業(yè)升級,變得像“石油”等自然資源一樣重要。到了2013年數(shù)據(jù)已經(jīng)成為科研活動的核心,如果不能善于利用數(shù)據(jù),就會造成大量的資源浪費。智慧圖書館是未來的發(fā)展趨勢,針對“大數(shù)據(jù)”和“智慧圖書館”這兩種新興事物進行研究,對圖書館的發(fā)展具有重要意義。本文通過此研究熱點進行分析,從而為智慧圖書館的發(fā)展提供幫助。
麥肯錫公司給出的定義:大數(shù)據(jù)是一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合[1]。
目前,大數(shù)據(jù)沒有統(tǒng)一的定義,本文認(rèn)為大數(shù)據(jù)可以簡要概括為海量數(shù)據(jù)+處理辦法,實際上就是利用先進的處理數(shù)據(jù)的辦法,將海量數(shù)據(jù)挖掘出有價值的數(shù)據(jù),并將這些有利用價值的數(shù)據(jù)進行可視化,還能利用一定的技術(shù)方法存儲這些海量數(shù)據(jù),對數(shù)據(jù)安全做好防護等一系列的問題。
智慧圖書館是指把智能技術(shù)運用到圖書館建設(shè)中而形成的一種智能化建筑,是智能建筑與高度自動化管理的數(shù)字圖書館的有機結(jié)合和創(chuàng)新[2]。智慧圖書館是未來圖書館發(fā)展的必然趨勢,是智能圖書館的升級,將云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)與智能設(shè)備結(jié)合在一起,能像人一樣提供智慧化服務(wù),除此之外更要包含圖書館館員的智慧服務(wù)。
本文利用中國知網(wǎng)數(shù)據(jù)庫,采用高級檢索方式,設(shè)定“主題詞=(大數(shù)據(jù)and智慧圖書館)”進行檢索,檢索出648條結(jié)果,檢索時間為2021年4月12日。由圖1可知,關(guān)于“大數(shù)據(jù)”并含“智慧圖書館”的文章是從2012年開始出現(xiàn)的,2012年出現(xiàn)了1篇,2013年出現(xiàn)了3篇,發(fā)文量從2014年開始緩慢上升,一直到2017年,這4年每年發(fā)文量都在50篇以內(nèi);在2018年至今,發(fā)文量增加比較顯著,經(jīng)中國知網(wǎng)預(yù)測2021年這方面文章將達到271篇。我們將這648條數(shù)據(jù)導(dǎo)出Refworks格式作為此次基于CiteSpace研究的數(shù)據(jù)來源[1]。

圖1 主題詞“大數(shù)據(jù)and智慧圖書館”在中國知網(wǎng)中年發(fā)文量
此研究利用CiteSpace5.7.R5版本軟件進行知識圖譜的可視化分析,主要分析在大數(shù)據(jù)環(huán)境下智慧圖書館研究熱點。經(jīng)中國知網(wǎng)檢索出的數(shù)據(jù)可知,在2012年開始出現(xiàn)這方面的文章,所以時間節(jié)點取2012到2021年近10年的詞頻進行分析。將648條Refworks格式的數(shù)據(jù)存放到input文件夾中,將txt文件改成CiteSpace可以識別的文件名稱,如“download1_converted”,利用CiteSpace軟件先轉(zhuǎn)化成其可以識別的數(shù)據(jù),存儲在data文件夾中,再建立一個project文件夾用來跑數(shù)據(jù)。數(shù)據(jù)準(zhǔn)備完成后,進行關(guān)鍵詞分析,選擇裁剪的算法,時間切片選“1”,以1年為單位進行研究,點擊“go”,最后得到CiteSpace可視化圖譜見圖2。

圖2 基于CiteSpace關(guān)于大數(shù)據(jù)環(huán)境下智慧圖書館的主題分布圖
通過這種可視化圖譜,可以將熱點清晰地呈現(xiàn)出來,圖中大圓點代表比較火熱突出的主題詞,主要有智慧圖書館、大數(shù)據(jù)、圖書館、高校圖書館、智慧服務(wù)等。各主題詞的高頻詞分析如下:(1)圍繞智慧圖書館的高頻詞主要有云計算、物聯(lián)網(wǎng)、手機圖書館、大數(shù)據(jù)思維、大數(shù)據(jù)平臺、智能+智能生態(tài)系統(tǒng)、大數(shù)據(jù)分析技術(shù)、數(shù)據(jù)安全、總分館服務(wù)體系、功能拓展、實現(xiàn)路徑、用戶需求、圖書館智慧應(yīng)用等;(2)圍繞大數(shù)據(jù)的高頻詞主要有智慧服務(wù)體系、關(guān)聯(lián)主義學(xué)習(xí)理論、服務(wù)模式、Python、圖書館構(gòu)建、個性化服務(wù)、云田智慧云平臺、黨校智慧圖書館、AI、5G、聚類分析、共詞分析、因子分析等;(3)圍繞高校圖書館的高頻詞主要有:智慧校園、智慧閱讀、5G閱讀、Web4.0、圖書館4.0、“雙一流”建設(shè)高校、物聯(lián)網(wǎng)技術(shù)、RFID技術(shù)、云計算技術(shù)、技術(shù)驅(qū)動、功能架構(gòu)等;(4)圍繞圖書館的高頻詞主要有:智慧化服務(wù)、個性化智慧服務(wù)、智慧圖書館體系、大數(shù)據(jù)時代、發(fā)展趨勢、建設(shè)策略、場景化知識推薦、微知識自動問答、圖書館系統(tǒng)、用戶畫像等;(5)圍繞智慧服務(wù)的高頻詞主要有:區(qū)塊鏈、大數(shù)據(jù)環(huán)境、云技術(shù)、智能說、信息融合、nlsp、solomo、信息融合、文獻計量等。
CiteSpace軟件根據(jù)本文在中國知網(wǎng)檢索的648條數(shù)據(jù),還自動生成了一個關(guān)于詞頻高低的排序,見圖3。排在前15位的分別是:智慧圖書館、大數(shù)據(jù)、智慧服務(wù)、高校圖書館、圖書館、人工智能、物聯(lián)網(wǎng)、云計算、高校、大數(shù)據(jù)時代、知識服務(wù)、建設(shè)、“互聯(lián)網(wǎng)+”、智慧化、公共圖書館。通過這些詞頻排行榜,我們可以很容易看出,在大數(shù)據(jù)環(huán)境下智慧圖書館研究的方向所在,為日后學(xué)者開展此方向的研究打下良好基礎(chǔ)。

圖3 研究熱點中關(guān)鍵詞排行榜
在CiteSpace軟件中,點擊Burstness按鈕,再點擊view,可以生成一個關(guān)于大數(shù)據(jù)環(huán)境下智慧圖書館研究的引用次數(shù)最多的詞頻排序,見圖4,可以清晰地看出排在前4位的分別是:物聯(lián)網(wǎng)、云計算、“互聯(lián)網(wǎng)+”、學(xué)科服務(wù)。而且它們有個共同的特點,這4個詞都是從2012年開始凸顯的,這也是隨著大數(shù)據(jù)和智慧圖書館的興起而出現(xiàn)的現(xiàn)象。

圖4 關(guān)鍵詞強度排行榜
數(shù)據(jù)作為信息、知識的基礎(chǔ)性加工材料,它的種類繁多,來源渠道多,如文本、圖像、視頻、機器數(shù)據(jù)等,也可以是結(jié)構(gòu)化、半結(jié)構(gòu)化或非結(jié)構(gòu)化的數(shù)據(jù),不連貫的語法或者語義。
數(shù)據(jù)的數(shù)量龐大,其中充斥著有價值和無價值的數(shù)據(jù),由于它的種類多樣性,使得它的數(shù)量更加龐雜。在數(shù)據(jù)的海洋中挖掘出有用數(shù)據(jù),猶如大海撈針一般,它的價值密度很低。
全世界各個地區(qū)、各行各業(yè)每分鐘每秒鐘都會產(chǎn)生海量數(shù)據(jù),有的是人為數(shù)據(jù),有的是機器數(shù)據(jù)。機器數(shù)據(jù)自動會產(chǎn)生海量數(shù)據(jù),它的增長速度驚人。
數(shù)據(jù)是實時產(chǎn)生就可以利用的,不像信息和知識是在數(shù)據(jù)的基礎(chǔ)上利用人的思維、智慧提取出來的,因此數(shù)據(jù)的時效性非常強,產(chǎn)生之時即可利用。
大數(shù)據(jù)環(huán)境下的智慧圖書館的重點就是大數(shù)據(jù)的利用,機構(gòu)知識庫是根據(jù)各個機構(gòu)自身需求建立的存儲數(shù)據(jù)、信息、知識的地方,可見建立機構(gòu)知識庫對于大數(shù)據(jù)環(huán)境的重要性。機構(gòu)知識庫可以針對每個圖書館不同的特點進行有針對性地建設(shè),宗旨就是將一切圖書館中產(chǎn)生的有利用價值的數(shù)據(jù)全部收錄,當(dāng)用戶需要某項數(shù)據(jù)時,通過檢索該圖書館的機構(gòu)知識庫,可以快速、準(zhǔn)確地查找到所需數(shù)據(jù)的過程。圖書館在建立機構(gòu)知識庫時需要考慮的問題很多,目前全國有圖書館正在建立機構(gòu)知識庫,將數(shù)據(jù)放到機構(gòu)知識庫中,其難點在于怎么樣對這些數(shù)據(jù)進行保護,為哪些人提供哪些數(shù)據(jù)這是值得各個圖書館深思的問題。如果圖書館能將機構(gòu)知識庫做大做好,也能為地方政府提供數(shù)據(jù)支撐,還能為政府乃至國家做出重大決定提供預(yù)測等,同時也能提升圖書館自身的地位[2]。
在大數(shù)據(jù)環(huán)境下,圖書館可以從傳統(tǒng)的“認(rèn)為用戶需要”轉(zhuǎn)變?yōu)椤爸烙脩粜枰保@是依靠大數(shù)據(jù)才能提供的精準(zhǔn)服務(wù),這種智慧服務(wù)比以前人提供的服務(wù)還要讓用戶舒服,讓用戶毫無違和感,這就是好的智慧服務(wù)[3]。建立用戶畫像的過程實質(zhì)是通過收集用戶的特征數(shù)據(jù)、興趣數(shù)據(jù)、行為數(shù)據(jù)等,分析用戶的數(shù)據(jù)信息,將用戶進行分類,再通過數(shù)學(xué)建模預(yù)測用戶喜好和未來的行為。圖書館從一對多變成了一對一類人,隨著用戶畫像技術(shù)的提高,甚至可以達到一對一個人的個性化推送服務(wù),這樣能更有針對性、更精準(zhǔn)地為各類用戶提供服務(wù)。
數(shù)據(jù)素養(yǎng)是在信息素養(yǎng)的基礎(chǔ)上發(fā)展起來的,信息素養(yǎng)是快速獲取、利用信息的能力,數(shù)據(jù)是信息的原材料,因此可見數(shù)據(jù)素養(yǎng)是信息素養(yǎng)的高級模式,比信息素養(yǎng)更復(fù)雜。提高館員的數(shù)據(jù)素養(yǎng),才能為智慧圖書館數(shù)據(jù)管理提供人才,才能更好地將有價值的數(shù)據(jù)從海量數(shù)據(jù)中挖掘出來,更好地為用戶提供高質(zhì)量的數(shù)據(jù)。智慧館員應(yīng)加強專業(yè)知識學(xué)習(xí),可以通過提高學(xué)歷、參加慕課、參加行業(yè)內(nèi)的培訓(xùn)或者利用圖書館豐富資源,培養(yǎng)自己的數(shù)據(jù)意識,提高自己數(shù)據(jù)方面的能力,例如數(shù)據(jù)挖掘、數(shù)據(jù)分析、數(shù)據(jù)可視化、數(shù)據(jù)軟件使用等[4-5]。
在大數(shù)據(jù)環(huán)境下,智慧圖書館雖然面臨技術(shù)和人才的雙重挑戰(zhàn),但大數(shù)據(jù)也給智慧圖書館帶來了新的機遇,通過大數(shù)據(jù)和智慧圖書館熱點分析,可見在大數(shù)據(jù)環(huán)境下智慧圖書館的研究前景非常廣,為智慧圖書館的發(fā)展及用戶服務(wù)帶了很多可能性,讓我們圖書館人在大數(shù)據(jù)環(huán)境下砥礪前行。