【摘要】 本文采用文獻(xiàn)調(diào)查法,利用中國知網(wǎng)學(xué)術(shù)期刊數(shù)據(jù)庫,對(duì)主題詞“大數(shù)據(jù)”“高校圖書館”等進(jìn)行簡(jiǎn)單檢索和布爾邏輯檢索,研究目前大數(shù)據(jù)環(huán)境對(duì)高校圖書館發(fā)展的研究情況,分析高校圖書館大數(shù)據(jù)環(huán)境中的各種類型數(shù)據(jù),為了更好地發(fā)揮這些數(shù)據(jù)優(yōu)勢(shì)來服務(wù)用戶,對(duì)高校圖書館的數(shù)據(jù)管理進(jìn)行優(yōu)化路徑分析。
【關(guān)鍵詞】 大數(shù)據(jù);高校圖書館;數(shù)據(jù)管理;路徑
【DOI編碼】 10.3969/j.issn.1674-4977.2021.01.038
Abstract: In this paper,using the method of literature survey and CNKI academic journal database,the subject words "big data" and "University Library" are simply searched and Boolean logic searched. The current research situation of University Library Development in big data environment is studied,and various types of data in University Library big data environment are analyzed,in order to better play the advantages of these data to serve This paper analyzes the optimization path of university library data management.
Key words: big data;university library;data management;path
最早提出大數(shù)據(jù)時(shí)代到來的是全球知名咨詢公司麥肯錫在2011年5月發(fā)表了一篇報(bào)告《大數(shù)據(jù):創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力的下一個(gè)前沿》,從這一刻起,大數(shù)據(jù)開始備受各行各業(yè)的關(guān)注。圖書館作為保存?zhèn)鬟f人類文化知識(shí)的機(jī)構(gòu),其具有各種豐富的數(shù)據(jù)資源,高校圖書館作為圖書館中的一種,在承載著圖書館屬性的基礎(chǔ)上,自然具有更強(qiáng)的大數(shù)據(jù)環(huán)境,高校圖書館如何能利用這種大數(shù)據(jù)環(huán)境進(jìn)行高效的數(shù)據(jù)管理,從而為全校教學(xué)、科研乃至社會(huì)機(jī)構(gòu)或者國家所服務(wù)是值得思考的問題。
1 大數(shù)據(jù)定義
麥肯錫公司給出的定義:大數(shù)據(jù)是一種規(guī)模大到在獲取、存儲(chǔ)、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合。
目前對(duì)于大數(shù)據(jù)沒有統(tǒng)一的定義,筆者認(rèn)為大數(shù)據(jù)定義可以簡(jiǎn)要概括為海量數(shù)據(jù)+處理辦法,實(shí)際上就是利用先進(jìn)的處理數(shù)據(jù)的辦法,將海量數(shù)據(jù)挖掘出有價(jià)值的數(shù)據(jù),并將這些有利用價(jià)值的數(shù)據(jù)進(jìn)行可視化,還能利用一定的技術(shù)方法存儲(chǔ)這些海量數(shù)據(jù),對(duì)數(shù)據(jù)安全做好防護(hù)等一系列的問題。
2 研究概況
通過檢索中國知網(wǎng)數(shù)據(jù)庫,采用簡(jiǎn)單檢索模式,檢索時(shí)間為2020年7月20日,對(duì)主題詞“大數(shù)據(jù)”進(jìn)行檢索,得到檢索結(jié)果214130條(其中由于2020年僅過去半年多,目前發(fā)文量為18201條,中國知網(wǎng)預(yù)測(cè)2020年整年發(fā)文量可達(dá)到46891條,可以看出仍是持續(xù)走高的趨勢(shì),這里按照知網(wǎng)預(yù)測(cè)發(fā)文量進(jìn)行計(jì)算),可以看出以“大數(shù)據(jù)”為主題的發(fā)文量是從2011年開始增多,直到2016年是持續(xù)增長(zhǎng),在2016到2018年增長(zhǎng)速度有所回落,但從2019年又出現(xiàn)迅猛增長(zhǎng)的趨勢(shì)。通過主題分布,可以得到以主題“大數(shù)據(jù)”為檢索詞進(jìn)行檢索,熱度最高的分別為:大數(shù)據(jù)、大數(shù)據(jù)時(shí)代、大數(shù)據(jù)技術(shù)、crop selection、大數(shù)據(jù)背景下、big data、云計(jì)算、大數(shù)據(jù)分析、數(shù)據(jù)挖掘、人工智能、大數(shù)據(jù)環(huán)境、Hadoop、互聯(lián)網(wǎng)金融、大數(shù)據(jù)平臺(tái)、物聯(lián)網(wǎng)。
在上述檢索結(jié)果中輸入主題詞“圖書館”,得到5370條結(jié)果,筆者又進(jìn)行擴(kuò)檢,采用高級(jí)檢索模式,將主題詞設(shè)為“數(shù)據(jù)”并含“圖書館”進(jìn)行檢索,得到34487條,其中關(guān)于高校圖書館有6730條,占19.51%。可見高校圖書館在大數(shù)據(jù)環(huán)境下,關(guān)于數(shù)據(jù)方面的論文也占有一席之地,具有研究?jī)r(jià)值,其中研究熱度從高到低為:高校圖書館、圖書館、大數(shù)據(jù)、academic libraries,大數(shù)據(jù)時(shí)代、數(shù)據(jù)挖掘、大數(shù)據(jù)環(huán)境、new data、數(shù)據(jù)庫、數(shù)據(jù)挖掘技術(shù)、大數(shù)據(jù)背景下等。
3 高校圖書館中數(shù)據(jù)資源
3.1 資源數(shù)據(jù)
高校圖書館的館藏體系中包含大量的專業(yè)性的紙質(zhì)資源數(shù)據(jù),這些紙質(zhì)資源數(shù)據(jù)隨著時(shí)間的推移,數(shù)量會(huì)越來越多。隨著信息技術(shù)的不斷發(fā)展,數(shù)字圖書館已經(jīng)成為了圖書館中很重要的一個(gè)部分,智慧圖書館也在不斷發(fā)展中,目前的高校圖書館中的資源數(shù)據(jù)不僅包括紙質(zhì)資源數(shù)據(jù),還有大量的數(shù)字?jǐn)?shù)據(jù),而且數(shù)字資源較紙質(zhì)資源相比更新速度快,遠(yuǎn)程可獲取,可以滿足多人同時(shí)使用,因此用戶更加青睞使用數(shù)字化資源。
3.2 環(huán)境數(shù)據(jù)
目前大多數(shù)高校圖書館都具有監(jiān)控設(shè)備,很多圖書館已經(jīng)做到了360度無死角全程監(jiān)控,在這些監(jiān)控設(shè)備中存在大量的監(jiān)控?cái)?shù)據(jù);圖書館保存文獻(xiàn),其空間需要一定條件的溫度和濕度,讀者在自修室學(xué)習(xí)的時(shí)候,對(duì)其室內(nèi)的溫度,照明度都有一定的要求,這些都會(huì)產(chǎn)生大量的數(shù)據(jù);當(dāng)讀者進(jìn)出圖書館時(shí),刷卡通過門禁系統(tǒng),每時(shí)每刻會(huì)產(chǎn)生海量數(shù)據(jù),高校圖書館如果能將這些環(huán)境數(shù)據(jù)管理好,會(huì)為智慧圖書館做出很人性化的數(shù)據(jù)支撐。
3.3 用戶數(shù)據(jù)
高校圖書館中的用戶多為師生,可以說受眾群體比較穩(wěn)定,圖書館的宗旨是全心全意為用戶服務(wù),用戶在享受圖書館提供的服務(wù)過程中會(huì)產(chǎn)生大量的行為數(shù)據(jù),這對(duì)于大數(shù)據(jù)環(huán)境起到至關(guān)重要的作用。用戶在圖書館注冊(cè)制卡的過程中,圖書館可以掌握用戶的身份數(shù)據(jù);當(dāng)用戶發(fā)生圖書借閱行為時(shí),會(huì)產(chǎn)生大量的借閱行為數(shù)據(jù);當(dāng)用戶瀏覽高校圖書館網(wǎng)站,查看推薦書目時(shí)會(huì)產(chǎn)生用戶偏好數(shù)據(jù)等。這些用戶數(shù)據(jù)足以構(gòu)成用戶行為大數(shù)據(jù)環(huán)境,高校圖書館如果能將這些用戶數(shù)據(jù)有效挖掘利用,在大量數(shù)據(jù)的基礎(chǔ)上,通過建立數(shù)學(xué)模型,建立用戶畫像,預(yù)測(cè)用戶行為,從而更有針對(duì)性地為用戶提供精準(zhǔn)化服務(wù)。
3.4 業(yè)務(wù)數(shù)據(jù)
高校圖書館的工作人員在提供服務(wù)的過程中,也會(huì)產(chǎn)生大量的業(yè)務(wù)數(shù)據(jù)。采訪部門在采購紙質(zhì)圖書或者電子圖書時(shí)的數(shù)據(jù);編目部門在加工圖書時(shí)產(chǎn)生的MARC數(shù)據(jù),有條件的圖書館還需要轉(zhuǎn)換成RFID數(shù)據(jù);圖書館服務(wù)器中存在大量的數(shù)據(jù);參考咨詢過程中產(chǎn)生的價(jià)值量很高的數(shù)據(jù);流通部門在流通過程中產(chǎn)生的大量的借還、續(xù)借等數(shù)據(jù);閱讀推廣過程中產(chǎn)生的用戶喜好數(shù)據(jù)等等,這些都是高校圖書館中的數(shù)據(jù)資源,為大數(shù)據(jù)環(huán)境做好了充足準(zhǔn)備。
4 高校圖書館數(shù)據(jù)管理優(yōu)化路徑探析
4.1 館內(nèi)數(shù)據(jù)
4.1.1 建立機(jī)構(gòu)知識(shí)庫
針對(duì)以上梳理出的高校圖書館中存在的大數(shù)據(jù)環(huán)境,可見建立機(jī)構(gòu)知識(shí)庫的重要性,機(jī)構(gòu)知識(shí)庫可以針對(duì)每個(gè)高校不同的特點(diǎn)進(jìn)行有針對(duì)性的建設(shè),宗旨就是將一切高校圖書館中產(chǎn)生的有利用價(jià)值的數(shù)據(jù)全部收錄,當(dāng)用戶需要某項(xiàng)數(shù)據(jù)時(shí),通過檢索該校圖書館的機(jī)構(gòu)知識(shí)庫,可以快捷、方便的查找到所需數(shù)據(jù)的過程。高校圖書館在建立機(jī)構(gòu)知識(shí)庫時(shí)需要考慮的問題很多,其難點(diǎn)在于怎么樣對(duì)這些數(shù)據(jù)進(jìn)行保護(hù),為不同人群提供更有針對(duì)性的數(shù)據(jù),這些是值得各個(gè)高校圖書館深思的問題。
4.1.2 可視化屏幕
對(duì)于大數(shù)據(jù)的有效管理方式就是數(shù)據(jù)的可視化,可視化會(huì)更直觀的看出發(fā)展趨勢(shì)以及問題所在。目前很多高校圖書館針對(duì)用戶的基礎(chǔ)數(shù)據(jù)等方面做了大數(shù)據(jù)可視化展示,但對(duì)于真正意義上的大數(shù)據(jù)管理還有一定差距,例如通過用戶的進(jìn)出館數(shù)據(jù)分析,可以在可視化屏幕上清楚的統(tǒng)計(jì)出實(shí)時(shí)數(shù)據(jù),通過這個(gè)數(shù)據(jù)也能推測(cè)出相同情況下用戶的人數(shù)等數(shù)據(jù),通過用戶借閱圖書信息,也能夠很輕松地預(yù)測(cè)出哪類用戶在什么時(shí)間范圍內(nèi)會(huì)借這類圖書,這些都是高校圖書館通過大數(shù)據(jù)分析,建模成功預(yù)測(cè)的數(shù)據(jù)信息,高校圖書館應(yīng)善于將這些挖掘出的大數(shù)據(jù)體現(xiàn)在可視化屏幕上。
4.2 館外數(shù)據(jù)
高校圖書館隸屬于所在高校,有很多平行部門,要多與其他相關(guān)部門合作,協(xié)助其他部門提供數(shù)據(jù)服務(wù),既讓其他相關(guān)部門了解到高校圖書館提供數(shù)據(jù)服務(wù)的能力,又能提升圖書館在高校中的地位,從而為高校圖書館贏得更多話語權(quán)。
4.2.1 與科研處合作
高校圖書館可以與科研處合作管理全校教師的科研數(shù)據(jù),將全校教師科研成果管理好,也可以將這些科研數(shù)據(jù)放到圖書館的機(jī)構(gòu)知識(shí)庫中,這樣不僅可以使全校教師快速查找、利用所需數(shù)據(jù),還能便于高校分析哪些科研成果可以成為一項(xiàng)特色項(xiàng)目,在大數(shù)據(jù)的環(huán)境下可以敏銳的發(fā)現(xiàn)研究熱點(diǎn)。另外,在日后教育部門填報(bào)數(shù)據(jù)時(shí)也能快速起到數(shù)據(jù)支撐作用。
4.2.2 與教務(wù)處合作
今年的疫情來勢(shì)洶洶,全國上下齊心協(xié)力抗戰(zhàn)病毒,各個(gè)高校都采取了線上教學(xué)模式,從這次疫情可以看到,學(xué)生們的教材出現(xiàn)很大的問題。眾所周知高校圖書館屬于教輔部門,不僅收錄紙質(zhì)版資源,還收錄電子版資源,如果高校圖書館能夠建立電子版教材庫,這將為教學(xué)提供莫大的幫助。就能在疫情期間為師生提供充足的教材保障。對(duì)于各個(gè)專業(yè)電子教材的收集,這些數(shù)據(jù)也是海量的,需要高校圖書館能夠承載這些大數(shù)據(jù)。
4.2.3 與人事處合作
人事處的職責(zé)是統(tǒng)籌全校教職工情況,每年需要進(jìn)行教師職稱評(píng)定情況,高校圖書館可以與人事處合作,建立教師檔案數(shù)據(jù)庫,將教師的相關(guān)數(shù)據(jù)錄入,通過大數(shù)據(jù)分析,也能選班出更適合晉級(jí)的教師,更優(yōu)秀的教師,還通過統(tǒng)籌全校教師數(shù)據(jù)信息,也能為人事處招聘人才提供更精準(zhǔn)的數(shù)據(jù)。
5 結(jié)語
高校圖書館擁有得天獨(dú)厚的數(shù)據(jù)優(yōu)勢(shì),在大數(shù)據(jù)環(huán)境下系統(tǒng)性地管理好產(chǎn)生的數(shù)據(jù)資源, 這些海量數(shù)據(jù)會(huì)讓高校圖書館服務(wù)錦上添花,通過這些數(shù)據(jù)能夠更精準(zhǔn)的定位用戶,幫助預(yù)測(cè)用戶的行為等,還能通過與其他部門合作共同提供數(shù)據(jù),幫助高校圖書館提升自己的地位,高校圖書館在數(shù)據(jù)管理方面還有很遠(yuǎn)的一段路要走,但是目前已經(jīng)可以看見曙光就在前面,讓我們圖書館人砥礪前行。
【參考文獻(xiàn)】
[1] 百度百科.大數(shù)據(jù)[EB/OL].[2020-07-23].https://baike.baidu.com/item/大數(shù)據(jù)/1356941.
[2] 蔡翠紅.國際關(guān)系中的大數(shù)據(jù)變革及其挑戰(zhàn)[J].世界經(jīng)濟(jì)與政治,2014(5):124-160.
[3] 魏來.基于數(shù)據(jù)管理的智慧圖書館功能框架研究[J].數(shù)字圖書館論壇,2018(4):2-7.
[4] 吳秀明,劉云,高凡.大數(shù)據(jù)背景下圖書館閱讀推廣研究綜述[J].四川圖書館學(xué)報(bào),2020(3):97-100.
【作者簡(jiǎn)介】
張雙雙(1988-),女,碩士,研究方向?yàn)閳D書情報(bào)及相關(guān)。