張馳 徐曉峰
摘 要:大數據在高校圖書館管理與服務中的運用日趨廣泛,提升了圖書館管理與服務效率。但大數據服務對象的針對性、數據采集及更新的時效性、數據分析的準確性仍存在一些問題。本文分析高校圖書館數據類型及特點,提出大數據技術是實現圖書館精準、及時、高效服務的有力技術手段。從個性化的讀者管理、基于需求的資源管理、共建共享的數據管理等方面深入探討了大數據背景下高校圖書館管理與服務創新。
關鍵詞:大數據;高校圖書館;服務;管理
一、大數據發展的背景
最早提出大數據時代到來的是全球知名咨詢公司麥肯錫在2011年5月發表了一篇報告《大數據:創新、競爭和生產力的下一個前沿》,從這一刻起,大數據開始備受各行各業的關注。
麥肯錫提出:“數據,已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。人們對于海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來。”
雖然目前對大數據沒有統一定義,但學者普遍認可大數據的核心意義不在于對龐大數據進行收集,而在于利用先進的科學技術,對海量數據進行存儲、分析、可視化、挖掘等形成新的有價值的信息資源。基于大數據支持的信息資源管理具有存儲空間大、結構完善、處理效率高以及相對真實可靠等優勢,以多元化數據集合為基礎,借由對最新信息數據及其價值分析,可以從中獲得更多價值,進而再根據實際價值進行科學而合理的創造性應用。大數據正引領著時代的變革,改變著人們的思維慣例,對人類認知與相互間的交流提出了新的挑戰。
隨著大數據技術推廣應用,圖書館在多個維度逐漸引入大數據。圖書館作為人類社會文化傳承的核心機構,數據種類豐富且資源量龐大,涵蓋社會各個學科。面對社會日益增長、多元化的知識需求,高校圖書館要想與時俱進實現創新式發展,就必須發揮自身資源優勢。高校圖書館具有得天獨厚的大數據環境,探索與研究大數據,建立知識服務中心,為實現高校圖書館可持續發展帶來機遇與挑戰。因此,高校圖書館如何合理利用大數據進行開發與應用,為高校教學、科研助力,為社會團體、機構及國家服務是值得思考的問題。
二、高校圖書館大數據資源
1.高校圖書館的數據類型
高校圖書館的數據類型包括館藏數據、讀者數據、日常業務數據及管理數據等。
館藏數據在類型上包括紙質資源數據、電子資源數據、特種資源數據。在其內容上包括資源本身的結構化數據、資源的文摘數據和全文數據等;讀者數據包括讀者身份數據及讀者行為數據,讀者身份數據記錄讀者專業、學歷、年齡等信息。讀者行為數據是讀者在使用圖書館資源及服務的過程中所產生的行為數據,包括入館時間、活動區域等活動行為,紙質文獻的借閱、電子文獻的訪問下載、信息咨詢等資源活動行為;日常業務數據包括資源采編典藏數據、借閱數據,信息情報業務中產生的文獻收錄、引用等數據信息,自建數據庫,如機構庫等;管理數據是在圖書館服務過程中所產生的各類數據,包括資產數據、財務數據、人事數據、管理數據等。
2.高校圖書館的數據特點
高校圖書館數據具有以下三個特點。
(1)數據量大,增長速度快。高校圖書館擁有大量的文獻信息資源數據、讀者基礎數據、讀者行為數據、信息系統業務數據、信息系統日志數據、管理數據等。加上信息網絡的不斷深化,高校圖書館新一輪建設的開展,促使圖書館數據流加快,進一步提高了圖書館各類數據的生成速度。
(2)數據類型多樣。圖書館既有結構化數據,也有如日志文件、XML文件等半結構化數據,還有大量的文本文件、多媒體文件等非結構化數據。因此,圖書館數據具有形式各異,結構不同的特點。
(3)共享需求強烈。圖書館數據雖然產生于不同部門,但隨著圖書館個性化服務的發展及部門合作的加強,單一數據來源不足以滿足當下圖書館發展需求,因此,圖書館服務的發展必須依賴數據共享,數據共享需求日益增加。
三、大數據背景下高校圖書館管理與服務創新
阮岡納贊于1931年提出了圖書館學五定律:“所有圖書都是為了用,每個讀者都有他所需要的書,每本書都有它的讀者,節省讀者的時間,圖書館是一個成長的有機體。”它充分體現了圖書館職責所在。隨著圖書館的發展,圖書館不再僅僅是為讀者提供書,而更多是為讀者提供信息資源服務,圖書館的職責是滿足讀者需求,提高資源利用。在大數據高速發展的今天,圖書館是數據的產生者,也應該成為數據的獲益者。圖書館與大數據技術融合,大數據技術將為圖書館實現精準、及時、高效的服務提供有效技術手段,為圖書館實現“為資源找好的讀者,為讀者找好的服務”的目標提供有力的技術保障。
1.個性化的讀者管理
從服務對象看,高校圖書館一方面是面向學生、老師等個人讀者,另一方面也是面對課題組、院系乃至學校各機構;從服務內容看,除了傳統的文獻資源服務外,還包括信息素養教育、科技情報服務等;從服務模式看,隨著讀者需求不同,圖書館的服務也逐步個性化,由傳統的線下服務,發展到網絡新媒體服務。利用大數據技術,高校圖書館可實現對讀者的個性化管理與服務。
(1)以需求為驅動的資源推介
當前階段,讀者個性化文獻資源需求日益明顯,對圖書館資源推薦的精準性和有效性提出了更高要求。讀者的借閱歷史記錄能很好地反映讀者偏好,因此,圖書館可以多維度地分析讀者借閱數據,對讀者借閱數據進行信息挖掘,在此基礎上開展個性化推薦服務。
一方面,對讀者進行分類,建立讀者關聯。根據讀者的專業背景、興趣愛好、歷史記錄等,由數據聚類設立標簽,通過標簽匹配將讀者分為不同組,把館藏資源信息推送給特定群體,為不同的圖書館讀者群組提供有針對性和個性化的服務。同時,組內讀者可以分享他們的閱讀感受以及相互推薦圖書,既提高了讀者的閱讀體驗,也有效地利用了圖書館資源。
另一方面,分析讀者歷史數據,挖掘潛在需求。讀者在每次使用圖書館資源或服務時都會產生大量的歷史數據,包括瀏覽記錄、咨詢記錄、借閱記錄等。充分分析歷史數據,可以更好地了解讀者的潛在需求,能更有針對性地為讀者推送服務。比如,讀者經常借閱某一類書籍,圖書館可以主動推送該類別的新書;讀者經常訪問某一數據庫,圖書館可以及時推送數據庫使用培訓信息等。
圖書館還需要規范數據的采集、過濾及清洗規則,設計標簽內容,分解每個讀者的具體需求,將讀者需求融入每個服務模塊中,使讀者需求與圖書館資源深度融合,并制定數據推薦標準,建立個性化的推薦模式,滿足讀者不同需求,從而實現個性化、精準化的推薦服務,提升文獻資源推薦服務的精細化程度。
(2)完善學科建設
圖書館除了面向個體讀者服務外,還肩負著學校學科資源建設、學科發展建議等職責。圖書館利用大數據技術開展學科服務時,需要兼顧學科建設的形式及內容。
首先,圖書館應從學校學科頂層構架著手,建設全方位的學科體系框架,對學科服務方式及內容有針對性的定位,自上而下地建立起一套有層次的學科服務導航平臺,將圖書館收集的大數據信息與學科服務導航平臺對接。通過對大數據進行可視化分析、神經網絡分析等手段,揭示各學科研究的熱點;通過數據流聚類算法分析,尋找學科之間的關聯,構建學科知識網絡或者機構知識庫,助力學校的科研工作,為學校各學科的建設提供一定的參考依據。當下,科研數據的管理也為圖書館數據創新服務提供新的發展方向。
其次,圖書館要與各學科帶頭人或科研團隊負責人建立良好的溝通關系,通過大數據采集將目標用戶身份數據、行為數據(包括科研數據、參與會議及培訓數據、借閱數據等)及資源數據建立連接,通過對數據的篩選與挖掘,揭示同一學科專業對文獻資源的需求,及時豐富學科文獻資源。建立學者研究數據庫,為其科研團隊及學科發展提供更全面的數據資源。
最后,圖書館結合學校優勢學科及特色專業,可建立特色資源數據庫,為學校特色學科服務。在服務形式上可以通過具有個性化的形式來拓展學科服務。比如:結合新媒體開展慕課教學,針對學校優勢學科、特色學科,借助5G、VR技術開展真人圖書館活動,既豐富了學科服務內容,也讓學科服務呈現出雙向互動,而不是圖書館單向地為某個學科服務。在開展活動的同時,也產生了新的用戶行為元數據,供采集、篩選、挖掘,利用這些大數據,圖書館可持續為用戶提供更具學科特色的服務。
(3)加強讀者交互體驗
讀者是圖書館的服務對象,也可以說是圖書館的用戶,讀者體驗也可借用“用戶體驗”的概念。用戶體驗是用戶在獲取與利用信息產品(服務)過程中建立起來的一種純主觀的心理感受。它包含用戶感官體驗、情感體驗和交互體驗。因此,圖書館作為提供信息資源服務的機構,滿足讀者需求服務是圖書館的立館之本,讀者滿意的服務體驗是圖書館工作的方向。讀者體驗主要是來自讀者和圖書館的交互過程,良好的讀者體驗,應該是讀者從被動接受服務內容逐漸轉變為主動參與服務體驗。
從環境方面,圖書館可以根據環境數據挖掘,將圖書館館舍環境進行適當調整優化,更加符合讀者使用需求,獲得更好的體驗。比如,根據讀者流向分布,適當調整館舍布局;根據讀者對環境光線、溫度等環境數據的分析,適當調節圖書館相關數據設置,更加適合更多讀者的使用習慣,提高讀者的舒適度。
從資源使用方面,圖書館要突顯個性化服務,增強讀者參與感及滿意感。比如,提升圖書館主頁的讀者體驗感,可以自由選擇感興趣的服務模塊作為常用模塊,同時增加交互功能;完善個性化的推送服務,通過用戶行為大數據分析,推送相關數據資源、培訓信息等,讓讀者能高效地利用圖書館資源。
2.基于需求的資源管理
隨著信息化的高速發展,各產業產生了大量半結構化及非結構化數據,大數據挖掘技術為決策的制定提供依據。在圖書館日常服務中,會產生大量的數據信息。如果將讀者借閱數據進行加工、分析、挖掘,將產生有助于圖書館文獻資源采購決策的信息。由此,讀者決策采購(PDA)模式孕育而生,成為圖書館文獻資源建設的一種新模式。PDA模式以讀者需求為中心,將讀者作為文獻資源采購的主要決策者。圖書館根據本館文獻資源建設規劃、學科建設規劃、經費情況等,綜合各項指標加權量化,設定采購的臨界值作為輔助決策。當讀者需求量化值達到設定的域值時,且不超過采購臨界值,將觸發圖書的購買決策。PDA模式將讀者融入圖書館文獻資源建設中。因此,高校在圖書館文獻資源建設上要十分重視大數據,不斷了解掌握大數據技術,使大數據在圖書館文獻資源建設中扮演越來越重要的角色。圖書館運行除了需要文獻資源之外,物資資源也是必不可少的,是保證圖書館正常運行的必需資源。從辦公桌椅、閱覽位、書架、電子設備,小到辦公文具都是圖書館物資組成。通常,圖書館都是有需求才采購,采購不及時,需求整理耗時耗力,成本較高。大數據技術的發展,可以通過數據分析預測需求,提前做到統一采購,不僅能提高采購效率,還能節省采購成本。
3.共建共享的數據管理
圖書館數據具有數量大、更新快、結構多樣等特點,如果數據不統一收集整理,就會分散在各個不同系統中,數據使用性能低,獲取性差,數據之間的關聯性低,使得數據就僅僅是數據,不能轉變為有用的信息。大數據是個開放平臺,對圖書館系統中產生的大量、碎片化的數據可以高效地進行快速分類整理,以人性化的服務方式,滿足圖書館及讀者對數據的檢索需求、服務需求及決策需求。同時,大數據平臺可以跨平臺將異構數據進行統一加工處理,根據用戶的預設條件,可以從不同的維度來分析、處理數據,從而解決圖書館多樣化的數據需求,提升圖書館數據資源使用效率及管理效率。
當然,圖書館要利用大數據技術實現數據的共建共享,事先必須制定一系列規范。圖書館要從數據收集著手,從全局角度考慮制定相應的數據采集規則,包括數據格式、數據內容、數據采集頻率、數據來源等,做好數據存儲,為數據的共建共享做好準備。在數據采集的基礎上,根據圖書館不同的服務模塊結合讀者需求設置處理機制,對不同類型的數據進行融合、聚類,用可視化或別的形式展現數據關聯,為數據使用奠定基礎。數據收集及處理,都是為了能更好地使用數據,揭示信息,而數據的使用又涉及諸多問題,如誰用數據、如何使用、如何保障數據安全等。因此,在完成好數據采集及處理的基礎上,圖書館需要擬定法則,從人員、使用規則、數據保護等方面進行規范,保證數據能合規使用。
近幾年,高校圖書館已經陸續開展了數據共建共享工作,例如:統一檢索平臺,將多個數據庫的題錄信息進行采集、加工、存儲,在一個統一的檢索平臺上實現跨庫檢索多個數據庫的信息資源;機構知識庫,將學校師生科研成果進行采集整理,能在機構庫中展示師生的科研成果,并能基于大數據平臺對機構庫內的數據進行多維度的統計分析,為科研方向提供決策支持;特色庫,根據各院校自身學科特點,構建具有學科特色的資源庫,方便師生使用特色資源。
四、結語
在大數據視域下,高校圖書館管理與服務獲得了新的發展契機和方向。將大數據技術引入圖書館各項服務中,完善數據采集、處理及使用的各項規則及應用,使得圖書館數據能相互融合,實現數據的共建共享,為讀者提供精準、個性化的服務,進一步提升圖書館管理效率及服務水平。
參考文獻:
[1]張雙雙.高校圖書館數據管理的優化路徑[J].品牌與標準化,2021
[2]王 磊,朱玉玲.大數據背景下的法院執行難問題化解路徑[J].陜西行政學院學報,2018
[3]葉淑然.大數據環境下高校圖書館的信息資源建設策略[J].蘭臺內外,2021
(作者單位:1.華中科技大學圖書館;
2.武漢體育學院圖書館)