張 昕
(中南民族大學 圖書館,湖北 武漢 430074)
大數據的時代已經來臨,大數據戰略也正式上升為我國的國家戰略[1]。大數據技術的顛覆和創新作用幾乎在每個行業都有體現。大數據時代的圖書館也將發生一系列重大的改變,如圖書館將會從圖書的管理者變為信息的提供者,從我們到圖書館去變為圖書館到我們中間來,從按時提供到及時提供,從區域服務到國家服務等等[2]。而圖書館資源建設始終是圖書館的基礎業務,因此在大數據環境下資源建設如何滿足高校讀者的新要求,提升資源建設的質量與服務能力,是目前高校圖書館面臨和需要解決的問題。
圖書館資源建設是圖書館的立業之本,而目前高校圖書館存在著資源建設模式單一、館藏文獻資源利用率逐年下降、文獻資源建設模式落后等問題。
資源建設存在模式單一,標準化程度低、標準體系不科學、不全面、不完善等問題。以中南民族大學圖書館為例,2020年的紙質資源經費為306萬元,其中90%的經費主要依靠采購人員個人挑選,而作為閱讀主體的高校師生薦購圖書只占總經費的10%,造成需求與資源的脫節。電子資源缺乏統一的評估與績效評價標準,導致電子資源建設標準化、科學化程度低。
隨著互聯網技術的發展,讀者對資源需求時效性和對資源獲取便利、快捷性的追求,使讀者的閱讀渠道和閱讀習慣都發生了改變,造成高校圖書館紙質圖書借書總量逐年下降,而電子資源使用績效偏低。
1.2.1 紙質圖書資源的利用率逐年下降。圖1是中南民族大學圖書館2013年—2020年紙質圖書借閱冊數統計圖,從圖1中我們可以清晰地看到,在8年時間里年借閱冊數由2013年的319 557冊下降為2020年的45 042冊,2020年與2013年相比借閱冊數減少274 515冊,下降率為85.9%。

圖1 中南民族大學圖書館2013年—2020年紙質圖書年借閱冊數統計
1.2.2 電子資源使用績效偏低。表1是武漢市5所高校圖書館電子資源經費使用情況的統計表,從表1中我們可以看出除中南民族大學外,其他學校電子資源的篇均下載費用都在1元左右,中南民族大學的費用則超過了2元,可見中南民族大學電子資源成本總體較高,數據庫使用績效偏低。

表1 2020年電子資源經費統計
資源建設工作中,資源的采選模式基本是依據部分數據庫采購人員、決策人員的認知結構、知識體系以及其對學科知識需求的顯性認知來決策,而缺乏對資源的系統、深入、細粒度的知識結構分析以及對不同層次、不同類型讀者信息需求的科學分析與評估,造成文獻資源與海量的讀者需求類型不匹配,資源使用率普遍較低。
目前可利用基于大數據的分析方法來進行圖書館文獻資源建設工作。大數據分析方法具有優化資源建設資金、與教學科研緊密結合以及提供針對性服務的特點。未來可利用大數據的分析優勢來解決館藏資源建設中模式單一、模式落后等問題。
在大數據下圖書館可以根據讀者的借閱記錄、瀏覽痕跡、借閱習慣等,挖掘出他們的閱讀需求,制訂采購策略,如對特色文獻、重點文獻進行重點采購,其他文獻根據采購比例進行差異化的采購等。電子資源的采購可通過學科數據商進行打包購買,對屬于重點學科領域的可以采取單獨購買的模式以達到快速和時效性。這樣在保證圖書館文獻資源建設的學術性、專業性、系統性、完整性的同時也能夠最大限度地滿足讀者需求,有利于節約人力、物力成本,合理配置資金。
在大數據下,充分利用機器學習、深度學習等最新處理技術與挖掘技術發現、跟蹤重點人群、重點團隊,從而發現重點學科研究趨勢和使用周期等,為學院教學、科研團隊提供精準、深層次的知識服務。同時為體現本館特色、呼應學校特點,基于大數據分析結果構建高校特色館藏服務體系,以推動高校教學、研究工作高質量成果的產出,分析助推高校的學科建設。
在大數據下建立信息資源統一檢索平臺,能將分布在互聯網中的各個圖書館的資源融合并整合為一個整體,形成一個可控的、自適應的新型服務體系,通過大數據技術分析、挖掘用戶更深層次的需求,通過整合文獻、讀者、場景知識構建三位一體的文獻資源建設模式,來滿足不同層次和規模的圖書館的需要,實現基于數據的決策、管理和服務創新[3]。
在大數據環境下,高校圖書館應采取有效措施,不斷優化文獻資源建設的策略,以實現圖書館資源建設的科學化、標準化、規范化。
高校圖書館要實現圖書館數據的標準化、規范化,實現全流程的數字化管理,才能更好地為資源建設提供數據資源。目前國家圖書館制定了《國家圖書館數字資源建設條例》《國家圖書館對象數據加工規則(文本、圖像、音頻、視頻)》等規范條例[4]。各高校圖書館可以參考國家圖書館的規范和標準,再結合圖書館的自身實際情況,制定出適合自己的數據標準。同時,應建立圖書館業務數據的規范化存檔、開放制度:制定文件數據存檔的規范,做好文件命名規則;制定數據存檔格式規范要求等,做好數據的存儲和備份。在此基礎上實現數據資源的完整保存和開放共享。
基于圖書館服務場景中所產生的業務數據,實現圖書館文獻資源建設工作的優化與創新。我們可以把紙質圖書采購比例分配為60%通過書商采購,20%采用用戶決策采購模式購買,20%根據院校科研需要針對性購買。①通過書商購買的紙質資源,我們可以通過分析讀者借閱行為、文獻利用情況、出版社、主題分布等大數據統計數據,再結合本校學科結構、館藏特色等,制定出文獻的采購品種、比例和來年的文獻采購計劃。②通過用戶決策采購模式,讀者直接薦購圖書,如果薦購次數或規模達到我們設定的閾值,圖書館就進行購買。③還有20%通過大數據深入分析院系科研需要進行針對性購買。通過大數據分析院系使用、瀏覽行為自動匹配學科分類、學科庫、重點人群、重點團隊學科跟蹤,密切關注他們的科研動態,并主動與他們聯系,重點采購他們所需文獻資源。
電子資源的采購,我們可以根據讀者對圖書館網站、服務平臺的相關數據的采集,利用大數據分析、挖掘等技術,對該數據、下載量等進行分類統計,分析出電子資源的使用頻率、使用量、資源的學科屬性等數據。
大數據環境下,圖書館可以通過用戶畫像、熱門主題追蹤與分析、文獻利用場景分析等創新方法,實現服務模式的創新,如表2所示。

表2 大數據下圖書館文獻資源服務創新方法和模式
3.3.1 基于大數據的用戶畫像。圖書館可對讀者借閱行為數據進行分析從而繪制出讀者畫像,推送適合本人閱讀層次、性格特征的文獻資源,自動構建與用戶需求相匹配的個性化圖書館主頁,讀者的個性化文獻推送、訂閱服務與智能科研助力服務等。
3.3.2 基于大數據的熱門主題追蹤與分析。圖書館可以通過基于大數據的熱門主題追蹤與分析,為讀者提供個性化的新書推薦,還可以對異構文獻進行個性化的聚類,當讀者通過輸入題名、主題詞、責任者、關鍵詞檢索時,圖書館就能為其提供與之相關的異構文獻,滿足讀者全方位的需求。
3.3.3 基于大數據的文獻利用場景分析。圖書館可以通過基于大數據的文獻利用場景分析,為讀者提供嵌入式文獻保障與知識服務。如利用大數據跟蹤了解教師科研情況,在寒暑假期間整理出其學科有深度、廣度的國內外最前沿的學科動態和成果分析,提供紙質文獻和電子資源二次、三次信息文獻的加工成果,最大限度地滿足他們的科研需求。在四六級考試、考研期間利用大數據 分析,根據不同專業特點,為不同層次的學生提供所需求的文獻和輔導信息,做好文獻保障和服務工作。
在大數據環境下,高校圖書館資源建設如何承載教育和信息服務兩大主要職能,從而滿足教學、科研的新需求還有很多課題有待挖掘和深入研究。如大數據資源類型的變化與服務模式、館藏數字資源的科學分類、分級存儲、保護與服務、各類型資源數據庫格式的轉換等等。大家可以對此開展探討、學習和研究,以完善圖書館的服務體系,使之成為一個不斷生長的有機體,以推動我國信息化建設。