
收稿日期:2024-03-11
作者簡介:苑紅梅(1992—" ),沈陽理工大學圖書館館員。
摘" 要:我國智慧圖書館在相關戰略部署和頂層設計規劃下,呈現出多元參與、融合發展、多方聯動的特點。文章在梳理智慧圖書館數據體系的基礎上,將智慧圖書館數據劃分為業務數據、用戶數據、資源數據三大類,運用數據生命周期理論對智慧圖書館數據進行了流程分析,構建了智慧圖書館數據管理模式和數據服務模式。
關鍵詞:智慧圖書館;數據生命周期;數據管理;數據服務
中圖分類號:G250""" 文獻標識碼:A""" 文章編號:1003-1588(2024)04-0074-04
1" 背景
以人工智能技術為核心的新一代信息技術的發展,對社會生產生活的各個領域產生了深遠影響,國家針對新一代信息技術的應用也作出一系列戰略部署。在此背景下,圖書館事業迎來重大變革。《關于推動公共文化服務質量發展的意見》指出,相關部門要加強智慧圖書館體系建設,建立覆蓋全國的圖書館智慧服務和管理架構。在國家戰略部署的推動下,針對智慧圖書館的研究主要集中在以下四個方面:一是智慧圖書館建設路徑與服務體系建設方面的理論研究,如:張翀等探究了智慧圖書館的研究現狀和發展路徑[1];江山以智慧場景、智慧規范、智慧平臺和智慧服務為智慧圖書館的主要要素,對智慧圖書館建設階段與現狀進行了分析研究[2];李彩寧等基于用戶—資源的二元視角構建了智慧圖書館服務模式[3]。二是智慧圖書館轉型方面的研究,在政策環境變化和服務理念革新的背景下,智慧圖書館在資源建設、業務流程、服務體系與服務場景等方面的變化,如:邵波等從智慧圖書館業務重組與數據管理兩個方面提出了規劃建議[4],田麗梅針對高校圖書館的智慧化轉型進行了研究[5]。三是數字孿生、數字人文、區塊鏈、元宇宙等技術在智慧圖書館建設中的應用研究,如:許鑫等將數字孿生技術運用到智慧圖書館業務中,制訂了智慧圖書館業務融合方案[6];傅愛雯等對元宇宙視角下圖書館多層交互的內外循環發展機制進行了研究[7]。四是智慧圖書館空間建設方面的研究,如:劉煒等從智慧圖書館實體空間、主題空間、知識空間建設等方面提出了智慧空間建設的目標和愿景[8]。智慧圖書館在新一代人工智能技術的加持下,注重主體與客體的交互,資源建設重心由紙質館藏建設向嵌入用戶需求的信息資源建設轉變,利用大數據技術對用戶的閱讀行為和偏好進行分析,主動為其提供精準的信息服務。
2" 理論基礎
2.1" 數據生命周期理論
數據生命周期理論是將生命科學術語生命周期運用到數據運行邏輯中,總結數據從產生、收集、分析利用到歸檔再利用的循環過程中的規律。數據生命周期理論起源于科研生命周期,科研生命周期是對科學研究過程中產生的數據進行收集、整理、分析利用和共建共享。數據生命周期理論能夠幫助科研工作者利用和管理數據資源,將不同層級的數據映射到科研活動的相應環節。智慧圖書館的數據產生與發展規律與科研活動的運行軌跡在邏輯上具有一致性。數據生命周期理論的應用基礎是構建數據生命周期模型。目前,國內外相關協會和高校學者根據數據生命周期的特點構建了多種生命周期模型。英國數據管理中心構建的DCC(Digital Curation Center)模型,根據科研過程中應用的數據層級和邏輯關系將數據生命周期劃分為數據描述、保存計劃、活動參與、數據管理和存儲,主要包括數據的獲取、評價、選擇、傳輸、存儲、再利用和轉換。美國國家自然科學基金會針對環境科學、地質監測等數據量較大的學科構建的DataONE(DataONE Date Lifecycle)數據周期模型,詳細闡述了數據管理計劃及數據收集、確認、描述、保存及數據發現、整合和分析的過程。
2.2" 智慧圖書館數據體系
智慧圖書館是在物聯網和人工智能技術應用的基礎上,整合多種資源形式,以知識服務為核心,打造不受物理空間限制的、具有交互性的圖書館網絡,是由實體空間與數字虛擬空間結合構成的多維知識空間,其最終目標是提供智慧服務,實現信息增值。智慧圖書館是基于感知功能的服務系統,能夠主動為用戶提供具有針對性、個性化的信息服務。智慧圖書館通過從用戶需求數據中提取有價值的信息,構建用戶畫像,并應用神經網絡和機器學習等技術對用戶畫像進行不斷優化,從優化的服務中獲取新一輪數據,以實現數據互聯、融合、優化、再利用。
2.2.1" 智慧圖書館數據分類與特征。智慧圖書館在運行過程中會產生海量數據,筆者按照數據主體的不同,將智慧圖書館數據體系分解為以圖書館為主體的業務數據、以信息資源為主體的資源數據和以用戶為主體的用戶數據。圖書館業務數據是圖書館日常開展業務工作產生的數據,主要包括采訪數據、編目數據、流通數據(借還數據、文獻傳遞)、室內監測數據、空間數據、咨詢數據、閱讀推廣等活動數據、財務人事數據等,這類數據與時間節點密切相關,具有周期性,通過比對分析一定周期內的數據,能為活動策劃、制度制定提供參考。資源數據主要是圖書館為用戶提供的信息資源及其描述型元數據,包括紙質資源數據、電子資源數據、資源描述型元數據、機構知識庫、特色館藏、開放獲取資源、科學研究數據等。智慧圖書館具有資源整合能力,能夠充分利用開放獲取的資源和網絡資源,補充本機構的信息資源,此類資源對智慧圖書館的資源整合能力提出更高要求,因此,智慧圖書館需要建設資源管理云平臺,利用云端對不同類型、來源的資源進行整理、存儲、管理。用戶數據主要包括用戶基本信息和行為數據,智慧圖書館通過分析用戶數據,能夠獲取用戶的閱讀偏好,為其制定服務策略提供支撐。智慧圖書館數據體系中的各部分是相互影響、相互作用的,高度的交互性是智慧圖書館的核心特征之一。智慧圖書館可對常規業務數據進行統計分析,深度挖掘業務數據與用戶行為信息的關聯,總結用戶的資源利用規律。總而言之,智慧圖書館的“智慧”之處在于從數據的關聯網絡中提取有效信息,預測用戶行為,制定科學的服務策略。
2.2.2" 智慧圖書館數據服務。大數據、云計算等新一代信息技術的應用不僅在技術應用層面影響學術研究,還在思維模式和研究方法層面革新整個學術生態鏈,科學研究中的數據分析和數據應用占據越來越重要的位置。高校圖書館作為科學研究的輔助機構,為研究者提供相關數據集和數據分析方法是重要的服務方向。哈佛大學圖書館的數據管理工具DOMTool,能夠按照用戶的專業需求和基金情況制訂數據管理計劃;邁阿密大學圖書館提供全面覆蓋科研活動全過程的數據分析服務,數據分析服務包括定量和定性兩種方法,定量分析包含統計分析法、數據模型的應用及有效性檢驗,定性分析包括文本分析、數字人文的方法及可視化分析,提供ArcGIS Online、ArcMAP、SPSS、SAS、Python等多種可視化數據分析軟件的使用指南。高校機構知識庫收集了本機構科研人員的學術創新成果,能夠為科研人員提供學術成果信息和分析報告,如:北京大學機構知識庫收集整理了自1949年以來北京大學教師和學者的學術成果,共計67萬余條元數據信息,并實時更新熱門學術內容,用戶可按主題、學科、題名、作者等字段檢索數據。
2.2.3" 智慧圖書館數據生命周期流程分析。筆者根據DCC模型、DataONE模型及其他數據生命周期相關研究,結合智慧圖書館數據體系中各層級數據類型特點,按照數據產生與采集、數據描述、數據存儲、數據分析、數據利用、數據服務與評價六個階段對智慧圖書館數據體系進行生命周期流程分析,如下頁表1所示。
3" 智慧圖書館數據管理模式
智慧圖書館數據體系呈數據量大、數據來源復雜、數據載體形式多樣等特點,數據存儲、統計分析、智能計算、虛擬仿真等都要求智慧圖書館擁有強大的數據管理能力,建設智慧圖書館數據管理平臺是滿足以上管理需求的有效手段。目前,眾多高校和科研機構已經開始建立數據管理平臺,分為兩個層級推動本機構數據管理工作的高效開展。第一層級對接智慧圖書館,運用微服務技術框架對圖書館業務進行重構和簡化,將傳統的集成化管理簡化為以不同資源類型和需求為導向的資源服務;運用中央知識庫實現圖書館紙電資源一體化管理,并整合網絡資源、開放獲取資源等不同來源的信息資源,建立統一的元數據管理平臺,為科研活動和學科建設提供資源支撐;結合用戶偏好,為其提供具有針對性、個性化的智慧服務。第二層級對接科研數據,智慧圖書館的內在邏輯符合第四范式數據密集型科學的研究規律,提供有科研價值的數據是智慧圖書館作為數據管理機構的工作重點。科研數據管理貫穿整個科研生命周期,包括科研主題的行業動態、數據獲取、規范存儲、數據挖掘、智能計算、數據導航、個性化定制、數據共享和再利用。
4" 智慧圖書館數據服務
數據服務是隨著第四范式相關科學研究的興起而產生的服務需求,在智慧圖書館運用大數據提供多樣化服務的同時,用戶也在資源利用和科學研究等方面產生了更多需求。筆者從教學、科研和學科三個維度對智慧圖書館數據服務進行了分析。高校教學活動內容包括大量教參資料數據庫、數據模型、案例分析、統計圖表、社會調查等數據,圖書館對案例數據庫、開放數據平臺、統計分析平臺、信息素養數據庫等進行整合利用,能夠更好地幫助教師規劃教學內容,助力課堂教學。例如,復旦大學圖書館打造的教材教參平臺,其外教中心電子教材平臺為全國12家外國教材中心提供服務,共引進近8,000種原版教材教參,涉及理、工、農、醫、管理等學科,教材教參數量不定期更新。與教學活動的知識型數據需求相比,科研活動的數據需求側重于事實性數據。北京大學開放研究數據平臺提供社會科學、計算機與信息科學等學科的開放數據集,北京大學中國調查數據資料庫(China Survey Data Archive,簡稱CSDA)收錄整合了我國優質的調查科研數據資源,通過專業的數據管理與監護,實現了便捷的數據共享,為科學研究和決策管理提供了高水平的數據服務。學科建設是高校教育工作的重點內容,學科態勢發展和競爭力分析是學科建設和發展參考的重要內容,高校圖書館可根據學校的實際發展情況對學科發展進行評估,為學科發展提供數據支撐。例如,武漢大學圖書館學科服務平臺實時更新重點學科的學術動態,對熱門專題、科研基金項目及CNS(美國Cell、英國Nature及美國Science三大科技期刊)論文進行定期報道,并運用分析評價工具,從科研論文、高端人才、科研項目、科研獲獎、學科聲譽、機構概況等維度,對學校、學院、學科的學術競爭力和科研績效進行綜合分析與客觀評價,以把握學科發展動態和機構發展水平,為用戶提供決策支持服務。
5" 結語
截至2023年3月,中國高校機構知識庫聯盟已有51家會員機構,元數據總量達到2,868,428條,以大數據、區塊鏈、人工智能等為代表的新一代信息技術的強大支撐,提高了信息資源系統的數據處理能力。數據成為一種戰略資源,數據處理與分析利用水平對科研事業和經濟發展的影響也越來越大。智慧圖書館服務的數據化既有內在動力,也有外部技術條件支撐,運用數據生命周期理論對智慧圖書館數據體系進行流程分析,能夠全方面解構智慧圖書館運行中的業務數據、資源數據、用戶數據,為智慧圖書館的發展提供路徑支持。
參考文獻:
[1]" 張翀,于興尚,郭暢,等.智慧圖書館研究范式和服務路徑探析[J].圖書館,2021(11):30-37.
[2]" 江山.智慧圖書館要素研究及建設思考[J].圖書館工作與研究,2022(2):58-63.
[3]" 李彩寧,畢新華,陳立軍.智慧圖書館服務模式及平臺構建研究[J].圖書館,2018(12):1-7.
[4]" 邵波,單軫,王怡.新一代服務平臺環境下的智慧圖書館建設:業務重組與數據管理[J].中國圖書館學報,2020(2):27-37.
[5]" 田麗梅.基于環境掃描的“十四五”時期高校圖書館智慧轉型探索[J].圖書館工作與研究,2021(10):30-37.
[6]" 許鑫,蘭昕蕾,鄧璐薌.數字孿生視閾下智慧圖書館業務融合研究[J].大學圖書館學報,2022(2):59-66.
[7]" 傅愛雯,邵波.元宇宙視域下圖書館多層交互的內外循環機制[J].圖書館論壇,2023(10):117-125.
[8]" 劉煒,趙冬梅.圖書館智慧空間建設:概念、演變、評價與設計[J].圖書情報工作,2022(1):122-130.
(編校:孫新梅)