付 博
(國家開放大學,北京 100039)
高校圖書館服務于教學和科研,是典型的“信息中心”,數據是其核心資產。隨著大數據和信息技術的不斷發展,數據治理被引入圖書館界。數據治理是以全局統籌和權責分配為核心,通過對數據及其管理過程的指導監督與評估,做出科學決策,目的是數據價值的最大化。[1][2][3]當前,高校圖書館的系統與資源建設均已發展到一定階段,數據也有相當規模的積累,這些數據能否得到有效治理,數據資產能否被盤活使用,關系著高校圖書館數據價值的發揮,影響著圖書館的服務與應用創新。
本文梳理了目前圖書館界對數據治理的相關研究,通過分析高校圖書館數據治理困難,提出高校圖書館數據治理的參考路徑。
數字與信息時代,圖書館對各種形態數據的管理,已經超過了傳統圖書館員的職責與能力范圍,數據館員應運而生。左志林、李瑞萍梳理了數據館員的發展歷程、組織管理機制和服務模式,為國內數據館員的發展和管理機制研究作出參考。[4]任亞忠指出,目前高校數據館員的缺失,已不能使圖書館適應在大數據環境下的發展,國外已有超半數的圖書館明確了數據館員的職責,并以康奈爾大學數據館員參與項目為例,強調數據館員的嵌入式服務模式已推動圖書館的數據治理活動。[5]顧立平提到,數據館員是為科研數據管理而服務,他是職業生涯的一個發展方向,而不是具體的某個崗位,他可以是數據支持人員、數據管理顧問、項目管理專員甚至是開發人員。[6]周婷、詹慶東強調數據館員需要持之以恒地對各類數據進行監控,因此需提升其數據敏感力、發現數據發展規律和運用數據等能力。[7]
顧立平指出應建立數據治理生態體系,包括:數據獲取、數據共享、數據重用與數據加值四個部分,指出圖書館可以通過知識服務、學術研究、開展培訓、開展合作等方式來推進數據治理。[6]周婷、詹慶東將數據治理引入高校圖書館聯盟,從環境與文化、技術與工具和流程與活動3個方面分析其可行性,并以福建省高校數字圖書館(FULink)為例,從組織、技術、系統3個方面提出了數據治理策略。[7]包冬梅、范穎捷等針對高校圖書館的行業特點,在國際權威機構建立的框架基礎上提出了CaLib數據治理框架,包括實施評估、范圍促成和因素3個子框架。[3]
在科研方面,孫仙閣、弓箭從開放科學角度分析了數據治理在科研過程中的3方面應用,即輔助科研人員制定數據管理計劃、輔助館員開展信息咨詢和數據管理以及進行數據治理培訓,并在形成數據治理共同體、強化數據質量評價、提升數據服務能力3個方面提出了建議。[8]王舒波從科研角度出發,分析了在開放科學背景下數據治理與高校圖書館之間的關系,提出了科研數據的治理路徑,依次為頂層設計、權責落實和技術助力。[9]在知識管理中,劉潔璇分析了大數據、知識管理、數據治理之間的關系,指明了數據治理是圖書館知識管理的基礎和強化,論述了圖書館在MARC標準著錄與DC元數據標準控制、知識發現、知識可視化、知識安全控制中的實施。[10]
任亞忠指出數據館員的培養和發展是未來圖書館數據治理的重點之一。[2]顧立平指出在數據治理培訓、制定數據治理計劃、建立數據治理生態、數據治理的法律及道德問題方面均大有可為。[3]劉潔璇分析了在未來數據治理的發展中,全球合作、政府主導、多學科試點將是幾大發展方向。[8]
數據治理是一種從上至下的體系性建設,上至決策層,下至基層工作人員,都需要樹立數據治理的觀念,進行科學決策和高效管理,在戰略上對數據治理提高重視,在組織機構中給與支持,在人才方面著重培養。目前,在高校圖書館界,大多數相關人員對數據治理的認識尚且不足,沒有樹立數據治理的意識,對于其戰略規劃及相應的組織架構、相關專業人才培養都準備不足。同時,大多數研究都還處在理論探索當中,缺乏相關實踐,沒有形成數據治理的環境和氛圍。
大數據的快速發展,已使數據成為最有價值的資產。圖書館作為各種信息的匯集地,數據海量生成,高速流轉,再加上伴隨信息技術發展而涌現出的多種多樣的載體、格式、類型,加劇了圖書館資源數據和業務數據的復雜性。而由數據復雜性引發的信息系統零散與標準不一致、數據統計與評估難度大、引入開放資源困難多、無法進行知識管理等,已經嚴重影響數據價值的挖掘,數據金礦有待開發。
目前,多數高校圖書館數據治理意識尚且不足,治理工作還屬起步階段,相關實踐不多且不夠深入,無法提供過多的可借鑒經驗。因此,高校圖書館要盡快培養“數據敏感”狀態,營造數據治理環境和氛圍,在頂層設計中就深刻認識到數據治理的價值所在,從思想源頭上重視數據治理,強化治理意識。
圖書館數據治理是個大工程,需要各個部門統籌協調,分工合作,自上而下來進行。從體制機制建設、權力責任分配到人才儲備培養,都需要一系列的政策和規則,來確保數據治理的穩步推進。通過政策上的支持,協調跨部門合作,把數據治理放在圖書館工作的核心位置。
數據標準是各方就共用的業務術語進行定義,還包括這些術語的命名、描述、數據存儲、數據交換以及信息共享規則等。[11]高校圖書館在進行數據治理時,可以先參考國家某些相關標準,來制定適合自身的、科學嚴謹的數據治理標準,按照標準進行數據管理和系統設計,增強數據的一致性和準確性。
高校圖書館數據規模龐大,類型復雜多樣,需要把重心落在整合現有數據中?;谝阎贫ǖ臉藴剩胄录夹g新工具,構建數據整合平臺,消除無序無效數據,減少重復閑置數據,提升檢索效率,提高共享水平,積極充分發揮圖書館技術優勢,營造操作便捷、高效高質的用戶使用環境。
高校圖書館在滿足傳統服務需求的同時,也要在數字時代為師生提供個性化服務,其背后需要強大的數據支撐。通過數據治理,學校能夠優化數據質量,提升數據安全,更加快速準確進行數據分析,更加精準獲取師生需求,進而有效提高教學服務水平,開展更多、更廣泛的創新應用。
數據治理的最終目標是深入挖掘數據潛力,發揮其最大價值。因此需要設立評估指標,建立相應的評估模型,結合自身特點,多角度多方面進行數據治理結果的評估工作。借助相關工具和技術手段,結合事先制定的規范與數據標準,通過及時評估來促進數據質量提升,提高管控能力,降低治理風險。
長久以來,數據始終是高校圖書館的生命線,數字化信息化的發展,讓圖書館擁有了更多數據,也使數據成為了無比重要的資產,將其價值最大化成為了首要目標。目前高校圖書館正處于從量變到質變的變革當中,應樹立數據治理理念,結合具體需求,對數據資產進行有效的優化整合,在戰略目標指引下,在政策保障、技術輔助與及時評估中,穩步推進數據治理工作,確保數據的高質量和可用性,提高數據創新利用水平,為師生提供更優質的服務體驗。