朱子覺
摘要:隨著信息技術的發展,大數據時代已經到來,數據具有重要的戰略意義。大數據時代的信息資源具有數量巨大、內容豐富、信息來源廣泛、無控制性、動態性與交互性并存、增值價值等特點。大數據將對圖書館發生重大影響。大數據時代,擁有各種類型、各種格式、有價值、低成本的數據是圖書館數字資源建設的重要基礎目標。
關鍵詞:大數據思維;圖書館數字資源建設;利用研究
1導言
物聯網、移動通訊技術的快速發展,為網絡用戶獲取發布數據信息提供了便利,而無處不在的智能化終端的應用,也在每時每刻產生大量數據。根據全球互聯網數據中心的監測,非結構化網絡數據正以每年不低于55%的速度增加,標志著我們已經進入大數據時代。數據是圖書館開展各項服務的基礎,在提供信息和資源服務的過程中,圖書館也在不斷產生各類數據。大數據時代顛覆了人們的思維和學習方式,改變了以往以小數據為核心解決問題的典型模式,變為通過對海量數據對應關系的深入分析,迅速提取有價值信息的思維模式。
2大數據時代圖書館數字資源建設面臨的挑戰
2.1缺乏完善的資金投入結構
我國圖書館在資源建設方面主要依靠政府撥款,部分依靠社會資金投入,籌措資金的渠道相對單一。大數據時代圖書館的數字資源建設,尤其是對海量異構分布信息的挖掘、篩選和利用,需要利用先進技術與設備,與傳統方式相比運維成本更高。雖然數字資源的獲取更為便利,但是由于涉及到知識版權的鑒定與使用,并且流程相對繁瑣,也需要耗費大量資金。同時政府資金投入無法滿足大數據環境下的資源建設需求,即便是專項大額撥款,也只能滿足圖書館購置軟硬件設備的需求,在數字資源開發與持續利用方面的資金依然短缺。加上很多數據庫資源并非免費獲取的,價格也在持續上漲,導致圖書館無法保障數字資源的完整性,也影響到數字資源建設質量。
2.2缺乏特色數字資源服務
由于很多圖書館將結構化數字資源的搜集整理作為重點,缺少對非結構化數據的挖掘和存儲,導致圖書館存儲的資源類型千篇一律,缺乏深度與廣度,無法滿足用戶對個性化資源的需求。很多圖書館都是基于網絡開放獲取資源,為用戶提供信息檢索、組織與推送服務,極少利用移動通訊網絡、云計算等拓展服務領域,在數字資源采集整合方面缺乏創新意識,整體服務水平偏低。部分圖書館在數字館藏資源建設方面,將已有資源的數字化作為重點,缺少與其他圖書館或信息機構的交流共享,缺乏對海量數據進行綜合處理的能力,與個性化、多元化服務需求相差甚遠。
3大數據時代圖書館開展數字資源組織建設的思考
3.1圖書館應該建設“大”數字資源庫
“大”包括兩方面的內容。一是規模上的“大”。據有關專家的提法,幾百萬到一千萬字的數據庫是小型數據庫,幾千萬到一億字的數據庫是中型數據庫,從一億字到十億字是大型數據庫,超過十億字以上的應該是超大型數據庫。另一方面是功能上的“大”。功能強大是大規模數據庫的重要標志。建設大規模數據庫首先要有大規模的數據量,數據種類、數據內容應非常豐富,并有更大的包容性。目前廣西桂林圖書館正在建設的“廣西非物質文化遺產數據庫”就是秉持大數據理念,以數據齊全為目的,收集與非物質文化遺產項目相關的著述、研究論文、新聞及其他作品等相關數據,數據類型包括文本、圖片、音頻、視頻。以國家級名錄布洛陀為例,已收集到相關研究論文1589篇、新聞20條、著述24種、其他作品25條,數據仍在不斷更新中。當前圖書館正在建設的數字資源主要以館藏文獻數字資源、專題數據庫、網絡資源為主,缺少讀者信息行為數據等非結構化數據,而且建設的數據庫基本是中小規模數據庫,數據量較少,內容單一,如果把這些數據庫進行整合,把更多更豐富的信息匯集在一起將會獲得更多、更全面、更準確的資料。
3.2建設圖書館大數據平臺
為了適應海量且復雜的數據獲取、存儲、處理和管理,圖書館構建大數據平臺勢在必行??梢圆捎米越ɑ蛘咦赓U服務商云基礎設施平臺兩種方式來建設,在建設中為了保證大數據管理與應用過程安全、高效,應充分考慮到數據的采集、管理、處理和分析過程。第一,大數據平臺能夠支持PB級的數據存儲、管理與應用規模,并通過平臺管理與存儲系統的無縫平滑擴展消除數據孤島。第二,加強大數據平臺內部網絡,以及大數據平臺與外部數據采集系統之間網絡的傳輸效率與性能建設,確保數據傳輸安全、高效、即時和準確。第三,加強平臺的性能設計,保證平臺能夠支持圖書館各種類型數據、全生命周期管理、多功能應用與保障、24小時全天候不間斷的QOS服務需要。第四,實現跨系統、跨平臺和跨數據管理者的數據關聯、整合、分析,實現大數據生命周期全過程的數據與信息管理。大數據平臺的建設,需獲得人、財、物多方面的支持,僅靠圖書館單方面的力量是無法完成的,可以與相關信息技術機構合作,共同開發建設適用于圖書館界的大數據平臺。
4結語
綜上所述,數字資源建設與其生產、處理、存儲、搜索、運輸、維護、刪除等都有極大的相關性。在建設數字資源時,圖書館一般利用購買數字資源進行建設,還對傳統數據進行轉化。為了增加和豐富數字資源,通過進行大數據基礎上的圖書館數字資源建設,豐富資源種類,與云技術相結合,實現圖書館數字資源信息的高效、深度、完整的儲存、處理、生產、加工,創建個性化特色服務,提高競爭實力。
參考文獻:
[1]白薇.大數據與圖書館數字資源組織建設[J].圖書館界,2014,05:72-74.
[2]陸定軍.大數據時代圖書館數字資源的組織與建設[J].科技情報開發與經濟,2015,11:38-40.
[3]李白楊,張心源.數字圖書館建設中大數據問題初探[J].情報科學,2013,11:26-29.
[4]陸愛群.大數據時代數字圖書館面臨的機遇和挑戰[J].科技資訊,2016,29:150-151.