鄧文婷
(河南省濮陽市圖書館,河南濮陽,457000)
隨著科學技術的不斷發展,信息技術被廣泛應用,全球已邁入了大數據時代。大數據時代的到來,對社會各個行業及領域均有影響,圖書館工作也不例外。本文提出了大數據時代數字圖書館的建設對策,旨在提升我國數字圖書館建設水平,為相關人士提供參考。
大數據時代是隨著互聯網不斷發展而出現的一個新詞語,主要指收集及處理信息資源,以此來推動人類生產發展,促進人們生活質量的提升。在當前社會不斷發展的過程中,獲取信息價值逐漸成為人們關注的話題。因此,目前關于大數據時代方面的研究較多。在大數據時代下,信息數據容量不斷擴增,信息資源也在增多。事實上,大數據時代下數字圖書館的主要任務并不是對信息資源進行大量收集,而是重點分析和處理具有價值、對社會生產力發展有利的數據。同時,需要充分注意處理之后所帶來的社會效應。當前,大數據時代的數據處理已經應用了云技術,通過分布結構的轉變,實現網絡儲存功能。
大數據時代具有兩方面顯著特點:1.信息數據資源十分豐富。隨著互聯網技術的快速發展,計算機信息技術已被廣泛應用于人類生產生活,從而豐富了信息數據并提高信息的共享質量。當前,我國已全面步入網絡社會。在此背景下,人們對于信息數據的需求不斷提高,從而間接地促進大數據時代發展。同時,信息資源形式也呈現出多樣化發展的特點,因此信息資源的數量及其處理都處于動態發展變化的過程。2.大數據時代結構較為復雜且變化速度偏快。數據形式從原來的單一變得多樣化。同時,隨著計算機技術的不斷發展,數據形式也在不斷地變化。人們對于大數據的需求不斷提升,因而數據結構十分復雜。例如大部分的數據均以非結構化或者半結構化形式存在。[1]
數字圖書館是當代計算機和互聯網技術下的新興產物,屬于一種信息資源組織模式。關于數字圖書館的概念,最初是由上世紀90年代美國科學家所提出的,但是每位研究人員對于數字圖書館的研究角度有所不同,對其進行定義也會有一些差別。其中對于數字圖書館有一種綜合的定義,具體為:數字圖書館通過數字化形式對于信息資源從收集到發布,并依托于實體進行發布。從形式上來看,其可以是相關的社會機構或是有關的組織,同時也可為虛擬網站等任何數字信息資源的集合。從整體上來看,數字圖書館是圖書館的一種新的組織形式。因此,無論從哪方面來看,數字圖書館都同傳統圖書館之間有著不同的狀態。當然兩者功能和本質相同,數字圖書館屬于傳統圖書館發展的新形式。
1.數據的快速更新要求數字圖書館建設應當加大對數據的研究
2010年由聯合國統一發表了《大數據促發展:挑戰與機遇》,明確指出,大數據的到來將會是人類社會的重大轉折點,依靠大數據為人類服務,將給人類社會帶來更大的便捷。至2018年,大數據應用一直是研究人員討論的熱點之一,美國政府也不斷強化大數據的開發和研究,并將其同國家發展戰略結合在一起,這無疑大大推動了全球數據一體化的發展。在大數據推廣的背景下,國際上針對數字化圖書館的相關功能應用也隨之進行。在國際社會數據環境變化的背景下,我國針對數字圖書館建設的大數據開發應用等方面還需要不斷加強研究。
2.創新主體變化要求數字圖書館應當符合企業發展方向
當下,我國存在著資源配置不夠優化、資源的利用率較為低下等問題。企業是整個技術化改革創新的主要對象,但由于創新能力等方面的因素,不少研究結果都沒有直接轉換為實際的應用技術。企業作為創新主體,在大數據時代下,應當通過對大數據的掌控,提高自身的運營效率。所以,數據化運行及研究成為當今企業發展的根本。[2]
數字圖書館從數據庫再到大數據,從整個過程來看雖然只是技術的簡單演變,但是兩者之間是有本質差別的。大數據的出現完全改變了傳統圖書館數據管理模式,無論是在數據的收集和數據的處理等多方面均帶來了較大改變。
數字圖書館中包含的資源較多,不僅具有文獻資源、網絡資源等,還包含用戶信息和為用戶提供服務的信息。隨著時間的流逝,圖書館的數據資源不斷增長。其數字資源的總量相當于一個龐大的數據集。數據庫處理一般是以MB作為基本單位,大數據則常常以GB或者TB、PB作為基本的處理單位。大數據所謂的“大”,并不只是指大數據的絕對數量,而是指在數據處理中所采用的“大”模式。因此,數字圖書館如何合理處理異構數據、如何對海量數據進行儲存、如何對數據資源進行選擇等等問題,都將成為大數據時代下數字圖書館面臨的主要問題。
目前,我國圖書館的業務應當不斷地朝著數據分析和數據挖掘方面轉變,這能夠讓圖書館的業務真正地轉變為對數據的處理和分析。事實上,許多具有價值的東西均藏于碎片化數據之中。例如在兩個小時的視頻之中,僅僅只有五分鐘是具有價值的資源。數據挖掘將成為大數據時代下數字圖書館的主要業務,該業務開展水平也直接決定了大數據時代下數字圖書館的發展。但是,基于數據庫的數字圖書館,其事先對于數據模式加以設計,數據主要是在使用中不斷產生。而大數據則很難在事先就確定其模式,它必須在數據出現之后才能夠確定,并且隨著數據量的不斷增多,其模式也會不斷發生變化。因此,數字圖書館建設將面臨從海量異構數據中挖掘有價值的信息這一問題。
數字圖書館的數據主要包括系統運營和用戶服務數據、論壇反饋數據等。這些資源及其數據編碼格式無法達到統一,因此形成了許多異構數據。相對于數據庫數字圖書館而言,其數據類型相對而言十分單一,并且主要以結構化數據為主,非結構化數據在數據庫數字圖書館中十分少見。在大數據時代,數據包含的類型較為豐富,例如辦公文檔、WEB信息等半結構化及其非機構化數據日漸增多。因此,數字圖書館同大數據時代之間存在一定的矛盾,在建立過程中將會面臨數據多樣性這一問題。[3]
針對以上大數據時代下數字圖書館建設面臨的大規模數據問題,事實上根本無需建設起所有類別的數字資源,應當避免資源類別全面建設,這種“貪大求全”反而容易帶來一些不良影響。對此,在實際建設過程中,應該根據自身特色形成一定規模資源,并同其他資源進行整合,從而系統地、有組織地進行開發、整理建設,以使數字圖書館規模效益得到有效地發揮。而針對少部分未建設的數字資源,可以展開館際區域合作,實現同其他資源的整合及其共享。采取區域合作的方式,能夠有效地解決大數據對數字圖書館建設和發展帶來的相關經濟成本,避免建設中出現資金不足的問題。此外,對于數字資源,還應當綜合考慮對其長期保存的標準問題、儲存介質選擇、安全和管理等方面的問題,以此保證數字圖書館能夠真正實現規范化管理,保證數字資源數據的全面性與綜合性。[4]
對于數字圖書館的文字、音頻等數據,主要是考慮對于這些數據的儲存,從而滿足用戶的使用要求。目前針對這類數據儲存,主要有分布式緩存、分布式文件系統、NoSQL分布式儲存方案等。這些數據儲存方案在實際實施中,需要投入較多資金購買軟、硬件。如果采取這類方案,數字圖書館建設將面臨巨大的壓力。對此,可以采取云計算技術對數據進行儲存。隨著云計算技術的不斷發展,已經能夠為大數據提供具有彈性、可以拓展的數據儲存服務,因此在數字圖書館建設過程中,應當根據實際的需要應用云計算技術,以此解決數字圖書建設資金的問題。
當前,我國數字圖書館在針對結構化數據的管理上已經較為完善和成熟,但是在非結構性數據化管理方面上還有待完善。應當立足于用戶的實際需求對信息資源結構加以調整和建設,以保證信息資源的數量及其質量。同時,還應支持多媒體文檔儲存等,從而能夠形成一種新型的分布式與整合式的資源平臺,最終提高非結構化數據的管理水平。
基于網絡技術的數字圖書館平臺,能夠將互聯網技術、高性能計算機、傳感器等整合為一臺虛擬但是功能十分強大的計算機。通過網絡技術平臺的建設,在數字資源系統上建立起數據核心協議層,收集各種不同的服務信息,并在核心協議層統一解決,實現數字圖書館在異構環境下跨平臺異構資源的協同工作。另外,構建起基于網絡技術的服務體系架構,能使工作平臺不再受到限制,而服務的提供者和用戶均可使用同一種軟件來實現對服務的操控,從而最大限度地整合異構資源。
在大數據環境下,數字圖書館的數據應用價值主要體現在數據應用系統,例如常見的信息檢索服務、數據挖掘服務及其個性化軟件等。應用服務及其軟件主要是通過原始數據的篩選及轉換,利用可視化技術將篩選出來有價值的信息進行展示,從而實現數據主導服務的發展。
數字圖書館建設必須充分地應用新技術,尤其是學習技術、數據可視化技術的應用等。這需要對自身軟件技術不斷地進行創新,促使數字圖書館能夠跟上大數據時代發展的步伐。利用大數據分析及其智能計算,數字圖書館可以根據數據分析出用戶的偏好,從而根據用戶的實際需要提供個性化服務,為用戶帶來更優質、更全面的服務。而隨著圖書館用戶在服務要求以及相關技術方面的變化,使得圖書館在服務方面也需要尋求一定的變化,才能夠滿足當前人們的需求。由于各方面因素的共同作用,使數字圖書館在服務的途徑、模式以及方式等都出現了一些變化。同時,其服務不但有信息方面的咨詢、文獻類的服務以及學科方面的服務,而且還會根據數據采集、分析以及決策來完成相關服務,從而為企事業單位及相關機構提供數據的分析處理和挖掘等方面的服務。
對于數字圖書館而言,其服務最終往哪個方向發展,需要看其怎樣防止知識產權方面的風險。對知識產權的重視,需要盡可能地提升館員的專業水平,對產權進行維護。為了使公民的數字使用權與文化方面的權利得到應有的保護,可以依靠立法來實現。同時,應當設置管理著作權的專門機構,讓圖書館能夠得到信息資源傳播、建設方面的授權,妥善地解決可能存在的知識產權風險問題。
在大數據的背景下,數字圖書館承受著較大的經濟壓力。隨著服務和產品方面的成本升高,資金的投入卻不夠。鑒于這種情況,政府在數字圖書館方面的投資建設時,應當重視全面性與可持續性,實現多元化的平衡發展。在其他國家的數字圖書館中,有稅收政策來進行引導,使得政府、企業、基金會等都是其投資主體。我國在這方面也可以借鑒國外的一些經驗,鼓勵社會公眾的力量參與進來,從而讓投資結構得到很好地優化,拓展收入方面的渠道,促進數字圖書館建設發展。同時,依靠系統化與規范化的管理,實現館際合作和資源共享,完善成本管控的長效機制,從而達到圖書館服務等方面的目標。另外,遵循公益性質的無償性服務原則,結合市場化運作的方式,通過技術創新與數字接入等手段,提高數字圖書館為公眾服務的效益。
大數據時代的到來,促使數字圖書館建設面臨巨大的挑戰及發展機遇。對此,數字圖書館在實際建設過程中,應當緊緊抓住大數據時代的發展機遇,從數字資源建設、平臺建設等多方面進行創新,促使數字圖書館建設滿足大數據時代的需求。創新建設是大數據時代數字圖書館的核心,因此數字圖書館應當充分結合云計算技術等高新科技技術,不斷地創新數字圖書館,從而促使大數據時代下數字圖書館建設能夠朝著更好的方向發展。