卓莉
摘要:隨著計算機技術的不斷發展,很多領域都開始引入大數據,以促進自身的發展。傳統的圖書館領域也不可避免。大數據在圖書館領域的應用,既是機遇,又是挑戰,本文探討了大數據時代下圖書館遇到的挑戰以及應對策略。
關鍵詞:大數據時代 圖書館 挑戰 應對策略
一、大數據時代概述
現今,大數據的使用越來越廣泛,它的使用讓圖書館煥然一新。最早提出“大數據”概念的是麥肯錫公司。2011年5月,麥肯錫公司在大數據報告中指出:“數據已滲透到每一個行業和業務職能領域,逐漸成為重要因素。”其后,大數據迅速成為政務及信息科技等行業關注的熱點。
目前,大數據還沒有一個統一、固定的定義。從狹義上來看,我們可以把“大數據”理解成“為超出傳統數據管理工具處理能力的大規模、復雜的數據集合”。而一組名為“互聯網上一天”的數據可以明確地告訴我們大數據到底有多大:一天之中,互聯網產生的全部內容可以刻滿1.68億張DVD;用它發出的郵件有2940億封之多……截止到2012年,數據量已經從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。國際商業機器公司研究稱,整個人類文明獲得的全部數據中,有90%是過去兩年內產生的。預計到2020年,全世界產生的數據規模將達到今天的44倍。
二、大數據時代下圖書館將遇到的挑戰
首先,傳統的網絡構架與“大數據”時代不相適應。大數據時代下的信息交換是服務器與服務器之間的交換,而傳統的服務器之間交換信息的程序十分復雜,且大數據時代下的存儲數據分布非常廣泛,各個服務器都有一定量的數據存儲。
其次,數據中心在大數據時代的催化下所要面對的巨大壓力。在大數據時代下,圖書館數據庫里的內容豐富多樣,包括辦公的文本文檔、圖表報表、音頻圖片等。如此之多的非機構化數據,移動或是修改它都需要耗費大量的人力、物力和財力,如果移動數據,又會降低它的讀取效率。
最后,在大數據時代下,雖然每天都會產生大量的新數據,然而真正可以利用的數據卻很少,無法形成系統的知識源以供研究人員進行使用。
三、大數據時代下圖書館應采取的應對策略
1.解決大數據存儲,建立超大型元數據倉儲
建立超大型元數據是未來數字圖書館整合資源的思路之一,有利于實現資源的統一聚合與一站式檢索。此外,我們還可以采用基于云計算的分布式存儲技術,利用它和一直相關聯的虛擬技術使圖書館數據更加有序、統一。
2.解決非結構優化數據的分析和挖掘問題
大數據規模龐大,數據分析和挖掘工作就顯得非常重要。在圖書館的大數據中,有待處理的非結構化數據與讀者的興趣是緊密相關的。為了給讀者提供個性化的服務,我們必須剖析、解讀讀者的顯性行為,并挖掘其隱性行為。
3.將知識圖譜可視化,實現個性化服務
大數據時代下的圖書館,需要提供統一的一站式服務,通過異構數字資源的融合、聚類和重組,使資源從數據層的揭示與展現轉向信息層、知識層的深度服務;利用時間軸、地域軸等知識譜可視化展示方式,將資源呈現給用戶;依托融合的物聯網、移動通信網以及互聯網進行傳播,最終為用戶提供電視、電腦、手機等多種終端的接收;加強分析用戶數據,實現個性化服務;促進業界的合作建設,實現共知共享。
四、結語
大數據時代的到來,給圖書館的發展帶來了很大的機遇,但同時也帶來了不小的挑戰。在大數據時代的影響下,圖書館形成了嶄新的數據管理和處理模式。一方面,大數據本身的性能具有約束作用;另一方面,政府以及各信息行業高度認同和關注大數據。
圖書館是一個對技術要求極高的機構,對大數據的關注、應用和探討,為解決圖書館資源發現和信息服務提供了契機,也為圖書館傳播文明帶來了更多便利。
參考文獻:
[1]李國杰.大數據研究的科學價值[J].中國計算機學會通訊,2012,(12).
[2]李奕.計算機革命與數據價值——2012第二屆中國計算機技術大會專題報道[N].中國計算機報,2012-10-15.
[3]于良芝.圖書館學導論[M].北京:北京科學出版社,2013.
(作者單位:內蒙古呼倫貝爾市鄂溫克族圖書館)