張 穎 / 重慶師范大學涉外商貿學院
淺談圖書館如何簡單應用大數據特性
張 穎 / 重慶師范大學涉外商貿學院
隨著現代社會和科學技術的發展,以及大數據的概念出現以后,大數據已經漸漸融入到我們生活中的各個領域,正改變著人們的生活方式。圖書館作為文獻信息中心,更應該接受和適應這種變化,并且利用大數據的特性進行發展和改變,來突出圖書館的特點和職能。
圖書館;大數據;特性;簡單應用
“大數據”(Big data)研究機構Gartner給出了這樣的定義。“大數據”是需要新的處理模式才能具有更強的決策力、洞察發現力和流程優化能力,用來適應海量的、高增長率和多樣化的信息資產。對于大數據這個概念大家并不陌生。
大數據有四特性:
1.大量
2.高速
3.多樣性
4.低價值密度
隨著社會和科技的發展,大數據已經融入到我們的生活中的各個領域。圖書館擔負著教學和科研服務的雙重任務,是培養人才和開展科學研究的重要基地,不僅要更好的融入當今社會的大數據時代,更應該更好的應用大數據的特性為廣大讀者服務。
首先大數據與傳統數據相比較,最明顯是特點就是在于大數據的信息量巨大。
現在的圖書館已經不再是只用來存放紙質載體圖書的建筑物,它還包括有電子資源以及各種不同形式、不同載體的信息和資源,圖書館的功能和內容正在發生轉變。傳統紙質圖書載體能容納的內容相對于大數據大量的概念來說已經不值得一提。而隨著現代科技發展,出現的電子圖書的信息量也是不能與大數據相比的。
原來所說的電子圖書和數字資源一般都指存儲于圖書館內的本地數據庫中存儲的資源。一般的電子圖書和數字資源具有容量遠遠大于傳統紙質載體圖書,并且具有使用和檢索都比紙質載體圖書來的更為方便和快捷等優勢。但在大數據環境下,使我們的這一概念發生了翻天覆地的變化。大數據的應用方式,在理論上可使圖書館的容量無限擴大。
大數據即將大量數據通過互聯網聚集到某個特定點,也可以看成是把互聯網上的所有數據集中在某一個特定數據庫中,這個特定點或特定數據庫存在于互聯網中。事實上我們所說的特定點或者特定數據庫只是把互聯網中各個不同的數據庫做成開放性數據庫,讓各個數據庫之間進行相互通訊,而形成的一個整體數據庫。
因此,圖書館也可以鏈接并使用這一特定的整體的數據庫。通過此鏈接,不僅可以無限擴大本館自身的館藏資源,還能使本館資源得到開放,更加有效充分的利用館藏資源,并實現數據交流和資源共享。
大數據和傳統數據最大的區別在于大數據的高速特性,它對于數據處理的能力要求必須非常出色。
大數據在進行數據處理的時候,既能對數據進行流處理,也同時能具備對數據進行批處理的能力。也就是說,大數據處理要求在連續不斷處理數據的同時,能夠對突如其來的批量數據進行計算和處理。
大數據的高速運行,要求數據有時效性。隨著時間推移,數據的價值會折舊,不同年齡階段的數據具有不同的價值,如期刊類,報紙類。這就要求圖書館及時更新其館藏。好在大數據時代的資源和數據能夠互相連接,彌補了部分館藏和資源不能高速運行更新的缺點。
從數據開發來看,圖書館存儲了大量的數據和資源。當這些數據和資源被聚集到一起時,會形成數據和資源的“礦山”,那么“挖礦”的效率就要求非常高,大數據高速運行就成了“挖礦”的優勢。
在圖書檢索上,大數據的高速運行查找能夠快速、精準的定位每一本圖書的位置。對于不熟悉圖書分類法的讀者來說,利用大數據進行圖書資料的查找和檢索無疑是最方便快捷和準確的。
大數據的數據來源的多樣性,這是傳統數據做不到的。
對于圖書館來說,產生數據的方式多種多樣,有日常的統計數據報表,有人工借還和自助借還數據,有讀者檢索圖書產生的數據,有使用網絡圖書館產生的點擊量、瀏覽量等多種數據來源。可以看出讀者自身也是數據的創造者。
在大數據環境下,圖書館通過記錄、收集并保存產生的一切數據,待數據量達到一定規模的時候,通過對多樣數據的各種提煉和分析,了解讀者需求,更好的提供多樣化的資源和優質的服務。
通過分析讀者的閱讀需求等數據,可幫助圖書館優化自身的館藏結構,幫助圖書館紙質圖書館藏的剔舊、電子資源的購買和更新等工作更科學的進行。
大數據的低價值密度是指數據的真實性。
大數據追求的是數據的高質量,大數據的基本在于為決策提供幫助,因此大數據必須擁有絕對的真實性。
從來源上分析,傳統數據的來源是從宏觀上采集的。數據的采集有原則性,有規律,采集的對象有階段性有針對性,或者直接是進行抽樣采集的。傳統數據的采集方式決定了傳統數據在真實性上會有所欠缺。
大數據的采集方法與傳統數據迥異。大數據的數據采集方式是從微觀采集,它進行的是個體采集,每個個體都有自己單獨的數據集合,也是產生數據的來源。大數據對于數據的采集是沒有標準的,它的采集方法源于對個體的行為與現象記錄。通過對大量真實數據進行提煉、分析和總結出來的有用數據,其真實性是毋庸置疑的。
圖書館應用低價值密度這一特性,可以幫助圖書館對文獻進行開發。因為圖書館所提供的文獻、資源、信息等必須具有權威性和真實性。以大數據為基礎的參考信息作為文獻開發依據具備了真實性的原則。
大數據能真實的分析讀者使用圖書館的習慣和讀者的讀書習慣。通過記錄和分析讀者的閱讀傾向的數據和讀者使用館舍的數據等等,能真實分析出哪些是讀者使用的重點資源,哪些是讀者不常使用的次要資源。通過對讀者的閱讀傾向的數據進行記錄和分析,可幫助圖書館加強對讀者重點使用的資源的建設。而對讀者使用館舍情況的記錄和分析,可以對圖書館館舍進行科學的改造和布置,讓讀者使用圖書館更感舒適。
大數據真實的記錄和分析讀者閱讀和使用圖書館的各種數據,可以引導讀者進行閱讀。挑選讀者重點使用的資源設立專門的閱讀區域,可在設立的閱讀區內進行與重點資源的相關參考內容的引導和推薦工作,方便讀者更好更有效的使用圖書館資源。
通過大數據對讀者數據的捕捉,圖書館能提供更優質的服務。建立數據,統計數據和應用數據,可使圖書館更具有競爭力。有大數據的真實為支撐的基礎上,圖書館在現有基礎上,能更好的優化和深化服務。
大數據的四個特性,并不一定是獨立的,在很多方面,這四個特性都是融會貫通在一起的。應用其特性并不是只會用到其中的一個特性。圖書館對大數據特性進行合理的應用,能更好的建設發展自身,適應和滿足社會的需求。
[1]李恬.大數據理念與圖書館大數據[J].新世紀圖書館,2014,(6):24-27.
[2]韓翠峰.大數據帶給圖書館的影響與挑戰[J].圖書情報,2012,(5)37-40.
[3]黃馥妃.大數據時代高校圖書館個性化服務研究[J].文化視野,2016.