摘 要:大數(shù)據(jù)與云計算是近兩年IT界最為流行的兩個關(guān)鍵詞,各大IT廠商也都看到了大數(shù)據(jù)所蘊(yùn)含的商業(yè)價值并展開了一定的產(chǎn)品研發(fā)與商業(yè)應(yīng)用。在當(dāng)前的大數(shù)據(jù)背景下,在處理數(shù)據(jù)以及服務(wù)方面,圖書館的變化明顯,通過數(shù)據(jù),對其價值進(jìn)行重點(diǎn)的挖掘與研究,為圖書館管理人員調(diào)整有關(guān)建設(shè)措施提供依據(jù),同時這也是其關(guān)鍵業(yè)務(wù)之一,在服務(wù)的方法與方式上,圖書館也會根據(jù)其不斷變化的方案而改進(jìn)。
關(guān)鍵詞:大數(shù)據(jù);云計算;數(shù)據(jù)處理;數(shù)據(jù)分析;信息服務(wù);圖書館服務(wù);數(shù)據(jù)挖掘
“大數(shù)據(jù)”在IT行業(yè)中,是最近僅次于“云計算”以及“數(shù)據(jù)挖掘”的流行詞匯之一,大數(shù)據(jù)的改革正如火如荼的開展著,在此次革命中,作為商業(yè)部門的EMC、IBM以及Oracle已經(jīng)關(guān)注到其商業(yè)價值,同時在云計算的基礎(chǔ)上,針對BigInsights開發(fā)了有關(guān)的數(shù)據(jù)收集和計算服務(wù)。在這一革命中,美國對其價值也早有關(guān)注,2013年三月底,在奧巴馬帶領(lǐng)下的美國提出了 “大數(shù)據(jù)的研究與發(fā)展計劃”,其目的是對政府內(nèi)部的相關(guān)分析、組織以及收集數(shù)據(jù)的工具進(jìn)行改進(jìn),從而推動自身在集合各種繁雜數(shù)據(jù)過程中的能力,使國家的戰(zhàn)略方針與大數(shù)據(jù)相一致。對于圖書館而言,利用、存儲和開發(fā)知識是其社會責(zé)任,處于當(dāng)前“大數(shù)據(jù)”背景下的圖書館,其在處理數(shù)據(jù)、計算和搜索數(shù)據(jù)、發(fā)現(xiàn)只是、服務(wù)信息等方面的能力提升是當(dāng)前的研究重點(diǎn),這一問題要想得到根本解決,就要看清楚“大數(shù)據(jù)”給周邊環(huán)境帶來的深遠(yuǎn)影響,對可以用于圖書館的各項(xiàng)工具、技術(shù)、理念等作出綜合研究,促進(jìn)圖書館不斷提升其服務(wù)讀者信息的能力,為圖書館的未來發(fā)展貢獻(xiàn)力量。
1 大數(shù)據(jù)概述
當(dāng)前,對于大數(shù)據(jù)的定義還不統(tǒng)一,有的分析專家指出,一個企業(yè)在半結(jié)構(gòu)以及非結(jié)構(gòu)化數(shù)據(jù)的創(chuàng)造一般叫做大數(shù)據(jù),當(dāng)關(guān)系型的數(shù)據(jù)庫在下載上述數(shù)據(jù)過程中,費(fèi)用以及時間都是較大的支出,所以,大數(shù)據(jù)一般被稱作是非結(jié)構(gòu)化的具有各種不同形式的大量數(shù)據(jù)的集合。1)大數(shù)據(jù)的應(yīng)用領(lǐng)域與范圍。雖然大數(shù)據(jù)這一詞匯早就出現(xiàn)了,而真正的研究相關(guān)技術(shù)的歷史并不長。當(dāng)前來講,數(shù)據(jù)的挖掘算法、語義引擎、分析預(yù)測性能力、可視化分析、數(shù)據(jù)的管理與質(zhì)量等都屬于大數(shù)據(jù)的技術(shù)范圍,詳細(xì)來講,當(dāng)前主要由分布式緩存、分布式文件系統(tǒng)、分布式的數(shù)據(jù)庫以及不同的分部儲存措施等組成。缺乏成型和廣泛運(yùn)用的應(yīng)用跟技術(shù)是造成當(dāng)前大數(shù)據(jù)使用較難的主要原因,所以,當(dāng)前能夠參與競爭的廠商主要是在分析以及存儲數(shù)據(jù)方面有著較大優(yōu)勢的企業(yè)。2)大數(shù)據(jù)與云計算。云計算與大數(shù)據(jù)是相關(guān)聯(lián)的,當(dāng)前的分析大型數(shù)據(jù)是要負(fù)責(zé)眾多電腦的工作分配,所以,大數(shù)據(jù)和云計算之間的關(guān)聯(lián)性,我們可以這樣認(rèn)為,大數(shù)據(jù)在運(yùn)行與存儲方面的難題被與計算所解決,并且建立了一定的架構(gòu)平臺,通過分布式的處理方法,大數(shù)據(jù)對此平臺進(jìn)行運(yùn)用,計算能力是云計算的關(guān)鍵,計算對象則是大數(shù)據(jù)的關(guān)鍵,他們之間存在著互相促進(jìn)的作用。對這兩者的不同進(jìn)行分析,可以從下面幾點(diǎn)來講,應(yīng)用方面,第一,從概念的角度分析,云是大數(shù)據(jù)運(yùn)營的基本單位,云計算對IT產(chǎn)生了改變性的影響,業(yè)務(wù)受大數(shù)據(jù)影響而改變;第二,在受眾的角度分析,云計算的主要銷售對象是以技術(shù)或者解決措施為主要產(chǎn)品的主管部門,大數(shù)據(jù)的主要銷售對象則是業(yè)務(wù)部門。
2 大數(shù)據(jù)時代的圖書館數(shù)據(jù)處理與服務(wù)
1)圖書館具有了“大數(shù)據(jù)”特征。當(dāng)前建設(shè)圖書館信息的速度不斷加快,讀者也不斷提出更高要求,在大數(shù)據(jù)的背景下,圖書館具備了相關(guān)特點(diǎn)。第一,在數(shù)據(jù)類別上,圖書館較多,其數(shù)據(jù)資源主要包括數(shù)據(jù)庫資源、網(wǎng)絡(luò)資源、光盤資源以及紙質(zhì)的純印本等文獻(xiàn)資料信息,同時還包括平時讀者的信息以及相關(guān)服務(wù)信息,另外讀書館本身的有關(guān)信息也包括在內(nèi),上述相關(guān)數(shù)據(jù)在應(yīng)用特點(diǎn)、數(shù)據(jù)格式以及編碼等方面的不同造成了圖書館的不統(tǒng)一,不同圖書館之間的差別更大,這也是許多不同數(shù)據(jù)產(chǎn)生的原因;第二,圖書館在信息方面具有量大和增速快的特點(diǎn),但從圖書館自身將,其資源總量不多,但是總結(jié)全國的圖書館信息,其數(shù)據(jù)集卻是相當(dāng)大的。2)大數(shù)據(jù)時代的圖書館數(shù)據(jù)處理。在數(shù)字化的背景下,處理圖書館的相關(guān)數(shù)據(jù)工作以處理器語義、網(wǎng)絡(luò)化和數(shù)字化為主要內(nèi)容,以此為基礎(chǔ),使用戶能夠在利用程度以及滿意程度上實(shí)現(xiàn)最大化,同時還包括建設(shè)語義化、數(shù)據(jù)庫以及服務(wù)方式等,在當(dāng)前的大數(shù)據(jù)背景下,在處理數(shù)據(jù)的對象、方法以及范圍和目標(biāo)等方面,圖書館的變化顯著,最常見的是在讀者借閱的喜好的基礎(chǔ)上,對讀者的服務(wù)數(shù)據(jù)做出相關(guān)研究,從而制定出更加科學(xué)的方法。與此同時,在大數(shù)據(jù)時代的背景下,對數(shù)據(jù)的研究和分析將代替圖書館的傳統(tǒng)業(yè)務(wù)而成為重點(diǎn),處理和研究相關(guān)數(shù)據(jù)會發(fā)展成為圖書館的重點(diǎn)工作,圖書館要提升其服務(wù)質(zhì)量、拓寬其數(shù)據(jù)資源、改善服務(wù)方法等將不再單純的以共享數(shù)據(jù)、創(chuàng)新思路和時間延長為重點(diǎn),在眾多的數(shù)據(jù)資源中,挖掘其潛在價值與規(guī)律的發(fā)現(xiàn)成正比,同時對于提升圖書館的服務(wù)也就有促進(jìn)作用。3)大數(shù)據(jù)時代的圖書館服務(wù)。圖書館的服務(wù)在用戶需求以及相關(guān)技術(shù)進(jìn)步的推動下,不斷進(jìn)步,在大數(shù)據(jù)背景下,從服務(wù)的方式方法等角度,圖書館的變化都很明顯,因?yàn)榻M織、獲取以及決定和研究相關(guān)數(shù)據(jù)是圖書館制定服務(wù)方案的基礎(chǔ),所以,此背景下的圖書館服務(wù)在鮮明性與針對性方面更加明顯,其服務(wù)的方式方法也在不斷調(diào)整的方案的影響下而不斷進(jìn)步。因此,從圖書館最基本的學(xué)科服務(wù)、咨詢信息以及文獻(xiàn)調(diào)整服務(wù)等角度,圖書館從自身具備的處理信息和服務(wù)優(yōu)勢的方面都會獲取較大的發(fā)展,為包括公司和政府在內(nèi)的社會部門在分析數(shù)據(jù)方面提供支持,在大數(shù)據(jù)背景下的圖書館將會以挖掘數(shù)據(jù)服務(wù)作為其最常態(tài)的服務(wù)。
3 結(jié)語
不同的技術(shù),其發(fā)生與發(fā)展,對圖書館的進(jìn)步和發(fā)展都會產(chǎn)生影響,在社會進(jìn)步的推動下,用戶的要求也會不斷提升,大數(shù)據(jù)也不例外。當(dāng)前,在數(shù)據(jù)的來源方面,圖書館具有復(fù)雜的特點(diǎn),同時這也加快了圖書館朝著大數(shù)據(jù)時代的發(fā)展,通過數(shù)據(jù)分析來發(fā)現(xiàn)其價值是未來圖書館的重要業(yè)務(wù)之一,同時,圖書館在這些業(yè)務(wù)方面的發(fā)展?jié)摿ζ湮磥淼陌l(fā)展也具有一定的決定性作用。本文以研究大數(shù)據(jù)的各種概念、含義以及特征為出發(fā)點(diǎn),針對圖書館在處理數(shù)據(jù)業(yè)務(wù)方面的發(fā)展做出分析,隨著大數(shù)據(jù)時代的真正到來,將會有越來越多的專家和學(xué)者投入到對圖書館處理數(shù)據(jù)以及相關(guān)服務(wù)的研究中來,對其做出更加科學(xué)合理的應(yīng)用型分析。
作者簡介:
岳亞琴(1990-),女,漢族,四川成都人,四川工商學(xué)院圖書館館員,從事圖書情報研究。