關鍵詞:大數據;圖書館;定量分析法
摘要:文章以2009年以來中國知網(CNKI)收錄的主題為大數據和圖書館的論文為研究對象,運用文獻計量學、系統分析法等方法,從文獻量、作者、來源期刊分布、關鍵詞、主題內容等方面,對大數據在圖書館學領域的研究現狀進行評述,并探討該主題在圖書館學領域的發展方向。
中圖分類號:G250.7文獻標識碼:A文章編號:1003-1588(2014)12-0103-04
收稿日期:2014-10-20
作者簡介:孫雨(1988-),金陵圖書館助理館員。1數據來源及檢索方法
為了研究我國目前圖書館學大數據的研究情況,筆者確定以中國知網(CNKI)《中國期刊全文數據庫》為主要數據來源,配合《中國優秀碩士學位論文全文數據庫》《中國博士學位論文全文數據庫》《中國重要會議論文全文數據庫》等數據庫,對大數據的研究現狀進行分析。
“大數據”概念在國內最早于2009年左右被提出[1],本文在檢索時間上選取2009年1月至2014年6月期間發表的論文為研究數據。以“大數據”和“圖書館”為關鍵詞進行檢索,對結果進行文獻總量分布情況、作者情況、關鍵詞及主題進行統計分析,共計檢索到203篇文獻。
2文獻量分析
為了準確反映該領域的研究水平、發展程度及課題活躍性,以半年為時間單位對文獻量進行統計,結果如圖1所示。可以看出,從2009年上半年的0篇到2014年上半年的85篇,總體文獻量成激增狀態,尤其是2012年開始,每個階段的發文量都不斷增加。
2009年至2012年上半年,與大數據有關的圖書館領域發文量相對較少,并且通過內容分析發現,這個階段的文獻只是與數據挖掘等數據處理技術相關的論文。雖然2009年“大數據”的概念被提出,但并沒有立即引起圖書館界的重視。而從2012年開始,大數據的概念不斷進入圖書館學研究者們的視野,發文量急劇增加,尤其是2013年下半年、2014年上半年。在此階段,圖書館領域對于大數據的研究進入了一個增長點,可以預見,未來一段時間,大數據仍是我國圖書情報學研究的重點與熱點。
3作者分析
3.1核心作者分析
分析檢索到的203篇文獻,作者共有248人(其中有8篇文章無署名作者)。表1是作者發布的文獻量情況,從中可以看出該領域發文篇數與人數的數量與比例。其中,發表1篇文獻的作者數量所占比例達到95.56%,遠遠超過洛特卡定律[2]中提到的60%的比例,這表明現階段我國研究該領域的人員比較分散,科學生產力還相對較低。
6主題分析
研究這203篇文獻內容,可以發現,現階段關于大數據在圖書館應用中的研究大體分為兩個方面:圖書情報學和計算機技術應用學。目前這兩個領域,是研究大數據圖書館應用研究的核心領域。
“大數據”時代的到來最早是由全球知名咨詢公司麥肯錫提出,麥肯錫稱:“數據,已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。人們對于海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來。”[7]通過對203篇研究大數據在圖書館中應用的論文進行內容分析,可以發現研究方向主要分為以下幾個方面。
6.1圖書館可用的大數據及來源
大數據伴隨著互聯網、云計算、物聯網、社交網絡等技術的興起而呈指數級增長。在大數據時代,各種數據隨時隨處都在。而對于圖書館而言,“讀者第一,服務至上”是永恒的主題,也是圖書館的立身之本,所以用戶信息、服務信息等非結構化數據是主要收集對象。
另外,圖書館的數字化資源、網頁和數據庫等資源的讀者訪問數據以及社交媒體訪問數據,甚至是RFID射頻數據也構成了圖書館大數據的主要來源。正是這些大量的、多樣的、高速發展的、具有真實性的數據,支撐起了圖書館大數據的主要組成部分。
6.2改變數據處理方式,提供創新服務
圖書館傳統的數據處理方式是將紙質文獻資源不斷地進行數字化、網絡化處理,并在原有資源的基礎上,盡力滿足用戶的最大需求,使資源得到最大程度的利用。而大數據時代,圖書館的數據處理將發生極大的變化,如根據收集分析用戶數據,對讀者的借閱習慣、愛好、信息需求甚至社交方式等進行數據分析,提供針對性強、個性化的服務[8]。
同時,這也要求圖書館的部分傳統業務,向數據挖掘、數據分析方向轉變。隨著需要處理的數據量增多,圖書館需要不斷地提升數據分析處理的技術水平,從大量數據中挖掘出潛在的價值,才能不斷地創新服務方式、提升服務水平。
6.3消除信息不平等
進入信息時代以來,信息不平等現象就一直存在。隨著信息傳播技術、傳播渠道的不斷發展,信息不平等現象不斷地放大,大數據時代也不例外。由于不同地區、組織、機構以及個人在對數據收集分析使用中的信息差距,數據不平等是大數據時代呈現的最明顯的信息不平等現象。
圖書館在應用大數據時,也應致力于消除信息不平等現象。圖書館可以通過維護發展公共圖書館制度、倡導社會責任與社會包容和提供公共智慧服務來消除數據不平等,維護大數據時代的信息公平[9]。
6.4保護用戶隱私數據
大數據時代,圖書館為了能夠有效地了解讀者需求,需要通過處理平臺對高速增長、結構復雜的數據進行采集、整理、歸納和分析。在這個過程中,被采集的用戶數據包括個人隱私數據都會被全方位的監視與控制。如何保護海量用戶隱私數據,也是眾多學者研究的課題。
首先,圖書館必須自覺遵守相關法律法規,并制定相關規范,形成保護用戶隱私的機制。其次,應提高用戶隱私數據收集處理過程中的安全管理,并應致力于研究開發保護隱私的相關技術。最后,應加強培訓員工保護用戶隱私的意識,形成圖書館的自我約束和自我監督的氛圍。只有這樣,圖書館才能為讀者提供大數據時代安全、高效、放心、滿意的個性化服務[10]。endprint
6.5大數據與新媒體營銷
大數據時代的到來為圖書館的新媒體營銷注入了活力。圖書館新媒體營銷的運作核心是基于對內容與營銷過程中積累的數據的分析,圖書館通過分析調研,掌握用戶需求,并基于用戶需求實時調整內容和營銷模式。而支持新媒體能夠對用戶需求做出快速響應的,則是背后對用戶和內容實時監控所形成的大數據。通過大數據挖掘和分析技術,圖書館新媒體可以隨時調整其內容和營銷策略,提高服務的精準度,讓內容生產和營銷模式層出不窮[11]。
7結語
通過對大數據在圖書館中應用的研究文章進行各種信息的分析,可以看出,大數據時代圖書館將會迎來服務營銷方面新的發展機遇,但同時大數據也在數據安全方面給圖書館帶來了挑戰。
首先,大數據給圖書館帶來了新的機遇。大數據環境下,圖書館可以通過分析海量數據,向用戶提供針對性、個性化、專業化的服務,還可以根據用戶需求,調整和改變圖書館營銷模式,配合新媒體技術,吸引更多用戶。
其次,大數據時代圖書館需要面對挑戰。大數據時代的到來,圖書館需要處理大量高速增長的非結構化的用戶數據。保護用戶隱私數據,則是圖書館必須面對的問題。同時,圖書館也應致力于消除數據收集過程中的信息不平等現象,維護大數據時代的信息公平。
可以預見,一段時間內,大數據仍然是圖書館學領域研究的熱門課題。隨著相關研究的逐漸深入、參與研究的學者不斷增多,相信大數據時代將給圖書館的發展帶來更多的活力。
參考文獻:
[1]百度百科.大數據[EB/OL].http://baike.baidu.com/subview/6954399/13647476.htm?fr=aladdin.
[2]百度百科.洛特卡定律[EB/OL].http://baike.baidu.com/view/40602.htm?fr=aladdin.
[3]沈奎林,杜瑾.Web2.0在圖書館應用方面研究論文的定量分析[J].現代情報,2010(10):140-143,154.
[4]百度百科.布拉福德定律[EB/OL]. http://baike.baidu.com/link?url=mJ2y3-NRa2QxPkYEQq3jq
2yfT2Vk3jFFDiLGHPsqrJV JMf7iaYmQI-P-tef
SaoDy.
[5]蘇新寧.圖書館、情報與文獻學研究熱點與趨勢分析(2000-2004)——基于CSSCI的分析[J].情報學報,2006(3):373-383.
[6]百度百科.大數據時代[EB/OL].http://baike.baidu.com/view/9424571.htm.
[7]楊海燕.大數據時代的圖書館服務淺析[J].圖書與情報,2012(4):120-122.
[8]韓煒.大數據時代公共圖書館消除數據不平等的路徑選擇[J].圖書館論壇,2014(3):14-21.
[9]維克托·邁爾·舍恩伯格,肯尼思·庫克耶,盛楊燕,周濤譯.大數據時代:生活、工作與思維的大變革[M].杭州:浙江人民出版社,2012.
[10]王薇.看互聯網思維如何改變傳媒業[J].媒介,2014(5):30-34.
(編校:崔萌)endprint