[作者單位]中國人民解放軍醫學圖書館,北京 100039
1980年,著名未來學家阿爾文·托夫勒便在《第三次浪潮》一書中,將大數據熱情地贊頌為“第三次浪潮的華彩樂章”。大數據的特點被業界規范為4V特點:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)[1]。大數據的特性將決定圖書館在大數據業務和整個大數據生態系統中的收集、分析、管理、存儲及分配數據的方式[2]。在大數據時代,圖書館要通過理性推進大數據在圖書館的應用,維護并發展圖書館制度,強化圖書館的人文關懷和培養智慧圖書館員等路徑提供公共智慧服務[3]。大數據也會對圖書館的基礎設施、館員素質、讀者服務、版權保護、信息安全等方面的發展提出挑戰[4]。當前,隨著信息化和數字化的不斷發展,特別是數字資源占整個資源采購的比例不斷提高,圖書館正逐步從文獻資源中心向數據中心轉變[5],圖書館信息資源采購工作將面臨著革命性的變化。
在資源建設原則上,國內大部分圖書館仍然遵從以滿足館藏需求為目標的館藏驅動資源建設原則;在資源采購模式上,雖然有些圖書館也打出了“用戶需求”的口號,但是在實際工作中并沒有滿足用戶需求;在資源的結構整合方式上,國內圖書館還存在很大的局限性。
傳統的資源采購原則是以館藏為中心,以館藏資源建設為核心開展服務[6]。這種以館藏為中心的資源采購原則不能適應大數據時代對信息的要求。大數據的4V特征之一的Value,指信息的潛在價值,即能為用戶提供所需要的、有用的信息。用戶需求得到滿足是數字資源質量的核心內涵,用戶滿意是數字資源服務的重要目標[7]。以館藏為中心的資源建設會過于追求資源的“高大上”,資源建設往往會出現凌駕于用戶需求之上的現象,資源規模雖然龐大,但實際使用率極低,違背了大時代大數據下信息的價值特性,脫軌于時代需求,資源采購存在重復、忽視用戶需求、利用率低的弊端。
目前,我國圖書館資源采購模式普遍分為較為傳統的單獨采購、集團采購及政府采購3種模式。這幾種模式從根本上講都是脫離用戶本體需求的盲目采購,最大的詬病就是會造成大量的資源浪費,購買的文獻資源往往并不是用戶所需,用戶的實際需求也不能得到滿足。
大數據時代的資源數據類型主要有3種:結構化數據即圖書館購買的商業數據、自建的特色數據等,半結構化數據即教學資源庫、數據挖掘系統、郵件系統等,非結構化數據指包括視頻、音頻、圖片、圖像、文檔等形式的數據。據統計,人們對半結構化及非結構化數據的依賴越來越強,這些數據也極具潛在持續價值。但是,國內圖書館由于觀念陳舊,普遍存在注重結構化數據收集,輕視或忽視半結構化、非結構化數據的收集。單純的結構化數據已經不能滿足社會、個人對數據大量、多樣化、快速及存在潛在價值的需求。據統計,當今世界結構化數據增長率約為32%,而非結構化數據增長率則是63%,至2012 年,非結構化數據占比已達到互聯網整個數據量的75%以上[8]。圖書館資源數據的單一結構化不能為社會、企業、個人提供全面、客觀、合理的信息服務,與大數據時代的服務要求不相符。大數據時代的資源數據收集觀念應該以服務于社會、個體為宗旨,以資源數據結構的全面性、完整性、永久性、合理性為目標,以實現用戶的滿意度為落腳點。
大數據已經滲透到我們的工作、生活中,對我們的影響至深至遠。作為逐步成為數據中心的圖書館,資源建設必將迎來質的轉變。傳統的資源建設原則、資源采購模式及資源結構方式所暴露出的問題已經成為圖書館轉變成為數據中心的絆腳石,嚴重影響圖書館為新型用戶服務的宗旨。因此,我們必須順應時代要求,結合實際需求,把以滿足館藏需求為目標的館藏驅動資源建設原則轉變為以滿足用戶需求為目標的用戶驅動資源建設原則,轉變傳統采購模式為讀者決策采購模式,轉變單一資源建設平臺為聯盟資源建設平臺。
隨著大數據時代的到來,數字圖書館的功能發生了變化,用戶已具備自己發現與訪問資源的技巧與技術[9],用戶角色由被動轉變為主動:用戶的信息素養越來越高,對信息的數量與質量的要求也不斷提高。圖書館資源建設所遵循的原則也必然發生變化,由傳統的館藏驅動轉化為以滿足用戶需求為中心的用戶驅動資源建設,包括通過各種渠道了解用戶需求,加強以用戶為導向的數字資源集成建設;用戶參與資源采購流程和加強以用戶滿意度為標尺的資源評估;加大對用戶關注領域及偏好的研究,拓寬基于用戶需求的有效外延服務,如對讀者借閱習慣、愛好等進行分析等;制定新的服務方案、策略,實現資源的充分利用。
圖書館對存在無限潛能價值的資源采購如不能從用戶個體的角度出發,這種資源的利用價值就無從談起。目前,一種新的基于用戶需求的采購模式——讀者決策采購已在美國大學圖書館界廣泛興起,成為許多美國大學圖書館購買圖書特別是電子書的主要模式。這種資源采購模式雖然引起了我國圖書館學術界的關注,但仍在研究討論階段,還沒有得到廣泛的應用。
讀者決策采購是指將讀者的閱讀需求量化成一定指標,作為圖書館文獻采購和館藏建設的決策。圖書館與書商制定符合藏書發展政策的預設文檔,書商提供符合預設文檔要求的圖書MARC記錄,圖書館把MARC記錄導人圖書館的自動化管理系統,讀者通過自動化管理系統查到書目記錄后,可以點擊鏈接直接閱讀電子書,也可以要求提供印刷本,費用由圖書館統一支付[10]。這種模式把用戶從資源接受者轉變為資源采選者,用戶在資源建設中的主體地位得以確立。這種滿足用戶需求的采購模式可以改變資源利用率低的問題,從根本上節省經費。
2.2.1 讀者決策采購中的個體能動性
圖書館作為提供信息服務的中心機構,首先要運用大數據給讀者提供前所未有的信息服務。因此讀者是關鍵,要把讀者的作用滲透到資源建設的每一個環節中,充分發揮讀者的主動性;讀者也應該參與到讀者決策采購的第一個環節中,即圖書館和書商確定符合藏書發展政策的預設文檔這一環節中。讀者提供自己所需的文獻文檔,圖書館利用大數據的便利,根據讀者的個體信息(包括年齡、專業、閱讀習慣等數據),對讀者所需的文獻文檔進行分析,進而向資源采購者提供分析報告,最終確定一個符合讀者需求和館藏發展政策的預設文檔。這樣不但能大大提高資源的利用率,而且館員可以更全面地了解資源的使用目標及使用效果。
2.2.2 讀者決策采購的采購標準
美國高校圖書館在采用PDA前,都會制定細致嚴格的采購標準和參數。如美國南伊利諾斯大學卡本代爾分校圖書館和丹佛大學圖書館設定對全文免費閱讀電子資源3次或外借紙質文獻3次后,圖書館就會購買該文獻[11]。采購參數除了常規的名稱、出版社、出版時間、價格等,還應該包括載體、語種、學科領域、借閱次數、點擊閱讀次數等,參數制定得越詳細,采購就越有指向性。在國外的PDA采購標準里,價格是一個很重要的指標。比如普渡大學(Purdue University)的PDA采購的標準是近5年內出版的、150美元以內的學術性圖書,且一周內書商可供貨到圖書館。規定價格的上限為150美元,超過150美元的要由學科館員審核[11]。我國PDA采購價格標準制定應根據圖書館的具體情況而定,不可盲目模仿,對已制定的價格標準也應根據客觀實際做出相應的調整。價格上限如果制定得過低,不但會增加圖書館員的審核量,而且會限制讀者的自主性;價格上限過高,資源采購會出現泛濫現象,造成一定程度的資源浪費。
目前各圖書館都有自己的資源建設平臺,但是這種單打獨斗式的單一平臺不能使圖書館用戶體驗到大數據與大數據技術即云技術結合帶給圖書館用戶的極致服務。各圖書館要根據各自的特性結成聯盟,建立聯盟的資源建設集成平臺。利用云技術對聯盟內圖書館的網絡、硬件設施及數字資源進行整合,對分散在各圖書館的數字資源進行抽取、索引,最后把分散的數據逐步集中在聯盟資源建設集成平臺。這個集成平臺就是為聯盟內圖書館保存數字資源、查詢數據、分析數據的強大云端平臺網,幫助圖書館人實現為用戶提供最快捷、最準確、最客觀、最有遠瞻性信息的服務目標。
大數據時代給未來圖書館帶來了無限的可能。例如,未來到圖書館的用戶在出示ID后的3-5分鐘內會得到1份包括用戶的類型、閱讀興趣范疇、學術研究狀況、研究方向建議、搜素信息的范疇及檢索信息的場所,用戶根據這份報告提供的信息直接到最符合需求的信息室。同時,資源采集館員也會得到1份有關這位用戶的采購意向報告,包括其采購歷史、采購范疇、采購習慣等。信息服務部的圖書館員也得到關于這位用戶的專業背景、學術研究狀態及當次信息服務需求,并根據這些數據開展有針對性的服務。網絡平臺會將該用戶的數據信息納入讀者信息平臺。未來圖書館用戶既可以到圖書館享受信息服務,也可以通過網絡享受大數據帶來的便利。