李 沛
(中國藥科大學圖書與信息中心 江蘇南京 211198)
麥肯錫全球研究所定義大數據(Big Data)為:“一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類型和價值密度低四大特征”。大數據中隱藏了巨大的價值,挖掘這些數據價值是艱巨的挑戰,同時也帶來了新的機遇。隨著近20年來大數據的飛速發展,圖書館在大學的數據中心地位開始凸現。利用大數據技術挖掘分析高校圖書館的數據信息,改善圖書館的日常業務工作,提升圖書館的服務水平,已成為大數據環境下高校圖書館提高服務質量的發展方向。高校圖書館在大數據環境下,面對新的發展和轉型的要求,需梳理大數據時代的業務服務流程,各個內部機構之間的協作顯得尤為重要。圖書館需對內部機構重新定位和變革,迫切需要樹立大數據思維,打造一體化、無縫對接式業務流程體系,保證圖書館大數據業務的高效運轉,最終提高圖書館的整體服務質量。
圖書館界對于大數據和高校圖書館業務體系關系有一些研究成果。袁雪青[1]指出資源建設和讀者服務是高校圖書館的兩大核心業務,這兩項業務在大數據時代的發展趨勢是:加快實現信息資源共享、重視建設特色數據庫、深化學科服務、服務趨于個性化定制等。欒旭倫[2]提出大數據環境下高校圖書館的業務體系包括資源建設、信息服務、文獻流通和行政管理以及這些體系的建設策略:數據聯動與迭代。陳雪[3]提出大數據時代采編工作改革建議:優化高校圖書館采編隊伍結構、加強采編工作社會化的監督管理等。楊帆[4]等提出了基于核心業務系統的圖書館大數據構建策略,從讀者和資源核心系統入手提出了該策略下的大數據平臺實踐方法、如何進行數據融合、圖書館大數據平臺體系架構等。
以上研究中多涉及大數據環境下核心業務體系的變革研究,對于整體機構的重組和調整研究較少。本文根據大數據在高校圖書館的流向,重點探討業務體系和機構重組的聯動關系,并闡述大數據環境下中國藥科大學業務與機構重組的實踐經驗。
高校圖書館的主要職能是保障學校教學和科研工作,高校圖書館的服務模塊重點為資源建設、資源流通、教學科研、行政管理、網絡信息5個模塊(見圖1)。大數據的發展對高校圖書館的各個服務模塊都產生了影響。圖書館業務流程在在大數據時代跟以往相比是有區別的,為了應對大數據給圖書館帶來的影響,高校圖書館必須采取一定的措施和策略,通過業務與機構重組,明確各個內部機構應承擔的相應責任,從而整體配合利用大數據提升服務能力。
在2016年初,中國藥科大學圖書館與信息化技術中心合并為圖書與信息中心(以下簡稱“中心”),開啟了圖書與信息化相結合的服務模式,內部機構經過重組后,構建大數據業務的“456模式”(見圖1),即針對5個重要服務模塊建立了6大服務相關部門:資源建設部、讀者服務部、參考咨詢部、辦公室、網絡運營部、信息應用部;基于大數據流向的業務流程主要分為4個步驟:大數據的產生、存儲、分析、決策。在6大服務部門之間可形成一個正反饋和負反饋的閉合環,環環相扣,緊密配合才能保證大數據服務的順利推行。

圖1 大數據業務的“456”服務模式
2.1.1 資源建設部門
高校圖書館作為學校教學科研提供服務的單位,其擁有的信息資源發揮了重大作用。大數據時代對高校圖書館資源建設工作內容和模式提出了新的要求。隨著網絡信息技術的發展,人們的閱讀方式和習慣發生了很大改變,已從傳統紙質資源向電子資源發生一定的傾斜。以往的采編部門的工作內容主要為紙質圖書資源進行采購、加工、整理和標引等,較少涉及到電子資源。中心重組后的資源建設部將電子資源囊括進自己的服務范疇。在數字資源日益豐富的今天,這是全面考慮讀者需求的一次機構重組和業務調整,更符合大數據發展的時代需求。
傳統的采編部在資源采購中,多采用出版商推薦、學校學科薦購等方式。當今可依托大數據技術,通過整合書目數據、館藏數據、讀者數據、研究文獻數據、服務數據、作者數據、專業數據、出版社數據等,分析讀者的真實需求,充分考慮教學與科研、專業與通識等各方面的不同需求,構建基于大數據的動態信息資源智能采購平臺[5-6],優化采購比例,從而科學指導圖書館資源采購,以便購買到廣大師生讀者真正需要的各類資源,解決圖書館資源建設面臨的經費不足與需求增加之間的矛盾,推動圖書館資源的合理利用和科學發展,此舉是資源建設部門重組后在大數據時代為讀者提供精準服務的一次推進。
2.1.2 資源服務部門
在大數據環境下,被動提供資源為主的傳統服務方式受到沖擊。在網絡信息的高速發展下,獲得信息資源的渠道增多且方法簡便,各種免費電子資源在互聯網上唾手可得,讀者對于圖書館服務的黏性大大降低,讀者量的流失將日益嚴重。
中心資源服務部門除去上文中提到的資源建設部,還包括讀者服務部。重組后的讀者服務部門作為直接面對讀者服務的部門,最能反饋讀者的需求及滿意度。讀者服務部需采取新的服務措施加強讀者對于圖書館的認可度和依賴度。讀者在人工、自助借還書籍以及網絡查閱資源信息的過程中產生了大量行為數據,可通過大數據手段挖掘分析,掌握讀者的閱讀習慣、資源需求、信息行為等,從而建立讀者資源利用行為模型、讀者服務自主評估模式、讀者服務反饋模式,構建“大數據”時代讀者信息行為習慣的新型主動型服務模型,通過模型預測讀者的閱讀偏好以及服務滿意程度,一方面進行信息、讀物、文獻的精準推送,提高服務的匹配度、可靠度和準確度,提升閱讀推廣的效果,從而最終滿足圖書館讀者的個性化需求;另一方面針對讀者的反饋進行服務內容和方式的調整,深入解讀讀者價值,全面提升服務品質,增強讀者黏性。
2.1.3 教學科研部門
圖書館的教學科研部門職能主要為:培養大學生的信息素養和輔助科研服務,如提供文獻檢索、科研查新等專業服務。信息檢索課程是高校圖書館的傳統教學科目。在大數據時代,相應地產生了數據素養教育,其概念有所爭議,引用較多的是Stevenson和Caravello[7]在2007年定義為:找到、評價和有效合理使用信息(包含數據資源)的能力。很多學者認為雖然信息素養和數據素養教育的側重點不同,但是應該把數據素養糅合于信息素養中,圖書館應該作為高校開展數據素養的教育平臺。
重組后的參考咨詢部門作為圖書館專門負責教學科研的部門,有了更多的精力和時間深化科研教學方式的改革和創新。數據素養教育將成為大數據時代圖書館的主要職能之一[8-9],那么對于圖書館的教育科研部門就提出了新的要求:培養數據意識、培育數據能力、樹立數據倫理,其中數據能力是關鍵要素。這是大數據時代圖書館教學的一個發展趨勢,當然還需要參考咨詢部門人員對于大數據技術不斷的學習、培訓以及內化知識,才能作為數據素養的教育者。
在教學跟進大數據時代的基礎上,輔助科研也會發生一些變化,借助于大數據存儲交換平臺、互聯網數據采集平臺及大數據挖掘輔助科研平臺,實現對互聯網信息的采集、匯總和分析,根據不同需求進行科學化分類,根據大數據挖掘分析模型進行數據的抓取、清洗和分類,實現國內外互聯網數據、專業數據庫數據、媒體介質數據的實時獲取,輔助科研工作者獲取時效性高、信息量大的需求數據,并為科研創新做出合理的輔助決策[10]。
在大數據環境之下,圖書館對于信息服務過程中實現了對各類信息的動態遞增,數據體量巨大而且類型復雜。大數據與傳統數據不同之處在于:傳統數據多為結構化數據,而大數據中包含了大量的非結構化數據,這類信息無法用數字或統一的結構表示,如文本、聲音、圖像等等,因此大數據的分析是比較復雜的。但是大數據服務落地的關鍵就在于大數據的實時處理和高效分析,一旦延時,就會導致對信息的服務失去時效性,這也是大數據環境下高校圖書館網絡信息服務所面臨的一大問題。
重組后的網絡信息部門,負責大數據的收集、處理、分析等重要環節,是保障大數據順暢流向的技術核心部門。大數據的儲存、計算、分析是一項浩大的工程,需要強大的分析工具作為支撐,簡單來說基于hadoop的hdfs解決海量的不同結構數據的存儲問題;spark解決大數據的計算問題;hbase解決大數據量的查詢問題等。經過統一數據采集和數據清洗過程,有效提高結構化數據查詢、更新效率;解決非結構化數據、半結構化數據的存儲、分析和檢索問題。
專業的大數據分析工具需要專業技術人員的操作和運用,因此專業數據人員的培養至關重要,要針對館員制定科學有效的激勵政策,鼓勵對大數據知識的學習及內化應用,在全館形成大數據思維氛圍;并積極加強對人才隊伍的建設,打破大數據環境下相關技術人才匱乏的問題。周曉燕曾選取IASSIST 網站中科研數據服務人員的招聘信息,運用網絡調查法和內容分析法進行分析發現,研究國外高校圖書館在招聘專業科研數據服務人員時的需求:有碩士以上學歷,有圖書情報學科、社會科學學科或特定領域學科專業背景,具有較強的數據分析能力和計算機技術能力[11]。
高校圖書館行政工作主要是辦公室負責,分為內部管理和外部管理。從內部來說,大數據時代,行政管理較以前工作方式更新加快,需根據內部工作人員的工作數據進行智能化分析、決策、科學化管理,保證館員飽滿的工作狀態和工作熱情,有利于業務流程的有序性,從而保障圖書館高效運轉。從外部來說[2],行政管理的最終目標是高效優質的讀者服務。自媒體時代,信息極易擴散和迅速傳播,對于網上的關于圖書館的不良信息需要及時地發現和處理,否則極易影響圖書館聲譽。行政管理層在大數據時代有了有利的方法:通過對互聯網外部數據和內部相關論壇的數據清洗、關鍵過濾、網絡爬蟲實時挖掘、分析龐雜的讀者行為大數據,及時發現敏感信息和不良的趨勢導向,建立實時監控模型,一旦超越數據閾值,就會產生預警信息,從而及時予以正向引導,有助于提升服務水平以及樹立圖書館的良好形象。
另外,辦公室需要依賴于大數據挖掘分析機制,將分析數據結果交予領導層做出合理的決策方案,并執行決策的推行,繼而對其他部門的業務建立正負反饋模式(見圖1),并觀測反饋效果,擬定后續決策,形成大數據流動決策反饋的閉合環。
整合后的部門功能在數據儲存、傳遞和處理等方面的流程更加順暢和緊密。在大數據思維氛圍下,資源建設部門、資源服務部門、教學科研部門作為數據產生部門,將得到的讀者行為數據快速傳遞給大數據的儲存、分析部門:網絡信息部門,經過一系列高效的分析處理后,將決策權交給行政管理部門,推行的決策決定了后續各個部門的再一輪大數據的收集、儲存、分析和利用。以此循環運作,每個環節都要求高效迅速,保證服務的時效性,這是重組前部門在大數據時代無法達到的工作高度。機構重組是信息技術發展的趨勢所需,重組后的部門承載著大數據時代的相應任務。