謝 松,朱海東,李小華
(贛南師范大學 圖書館,江西 贛州 341000)
2012年7月在第六屆上海國際圖書館論壇上,大數據概念第一次被引入了圖書情報界,為圖書情報界帶來了巨大的發展機遇,同時也給信息服務帶來了前所未有的挑戰。作為學校科研發展的重要支撐部門——高校圖書館,應該努力思考如何利用大數據技術優勢,并結合高校圖書館自身的特點,重新進行自我審視和定位,加強自身資源優勢,拓展資源建設與服務理念,重視用戶數據信息利用行為,從而開創新的服務空間,謀劃新的發展之路。
大數據的引入需要圖書館從新的角度去分析和重構信息數據,這就給圖書館信息資源的建設帶來了新的挑戰,下面結合贛州高校圖書館的現狀來分析面對大數據沖擊下高校圖書館信息資源建設的幾點思考和建議。
大數據的基本特征體現在4個“V”:Volume數據規模大;Variety數據種類多;Velocity生成速度快;Value價值密度低。從數據的角度來理解,大數據是海量、多源、異構、動態的大型數據集,其數據價值密度相對較低,需要進行分析處理和數據挖掘才能得到對用戶有用的信息,實現數據價值,這就要求信息資源的共享及高效利用。贛州因為經濟政治方面的原因,以及各高校行政管理本身具有非常大的局限,高校圖書館沒有對信息數據進行有效的收集整理和共享,沒有建立起一個對高校圖書館資源進行統籌、保護、共享的信息化平臺,因此,當前的高校圖書館信息資源依然存在利用率較低的問題。
大數據的特質之一就是生成速度快,海量信息以非常快的速度進行聚集更新,這對高校圖書館信息資源建設帶來了巨大的沖擊。高校圖書館資源建設遵循一定的流程,比如申報、審批、采購、整合等流程,耗時費力,且需要耗費不少的時間周期,這就使得高校圖書館信息資源建設的進度緩慢,從而影響圖書館信息資源建設的時效性。
當前贛州高校圖書館信息資源建設的最重要的制約因素是信息化建設和管理的專業人才太少,圖書館專業人才設置中,圖書情報類專業的人居多,而信息技術類的人員非常少。因為信息技術人才應用前景廣闊,大量的專業人才都流向了一二線城市,或者流向了政府機關或高校的教學科研崗位,留在圖書館的信息類人才幾乎沒有。高校圖書館在培養自己的信息專業人才或跨學科復合型人才方面做得也不好,這就導致了贛州高校圖書館信息專業人才方面的匱乏。
贛州高校圖書館人才、設備、資源有限,想要長足發展只能整合現有資源,將幾所高校圖書館聯合起來建立大數據中心,集中資源辦大事。大數據中心要解決的是設備問題和標準化問題。
2.1.1 要整合現有存儲設備。大數據的特質是數據規模大,數據生成速度快。各個高校現有的存儲設備很難滿足大數據存儲及處理的需要。大數據中心需要整合升級高校現有存儲資源,使其能滿足大數據存儲需求。此外,還需要升級大數據服務器及文件系統,使其滿足大數據計算、挖掘和傳輸。
2.1.2 要確定信息系統數據標準。大數據的特質之一就是數據種類多,且多為非結構化和非關系型數據,這與圖書館傳統的結構化數據大為不同。所以,在建立大數據系統之前,要對收集的數據進行分析和設計,建立相應的數據標準,加強對非結構化信息的收集、加工、存儲和挖掘,使信息數據系統實現標準和智能化。還要對圖書館現有的信息資源進行二次開放及整合,使其潛在價值和意義被充分利用,實現圖書館信息資源多元化。
2.1.3 合理選擇和使用大數據系統工具。想要搭建高效的大數據信息系統,選擇合適的、高性能的大數據系統工具至關重要。建立一個高性能的大數據平臺,要從各個方面綜合考慮,比如經費、需求、人才、技術、硬件等。自行開發系統顯然不可行,那么可以從現有的、比較成熟高效的工具中選擇。Hadoop是一個很好的選擇,它的核心是HDFS(分布式文件系統)和MapReduce(分布式并行編程模型),且具有可靠、高效、成本低、跨平臺等優點,并可以部署在廉價的計算機集群中,完成海量的數據存儲和計算。數據庫的選用也比較多,有HBase、Redis、HIve等,各有特色。數據可視化工具可以從Easel.ly、Tableau、魔鏡、ECharts等工具中選擇適合需求的軟件。
贛州高校圖書館現有的電子資源種類比較繁雜,有紙質圖書的Marc、館藏、借閱數據,有電子圖書(如超星)資源數據,有電子期刊(CNKI、萬方)資源數據,有多媒體視頻類的資源數據,還有很多其他種類的電子資源數據及網絡上一些開源數據庫,各個圖書館還有自建的一些特色數據庫。一些比較著名的數據庫比如CNKI、萬方、超星、EBM、人大報刊,贛州的幾所高校都購買了上述幾種數據庫資源,這些資源對高校師生工作學習幫助巨大,但是也造成了資源建設的重復投入。如何高效科學的建設高校圖書館的信息資源,可以從以下幾個方面考慮。
2.2.1 幾所高校集中人力物力成立大數據中心的前提下,由大數據中心統一購買這些數據資源。幾所高校共享,不僅可以節省經費,大數據中心還可以有效的整合資源,開發出更好的圖書館服務平臺及手機端移動平臺,充分地利用這些數據進行分析統計,更加科學、高效地進行資源建設,同時也為讀者提供更加便捷、個性化的一站式資源檢索和以用戶為導向的精準服務。
2.2.2 大數據中心可以結合贛州的歷史風貌及經濟發展特點,結合高校的師資力量及科研水平,積極建立一些特色資源數據庫。比如客家文化資源數據、紅色革命老區數據庫、臍橙種植信息數據庫及有色金屬數據庫等等,為高校師生服務的同時也為贛州的經濟建設貢獻自己的力量。
2.2.3 大數據中心及高校圖書館要想提高自身競爭力,做好信息資源建設,需要有大量的資源和技術,就要開展跨界合作。比如贛州市政府主導的“贛州數字經濟發展規劃”項目,大數據庫中心可以積極參與進去,利用自己的技術及數據優勢,更好地為贛州的數字經濟發展服務。
大數據技術在高校圖書館的應用,需要圖書館培養一批有圖書情報專業知識背景和掌握大數據技術的復合型專業人才。高校圖書館首先要改革人才制度和管理制度,創造適合人才成長的工作環境,設置專門工作崗位及人才培養計劃。招聘一些具有計算機專業或圖書情報專業的年輕人才,然后開展定期和不定期的大數據專業知識培訓課程,使其熟悉、掌握自身學科以外的專業知識,樹立大數據與自己學科的交叉領域。同時,圖書館還要積極開展對外交流學習,改革崗位管理機制,增強館員的資源服務理念,努力為高校圖書館培養大數據管理的發展環境。
傳統高校圖書館的服務模式是被動式服務,讀者來圖書館搜索、借閱圖書,圖書館提供借閱服務。利用大數據技術,高校圖書館可以改變被動服務模式為主動服務模式——精準服務。精準服務是建立在當前圖書館一般性服務的基礎上,以用戶問題為導向的圖書館服務模式,強調的是,從依據用戶共性需求配置資源到依據用戶個性化需求配置資源的轉變。利用大數據系統綜合采集圖書數據、讀者搜索借閱信息、移動終端位置、讀者專業信息等數據,分析讀者行為數據,挖掘讀者的潛在需求,為讀者提供精準服務,將是大數據技術下高校圖書館發展的方向。
圖書館資源建設的評估是高校圖書館資源建設工作必不可少的重要環節。科學有效的資源評價體系是合理配置資源的基礎。相應的,在大數據環境下高校圖書館也需要變革資源評價的內容與方法,以指導新形勢下的資源建設。高校圖書館利用大數據工具,能夠對來自圖書館系統和社交網絡等不同渠道的異構數據加以整合,綜合運用各種新型的資源評價指標和新興評估方法,實現更全面的數據分析,促進資源評價效果的提升。
贛州高校圖書館在信息化建設發展過程中存在不少問題,發展相對落后。希望贛州高校圖書館能利用大數據技術發展的契機,不吝投入,積極進行大數據環境下的信息資源建設和人才培養,從資源、技術、管理、人才建設等多個方面共同推進,為贛州高校圖書館未來發展打下堅實的基礎。