王姝+馬春華
【摘 要】 網絡技術在高校圖書館大規模應用,引發了圖書館任務的變化,用互聯網為學科知識服務和用戶個性化服務,已成為圖書館兩大服務主題,而兩大服務要依靠做好大數據服務。高校圖書館大數據具有自身特征,在應用中面臨諸多挑戰,要使大數據發揮作用,體現價值,必須堅持理論創新、技術創新、規模創新和方法創新。進而推進大數據服務的順利開展。
【關鍵詞】 數據特征 技術創新
1、高校圖書館大數據特征
大數據是云計算、互聯網、社交網等信息技術快速發展的產物,具有種類多、體量大、流量快、價值高的基本特征。高校圖書館大數據除了上述特征之外,還具有其自身的明顯特征,主要表現在:
1.1大數據和知識既聯系又有區別。圖書館中的大數據在被調用分析前是無序的,不能直接被利用。而圖書館中的藏書、論文數據庫等信息資源是可直接閱讀的,應屬于不可直接利用的大數據。但讀者的借閱記錄、用戶信息行為,訪問記錄等可以是圖書館大數據或可以成為圖書館大數據。
1.2數據分類明晰。從情報學的研究角度看,高校圖書館大數據可分為結構化數據,如紙質純印本、光盤、數據庫資源等;非結構化數據,如用戶瀏覽、借閱和日常圖書館服務環節記錄數據等;異構化數據,如自建統計,人員維護記載或外購數字資源等。圖書館大數據種類繁多,內容十分豐富。
1.3數據流量增加迅猛。最近幾年,高校圖書館內的各類中外文期刊,專業學術論文等圖書資源迅速膨脹,同時搜索和瀏覽數據也在急劇增加,體量浩大,前所未有。
1.4大數據關聯性明顯。高校圖書館大數據是由一個個數據、數據庫、數據集和數據群累加聚集而形成的。數據館藏資源不僅體現出數據集內部的關聯性,也能體現出數據集與數據集、數據群與數據群,數據集與數據群之間的密切聯系。當然這種關聯性要通過大數據挖掘才可體現其巨大價值。
1.5數據價值巨大但密度較低。因受到各方面因素的制約,知識服務領域的開放程度并不如人意。“信息孤島”仍隨處可見,這為數據的完整收集,特別是高質量的數據獲取帶來了困難。由于海量大數據中包含著很多無用信息,低價值密度特點突出。大數據的真正利用價值有待于沉入挖掘。
2、大數據應用貴在創新
面對挑戰和阻礙,高校圖書館要敢于迎難而上,堅持在理論上創新,在技術上創新,在模式上創新,在方法上創新,通過不斷創新發掘應用大數據的源泉。
2.1理論上創新。高校圖書館目前可將圖論作為基礎理論,即以圖為數據結構對現實世界進行研究,這對網絡信息挖掘以及大數據體系運作將起到很好的促進作用。這一理論通過構建“語義網絡”來表達“顯性知識”,又通過構建“社會網絡”來挖掘“隱性知識”,進而實現輔助知識創新。在建立云計算平臺的基礎上,可為開發大數據應用論證未來方向?;趫D的挖掘算法是語義網絡與社會網絡的密切結合,因此可做到大數據的共享和轉移,能作為高校圖書館學科知識挖掘的主要工具。把可視化與知識地圖同時應用在知識展現和知識服務上。分布式云計算平臺目前已集成了圖挖掘算法庫,據此可將中低端的計算設備,組成分布式計算機集群,并方便地使用這些類庫數據開展圖書館大數據應用,即可節省大量軟硬件購置資金,降低營運成本,又可極大提高計算性能,使“高校資金投入短缺”的難題得到有效破解。
2.2技術上創新。實現數據管理標準化操作,在技術上要以空間數據為核心,以地址數據為關聯,以空間數據和非空間數據一體化為突破口,將圖書館業務全力向數據分析、數據挖掘方向轉移,強化數據中心系統基礎能力的提升。一方面要做好各類數據的采集,處理與分析工作,保障圖書館資源數據量不斷擴展。另一方面要做好與其他高校圖書館,第三方運營商的技術聯盟,做到技術上資源共享,數據上優勢互補,在資源、認證、檢索、服務和技術標準統一的框架下,從大量數據中找出更多更大的潛在價值,進而打破“信息孤島”壁壘,推動高校圖書館服務能力和水平全面提升。
2.3模式上創新。大數據的本質特征是多樣性。因此在模式上應把不同類型數據資源選擇與整合,做為創新的重中之重。從學科角度出發,圖書館要緊緊圍繞教學和科研需求,選配具有專業知識與圖書館管理知識的圖書管員,利用深入數據挖掘所獲的專業領域知識,支持知識應用和知識創新,應選擇相關性較高的大數據資源,并注意這些數據存在大量冗余,做出有效清洗,以便形成具有一定相關性,豐富多樣的高質量數據模型,充分體現出本單位學科特色。從個性化角度出發,高校圖書館可通過可視化并經網絡實現快速查詢和檢索,用以構建用戶分析模型,分析用戶興趣、偏好、習慣、以及變化的需求,利用可視化算法和大數據分析,預測用戶變化趨勢,找出個性化閱讀的準確定位,將高校圖書館打造成大規模、大數據、高水準、高效率的信息網絡化服務中心。
2.4方法上創新。經過大數據捕獲、組織、分析和篩選,方可明確圖書館服務方向及服務策略。為此在方法上,對這些數據的分類與利用需進行相應環境、條件的限定,堅持循序漸進,逐步深化。如運用劃時段,分地域,講群體等諸多實用而又科學的方法,以確保服務更有針對性和鮮明性。目前,高校圖書館均配置了一定數量的中低端硬件設備,包括服務器和普通電腦等,可基于已有設備構建計算機集群,搭建云操作平臺系統,完成大量從節點分布式存儲和平行計算調度。這種方式運行于普遍服務器和計算平臺上,具有使用方便、穩定、性能好的優點,給大數據服務如何應用在方法創新上留下了啟示。
結語
高校圖書館應用大數據服務于科研教學,服務于廣大師生,這是網絡信息時代的大勢所趨。具備條件的圖書館已經開始應用大數據,暫時沒有條件的正在創造條件準備使用大數據服務。但構建大數據平臺不是一蹴而就的簡單事情,而是一項耗資巨大、技術復雜的系統工程,不僅需要強大的軟硬件設備作支撐,更需要一種勇于探索、敢于創新的科學精神。在實踐中,只要堅持積極主動地拓展大數據使用范圍,不斷拓寬大數據優質服務領域,就一定能充分展現出高校圖書館在大數據時代的價值和作用。
【參考文獻】
[1] 王學勤.建立驅動的大數據服務[J].圖書情報工作.2014.80-83.endprint