張怡華

摘要 互聯網科技在人們身邊無處不在,大數據已經潛移默化的來到人們身邊。圖書館作為現代社會的有價值的信息系統,通過大量的非結構化數據、半結構化數據可以幫助我們尋找隱藏在數據背后的世界。本文分析基于大數據挖掘與決策分析體系的高校圖書館個性化服務研究,希望能為以后研究提供參考。
【關鍵詞】大數據 挖掘 決策 個性化服務
1 大數據時代圖書館面臨的挑戰和個性化需求
1.1 大數據時代服務平臺的系統結構更加復雜和開放
1.1.1 服務架構和應用程序復雜度快速增長
目前的軟件體系結構越來越難以應對和處理日益增長的軟件復雜性,如何實現圖書館基礎設施硬件個性化需求是我們孜孜不倦的追求。隨著微服務架構的興起,大規模整體式應用程序向著分布式微服務架構遷移,加大了系統結構的復雜性。
1.1.2 網絡和大數據資源的開放性
隨著互聯網技術的飛速發展,可以利用網絡進行傳播,實現資源的最大共享。但是有利必有其弊,大數據的開放性涉及數據安全和隱私保護。相比于傳統的數據資源形式,云計算、大數據、傳感技術具有開放性、復雜性、多樣性和海量性等特征。
1.1.3 以非結構化數據為主體
非結構化數據處理是大數據分析技術的難點和重點也逐漸得到客戶對其價值的認可。過去那種有限內容和結構單一的數據庫已經無法滿足客戶多樣化需求,尤其是在圖書館個性化服務更是以非結構化數據為主體。
1.1.4 改變了傳統信息安全交付模式
大數據時代的到來,給圖書館的服務帶來了更大的挑戰和機遇,一方面是大數據帶來的個性化服務,另一方面是大數據改變了圖書館在傳統IT情況下的信息安全交付模式。
1.2 圖書館大數據QOS(服務質量)保障與用戶隱私保護沖突激
1.2.1 讀者個性化服務中數據被過度分析
如果對用戶數據存在過度的分析和使用,不僅僅不能幫助圖書館實現個性化服務,反而會導致分析的結果失真。更有甚者,引起用戶隱私的泄露,帶來被控訴的官司。
1.2.2 黑客會最大限度地收集圖書館和讀者的個人信息
大數據環境下經常出現圖書館用戶隱私泄露,如何有效保護讀者隱私權,己成為加強圖書館與讀者之間信任感的重要武器。大數據時代,信息獲取渠道增多,給圖書館用戶的隱私保護帶來極大的風險,進行數據分析和數據挖掘應該在不暴露用戶個人隱私的前提下。
1.3 大數據挖掘與決策分析的圖書館個性化需求
1.3.1 輔助事前預測
我們應該利用此項技術來對自身的數據進行整理、組織、分析,為圖書館服務的模式、對未來發展趨勢提供分析與預測。尋找用戶的訴求,進而改進服務規模,提高服務質量,達到圖書館對大眾的資源和服務的雙向滿足。
1.3.2 輔助事中感知
大數據的容量如此龐大,在海量數據中對有價值的數據進行甄別與篩選,再對其進行科學系統的挖掘,絕非易事,因此要提早作好各方面的準備。比如天津圖書館每個周六都有講座活動,所以那一天來圖書館的讀者比較多。中文報紙閱覽室正對著報告廳,每一場報告結束,許多讀者還會直接走進閱覽室。有的老讀者會直接向你反映這場報告會都講了什么、感受如何,打動人心的地方在哪兒。這些讀者的反饋是圖書館講座服務的一面鏡子,這是圖書館人在工作中所作的小數據集合。
1.3.3 輔助事后反饋
在大數據中“沙里淘金”,需要事后實時反饋,事后做好相關文字記錄,跟蹤設備的記錄。大數據還能為圖書館構建全新的知識服務引擎提供必要的技術支撐。并且在技術應用于管理過程中還可以不斷反饋信息
2 高校圖書館大數據挖掘及決策分析體系的架構和流程
2.1 高校圖書館的大數據挖掘及決策分析流程
2.1.1 多維度提取數據來源
從從各類業務和大數據存儲交換平臺內提取數據,或者從外部互聯網(直接裝載入爬蟲引擎)提取數據。
2.1.2 評估數據規模和樣例分析
高校圖書管理系統,用綜合效益評價體系和評價方法,根據規模大小選擇合適的分布式并行計算應用架構,也進行樣例分析。
2.1.3 根據實際需求確定建模方式
讀者用戶監控和分析、分類、預測及輔助決策需要用數學建模方法,我們需要一種全新的面向Agent的需求建模方式。
2.1.4 根據需求確定輸出方式和優化
確定了各評價指標的權重,運用TOPSIS方法對直接輸出分析報告,確定一套科學的質量評價指標。
2.2 高校圖書館的大數據挖掘及決策分析的架構
圖書館的大數據服務體系,其服務與運行模式的核心是客戶,將圖書的搜尋、查找、借閱、管理等流程加以優化,并有機的結合起來,利用云技術進行分析、預測和智能的輔助服務,建立具有特色的科學性很強的實用圖書管理模塊。大數據計算服務后,在大數據計算服務內進行一些數據計算和算法模型的訓練。然后再將計算的結果導入ADS和云數據庫中,其中導入的ADS支持BI系統,并且ADS能夠多值列查詢和毫秒級的實時響應,有利于生成BI報表;另一部分數據存入云數據庫中,不僅降低了存儲成本,同時也提高了數據的安全性。
3 大數據挖掘及決策分析體系在高校圖書館個性化服務中的應用
3.1 基于用戶行為模型的個性化服務方案
3.1.1 用戶行為本體數據庫構建過程
如何構建合適的用戶行為模型并基于海量的行為日志數據提供個性化服務,其本質是從異質的市場中尋找用戶行為習慣及特點等諸多。構建大數據的存儲、搜索、共享、分析和可視化等管理行為,科學構建CRM大數據庫和管理信息系統。
3.1.2 用戶顯性興趣和隱性興趣本體提取過程
通過分析用戶的瀏覽方式和內容,實時獲取用戶興趣信息,設計一種利用用戶日志庫提取用戶顯性興趣和隱性需求本體的個性化服務方案。高校圖書館大數據應用模式框架抓取工具,提出數字圖書館個性化用戶興趣領域本體的動態過程。
參考文獻
[1]孫琳,大數據時代圖書館服務體系創新研究[J].理論觀察,2013 (04).
[2]胡蓮香.走向大數據知識服務:大數據時代圖書館服務模式創新[J],農業圖書情報學刊,2014 (02).