數字圖書館的“大數據”
2012年3月奧巴馬政府宣布投資2億美元啟動“大數據研究與發展計劃”,并將之定義為“未來的新石油”,標志著大數據時代的到來。
大數據實際上是指針對海量數據的處理方法。當數據量和規模巨大到無法利用目前主流軟件工具處理時,如何在合理時間內擷取、管理、處理并整理分析成為有用的資訊,是大數據要解決的問題。大數據對人類的數據駕馭能力提出了新的挑戰,也為人們獲得更為深刻、全面的洞察力提供了前所未有的空間與潛力。
數字圖書館作為人類知識的儲存空間、社會文化的傳承渠道,積累著大量數據,如各類型書目數據、文摘數據、全文數據、事實型數據,等等。這些數據中蘊含著大量的知識及其關聯,對各種知識主題、實體對象和載體形式,以及科研要素、科學文獻、科技項目、事件活動、專家學者、產品技術、組織機構和呈現之間的關系進行揭示和挖掘,形成知識網絡平臺,進行相關計量分析和監測評估,以形成新的科學知識和實事對策,可以豐富數字圖書館的服務內涵。
隨著互聯網與人們生活的不斷融合,人們的每一行為都會成為數據,不知不覺中人們的信息行為和消費習慣都會被記錄。數字圖書館擁有豐富的用戶數據資源,如用戶注冊信息、用戶利用信息(如瀏覽、檢索、下載等)、用戶交互信息等各類日志等,通過分析這些用戶數據,能夠對用戶的閱覽習慣、資源利用行為、網絡使用痕跡進行細粒度的分析,進而拓展數字圖書館的服務形式。……