張 紅(國家圖書館,北京 100081)
基于大數據技術的資源發現平臺構建
——以國家圖書館“文津搜索”系統為例
張紅
(國家圖書館,北京 100081)
以國家圖書館“文津搜索”系統為例,闡述應用Hadoop分布式系統架構和各類NoSQL數據庫等大數據技術構建資源發現平臺的策略和方法,并對基于大數據技術構建的“文津搜索”系統的技術優勢、實際應用成效以及技術局限性進行分析,為大數據技術在圖書館數字資源服務領域的應用提供借鑒與參考。
大數據技術;資源發現系統;國家圖書館;文津搜索
隨著信息技術的發展和互聯網應用的普及,大數據時代已然來臨。大數據技術突破了傳統數據管理技術的瓶頸,對于種類多樣、增長迅速、蘊藏巨大價值的海量數據,在數據采集、存儲、處理、分析和挖掘方面具有一定的技術優勢。
在數字圖書館建設深入開展的今天,數字資源急劇增長,越來越多的圖書館推出了資源發現服務平臺,為讀者提供統一的檢索途徑,使讀者能夠方便、快捷地發現并獲取圖書館的數字資源。目前,國際市場上主流的統一資源發現系統有Serials Solutions公司的Summon系統、Ex Libris公司的Primo Central系統、EBSCO公司的EBSCO DiscoveryService(簡稱EDS)系統、OCLC的WorldCat Local系統以及Innovative Interfaces公司的Encore系統[1],這些系統既有內容提供商推出的,也有系統提供商研制的,均被全球眾多圖書館所引進。國內的圖書館有些引進了Summon、Primo等國外的產品,還有些采用了南京大學數圖實驗室和EBSCO公司聯合研發的Find+知識發現平臺,也有些采用超星公司的超星發現系統[2]等。……