□ 吳廣印 / 中國科學技術信息研究所 北京 100038
分布式學術搜索引擎研制及其大數據應用*
□ 吳廣印 / 中國科學技術信息研究所 北京 100038
受“搜索引擎”流行的影響,目前大家已經習慣把圖書情報領域使用的“情報檢索系統”稱之為“學術搜索引擎”。無論從技術層面上還是應用層面上,盡管二者有很大的共同點,但也有很大差異。傳統的集中式的搜索引擎已經無法滿足飛速發展的信息爆炸和普及化的海量需求用戶,能夠提供“云服務”的分布式搜索引擎已經成為必然。文章主要內容包括學術搜索引擎涉及的關鍵技術、分布式搜索引擎的架構,以及分布式搜索引擎在大數據領域的主要應用價值三個方面,最后給出了分布式搜索引擎RMSCloud的典型應用介紹。
學術搜索引擎,分布式檢索,大數據應用,云服務,RMSCloud
情報檢索系統(information retrieval systems)是對情報資料進行收集、編輯、管理和檢索的系統。現代情報檢索系統是由電子計算機、通信網絡和終端設備等組成的自動化系統,可進行情報資料的收集、標引、分析、組織、存儲、檢索和傳播等工作。計算機情報檢索可分為數據檢索、文獻檢索、圖譜檢索、事件檢索等類型。傳統計算機情報檢索的服務方式又可分為三類:①定題情報服務。它是針對相對固定的用戶提出的要求,定期對新到文檔進行檢索,及時向用戶提供所需信息。②回溯情報檢索。它是根據用戶的要求,對過去某段時間內積累收藏的全部文獻,進行主題檢索,一般采用脫機批處理方式。……