王 亮,蘇 云
(1. 海軍指揮所,北京 100841;2. 江蘇自動化研究所,江蘇 連云港 222061)
?
基于Lucene的異構數據庫全文檢索技術
王 亮1,蘇 云2
(1. 海軍指揮所,北京 100841;2. 江蘇自動化研究所,江蘇 連云港 222061)
當前,我軍積累了部隊情況、裝備性能、海戰場環境等海量的作戰數據。這些數據數量巨大、格式多樣,且存儲在不同類型的數據庫中。如何快速準確地從這些數據中檢索出目標信息,成為一項非常重要的工作。Lucene是一個基于Java的開源的全文檢索庫,利用它可以方便地定制出符合用戶特定需求的搜索引擎。使用Lucene可研制出一種可配置的、支持不同類型數據庫的全文搜索引擎。
Lucene;異構數據庫;全文檢索;搜索引擎;索引
隨著現代互聯網的快速發展,網絡上存儲的信息量越來越大且呈指數增長。隨著計算機計算能力的日益增強、存儲設備存儲密度的日益提高、大規模集群日益普遍,人們處理大量數據的能力越來越強,“大數據”成為當前炙手可熱的話題。網絡成為現代人生活中不可或缺的一部分,在給人帶來便利的同時,也不可避免地造成了用戶難以快速獲取有效信息的問題[1]。如何使用搜索引擎快速地從浩瀚的網絡中獲取用戶需要的信息,成為一個重要研究課題。
當前,我軍積累了部隊情況、裝備性能、戰備工程、海戰場環境資料、水文氣象資料、情報資料等海量的作戰數據,并且數據種類和數量還在逐年增加。這些數據具有以下幾個特點:
1)數量較大。尤其是包括高清圖片、視頻等大容量數據,以及各種實時數據?!?br>