

摘 要:隨著高校校園網建設逐步完善,校園網上的教學資源也越來越豐富,在校師生希望能夠在其中尋找所需的教學信息來幫助教學以及課余學習。本文針對這一現象,對開源搜索引擎Lucene和Nutch進行二次開發,并詳述開發步驟,最終實現針對教學資源的搜索引擎,使之滿足廣大師生的需求。
關鍵詞:Lucene;Nutch;教學資源;二次開發
中圖分類號:TP311.1文獻標識碼:A 文章編號:1673-8454(2010)21-0082-04
一、引言
近年來,隨著高校校園網建設逐步完善,校園網上的教學資源也越來越豐富,在校師生都需要在校園網上查找一些教學信息來幫助教學以及課余學習幫助,但是這些資源相對獨立,內容也比較分散。因此,筆者想在校園網上引入專門用于教學資源搜索的搜索引擎,使得學校師生能夠在眾多的教育資源中快速、準確地進行檢索。但是如果直接使用如百度、谷歌等的商業搜索引擎,又難以得到令用戶滿意的搜索結果。本文從教學資源用戶的需求考慮,在分析Lucene及Nutch的運作機制基礎上,研究并實現一個基于Lucene和Nutch的教學資源搜索引擎。
二、Lucene及Nutch簡介
1.Lucene
Lucene由一位資深全文索引/檢索專家DougCutting早先發布在自己的網頁www.lucene.com,后來發布在SourceForge,2001年底成為APACHE基金會jakarta的一個子項目。它是一個開放源代碼的全文檢索引擎工具包,它不是一個完整的全文檢索引擎,而是一個全文檢索引擎的架構,提供了完整的查詢引擎和索引引擎,部分文本分析引擎(英文與德文兩種西方語言)。Lucene的目的是為軟件開發人員提供一個簡單易用的工具包,以方便地在目標系統中實現全文檢索的功能,或者是以此為基礎建立起完整的全文檢索引擎。……