摘要:Nutch是一個優秀的基于Java的開放源碼搜索引擎,是以Lucene為基礎實現的搜索引擎應用程序,其工作流程和現代商業搜索引擎工作原理一樣:文本搜集、建立索引和查詢。Nutch0.9較好地處理了英文分詞,但對中文分詞處理還不夠完善。文章介紹了在Nutch0.9中實現索引及檢索的二分法,提出了改進中文分詞的方法。
關鍵詞:Nutch0.9;二分法;索引;檢索
計算機時代2009年4期
1《師道·教研》2024年10期
2《思維與智慧·上半月》2024年11期
3《現代工業經濟和信息化》2024年2期
4《微型小說月報》2024年10期
5《工業微生物》2024年1期
6《雪蓮》2024年9期
7《世界博覽》2024年21期
8《中小企業管理與科技》2024年6期
9《現代食品》2024年4期
10《衛生職業教育》2024年10期
關于參考網