海南大學 李俊頡 李為民
基于自然語言檢索的網頁快照技術研究
海南大學 李俊頡 李為民
隨著互聯網技術的飛速發展,信息的發布與共享超越了時空的限制,互聯網信息的極速發展給用戶帶來海量的信息資源的同時,也帶來了尋找有效信息的困難.本文通過現有搜索引擎的比較研究,提出一套基于自然語言檢索的網頁快照技術.舉例Google的PageRank算法優化網頁排名、自然檢索和網頁快照技術相結合的檢索方式,提高了用戶檢索體驗。
搜索引擎;自然語言檢索;網頁快照;搜索引擎排序
自然語言檢索包括自然語言標引和自然語言提問查詢。自然語言是以源文檔中的內容作為源檢索標示,之后會提供給用戶接口使得用戶可以使用自然語言作為檢索內容并進行提問,完成檢索。
自然語言的檢索方法符合人們日常查找信息的思維模式。用戶無需學習布爾檢索式,拋開了有關關鍵詞和詞組的種種限制,不需牢記繁瑣的檢索規則,只要像平時提問一樣即可。
目前在中國,網絡信息資源總量呈爆炸式增長,且在全球信息檢索中的比例不斷提高,Google的圖書數字化計劃開展以來也使得數字化信息成為了愈來愈重要的資源形式。與此同時,用戶的結構也發生了變化,越來越多的普通用戶代替了原來專業技術用戶,隨之而來的檢索需求也趨向多元化發展,目前,大多數用戶即使不了解專業術語,也可以使用自然語言來對他們所需要的信息進行描述來達到二次檢索的效果。……