摘 要:網絡信息資源急速膨脹,促進企業信息化的建設迅速發展。海量企業信息迅速涌入網絡市場,使得通用搜索導致的數據準確性問題日漸突出,用戶難以對所需的企業信息進行快速定位與檢索。因此,如何更為快捷、高效、精準的獲取并提供專業的企業信息已成為亟待解決的問題。文章描述的“企業垂直搜索系統”,主要利用網絡爬蟲技術對互聯網中分散的企業信息進行結構化抽取與綜合管理,為用戶快速定位所需的企業信息,搭建起專業高效的企業信息檢索平臺。
關鍵詞:垂直搜索;企業信息;網絡爬蟲
中圖分類號:TP368.3 文獻標識碼:A 文章編號:1006-8937(2014)8-0019-03
互聯網最基礎的功能即提供信息。像谷歌、百度這類通用搜索引擎重點在于廣度搜索,搜索到的內容涵蓋范圍過于廣泛、繁雜,用戶難以從如此海量的信息中快速獲取自己所需的確切信息。尤其針對用戶的專業檢索需求時問題更為突出,難以滿足專業人士的檢索需求。因此, 應開發搜索質量更準確、相關性更復雜的搜索引擎,以追求在某一學科或某一行業領域有最佳的檢索效率及效果,垂直搜索引擎的應運而生,成為搜索引擎發展史上的一座里程碑。因此,垂直搜索引擎以其搜索結果的高效性、準確性和專業性等特點逐漸得到人們的青睞。
1 研究意義
信息時代的到來與中國經濟的高速發展,導致互聯網中企業信息數據量日趨加大,分散的企業信息使得通用搜索引擎非結構化數據搜索導致的數據準確性問題日漸突出。……