摘 要:通過建立網(wǎng)頁資源庫,結(jié)合Spider技術(shù)、內(nèi)容分析技術(shù)、引入用戶數(shù)據(jù)項(xiàng)和替換抽取指令編輯器等,提供和定制可視化通用性較強(qiáng)的互聯(lián)網(wǎng)信息采集系統(tǒng),能定期自動跟蹤相關(guān)網(wǎng)站或網(wǎng)頁,進(jìn)行比較分析、抽取、規(guī)整入庫、分類等,從互聯(lián)網(wǎng)上獲取所需信息。
關(guān)鍵詞:互聯(lián)網(wǎng)信息采集系統(tǒng);網(wǎng)絡(luò)信息挖掘;Spider
中圖法分類號:TP393
文獻(xiàn)標(biāo)識碼:A
文章編號:1001—3695(2005)01—0187—03