霍 華 馮博琴 趙深深
摘要:為提高信息檢索系統(tǒng)的性能,提出了一種多查詢數據融合與正相關反饋相結合的檢索算法.算法的核心思想是:利用基于向量表示的余弦相似度測度計算查詢與文檔之間的相似度,采用多查詢數據融合技術將多個檢索結果融合,以及從上一次檢索結果中取出前M個相關文檔和初始查詢一起構成新的查詢,將新查詢提交給系統(tǒng)并繼續(xù)下一次的檢索,如此反復,直到獲得滿意的結果.實驗結果表明,該算法相對于僅使用了多查詢數據融合技術的算法和僅使用了正相關反饋技術的算法,其平均準確率分別提高42.6%和23.17%.
關鍵詞:信息檢索;多查詢數據融合;正相關反饋
中圖分類號:TP366.8文獻標識碼:A文章編號:0253—987X(2005)08—0820—04