宋天勇,趙 輝,鄭山紅,王國春
(長春工業大學計算機科學與工程學院,長春130012)
Internet信息的指數增長所導致的“信息迷航”和“信息過載”已經日益制約人們高效地使用網絡信息,為更好地適應Internet的發展,個性化推薦服務應運而生[1]。個性化推薦服務根據用戶興趣模型主動向用戶推薦網絡信息,滿足用戶的個性化需求,便于用戶高效地利用網絡資源。用戶興趣模型是個性化推薦服務的核心,用戶興趣模型的構建可分為顯式和隱式兩種。顯示的用戶興趣模型構建需要用戶參與,隱式的用戶興趣建模則是系統通過分析用戶的瀏覽歷史自動構建用戶興趣模型。用戶興趣模型的表示方式主要分為:基于關鍵詞模型、基于概念和概念層次模型、基于本體技術的語義模型[1,2]。用戶興趣模型的更新機制是保證用戶興趣模型長期有效的關鍵,用戶興趣建模的質量和更新機制的合理性制約著個性化服務的質量。
目前一些學者將用戶興趣分為長期興趣和短期興趣,通過對兩種興趣進行不同的處理提高推薦的準確率[2,3];宋艷娟等[4]提出一種基于文檔結果和網頁興趣權重的TF.IDF算法,該算法能有效地對網頁特征詞進行提取;張玉連等[5]在提取特征詞時提出TF.IDF.IG算法,以詞語的信息增益作為一個特征詞表示一個因子,衡量特征詞在文本集合中分布比例在量上的差異。該方法能獲得更有價值的特征詞;劉鑫等[6]設計了時間元函數、并利用二次曲線對該……