馬佳寧
(嘉興南湖學院,浙江 嘉興314001)
計算機網絡搜索引擎的出現令信息搜索更加方便、快捷、準確、全面,其可幫助用戶獲取各種產品、新聞、娛樂信息。目前,推薦算法存在信息過多、推薦不準確的問題。應將用戶圖像分析與內容功能相結合,結合用戶的歷史行為、訪問信息及興趣度等,更好地預測用戶的搜索行為及需求,有效提高推薦的有效性及用戶體驗,滿足用戶需求。近年來,隨著互聯網用戶數量的穩步增長,互聯網信息量呈爆炸式增長[1]。谷歌、百度及搜狗等搜索引擎對推薦算法進行了深入研究,根據用戶的點擊行為、搜索歷史及其他信息,推薦更符合其需求的搜索結果。應進一步研究計算機網絡搜索引擎的個性化智能推薦算法,將不同用戶的需求及偏好結合起來,提高搜索效率及用戶滿意度,推動互聯網的發展進步。
深度學習技術的廣泛應用進一步推動了搜索引擎及個性化推薦技術的創新發展,該技術具有自動分離功能,能夠分析用戶的搜索行為及興趣,為用戶提供更準確的搜索結果。
計算機網絡搜索引擎及個性化推薦技術已在各個行業中得到了廣泛應用。如,根據用戶興趣及操作在社交媒體平臺上向其推薦最合適的內容;在電子商務平臺上根據用戶的購買歷史、瀏覽行為及其他信息向其推薦最合適的產品[2]。
人們對個性化推薦算法進行了諸多研究,其中基于用戶行為的推薦算法是比較經典的。用戶行為包括搜索歷史、頁面停留時長、購買歷史記錄等,通過分析這些行為創建用戶簡檔,為其提供個性化的推薦結果。基于用戶行為的推薦算法包括基于過濾的協同推薦算法、基于內容的推薦算法及深度推薦算法。協同過濾算法基于用戶先前的評級數據,使用用戶相似性來計算用戶之間的比率,向其推薦對相似用戶的評級結果[3]。內容推薦算法基于項目描述信息,建議其計算項目相似度,以推薦具有明顯屬性的元素。
網絡上存在著大量的信息資源,要從其中獲取所需的信息并不容易。信息搜索是網絡的最基本功能之一。計算機網絡搜索引擎以快速、準確、全面的檢索方式為用戶提供豐富的信息資源,但要在巨大的信息海洋中想找到最有用的信息并不簡單,故需開發高效、精準、個性化的搜索引擎,通過推薦算法進行個性化推薦,滿足用戶不同的需求及興趣,提高用戶體驗及搜索效果。
用戶畫像與內容特征是個性化推薦算法的兩個重要因素(如圖1)。用戶畫像可以提供用戶的詳細描述,包括其年齡、性別、地區、職業、愛好及其他信息。通過分析用戶檔案,可以更好地了解其需求,提供更有針對性的推薦,提高用戶的上網體驗滿意度。內容特征基于搜索詞分析文本內容,包括關鍵字、主題及其他信息,有助于人們更好地理解文本內容,通過收集相關信息,如用戶的歷史搜索信息、瀏覽信息及行為數據,創建用戶檔案,通過主題提取、情感分析及關鍵詞提取等獲取文本內容特征。在推薦過程中,對用戶檔案及內容特征進行全面分析,獲得用戶需求及文本內容特征,選擇符合用戶需求及文本內容特征的高質量內容提出建議。

圖1 個性化推薦算法關系圖
用戶畫像是對特定用戶或用戶組進綜合分析,包括行為數據、興趣偏好及其他數據[4]。用戶畫像是個性化推薦算法的基礎,構建算法需考慮以下幾個方面:用戶基本信息采集,這是用戶最基本的屬性,對推薦算法來說非常重要。收集用戶行為數據,以反映消費者興趣、偏好、行為習慣及其他方面的特征。消費者興趣偏好分析,通過分析、提取消費者行為數據,確定其興趣偏好,如對哪些內容具有更高的評級(如圖2)。基于上述收集及分析建立用戶畫像,提供計算機個性化推薦。這是一個迭代過程,需要不斷更新改進,以適應用戶不斷變化的興趣及需求[5]。

圖2 用戶畫像構建過程
內容特征提取是在計算機網絡搜索引擎中分析提取與內容相關聯的特征信息,采用基于TF-IDF算法的文本分類方法提取特征信息,具體步驟見圖3,具體模塊解釋如下:

圖3 內容特征的提取過程
語言處理:在搜索引擎中對每篇文章或網站進行分段,刪除停止語及特殊字符,將每個單詞視為一個特征。
特征選擇:根據文本的分類要求選擇有意義、有特色的特征詞。
計算TF-IDF值:對每個特征詞計算文本中的頻率TF及其反向文檔頻率IDF值,將頻率TF和反向文檔頻率IDF值相乘,得到該特征詞的TF-IDF權重值。
歸一化處理:對所有特征詞的TF-IDF權重值進行歸一化,以避免出現極值對特征權重產生影響。
通過以上步驟獲取每篇文章或網站的TF-IDF向量,進一步描述其特征信息,將用戶瀏覽及搜索歷史與內容特征相結合,計算其興趣度,根據其興趣水平向用戶推薦相關信息。實驗結果表明,該算法可有效提高搜索引擎的推薦性能及用戶滿意度。
為了計算用戶興趣,需要將瀏覽及搜索歷史記錄與內容功能相結合,對用戶進行分類,分析用戶的個人信息、行為偏好及興趣愛好等,建立用戶畫像。將用戶分為多組,了解每個用戶的利益及需求,使用協作過濾算法查找與目標用戶有類似興趣的用戶,提取其搜索及點擊行為數據,計算相似度,得到項目列表與目標用戶的興趣相似。在具體過程中,采用基于余弦相似度的協作過濾算法,將用戶活動、賬戶中受歡迎的項目納入相似度計算中,增加推薦結果的準確性及實用性,通過改進算法,引入基于時間衰減的權重計算方式,避免歷史數據對推薦結果的影響,提高推薦算法的易用性。
計算機搜索引擎個性化推薦算法需要考慮諸多因素,如搜索用戶意圖及偏好、相關搜索結果及可信度、計算速度、準確性等。還要與其他搜索引擎功能及服務相協調集成,以提高性能及用戶體驗。
指出了計算機網絡搜索引擎在獲取信息方面存在的問題,提出進一步研究個性化推薦算法。這其是一種更準確、快速、有效的算法,將用戶圖像與內容功能相結合,對用戶興趣度及內容特征進行綜合分析,提高個性化推薦效果及用戶體驗。通過提供準確的推薦服務,大大提高搜索效率及用戶滿意度。與傳統的搜索引擎相比,在一定程度上解決了大量信息造成的搜索困難,可為用戶提供個性化的搜索結果。該算法具有一定的實用價值,可應用于廣告推薦、商品推薦中。個性化推薦算法已在不同類型的網站中得到了廣泛使用[4]。如百度、知乎、豆瓣等網站,其通過搜索歷史記錄及關鍵字、分析用戶行為及社會關系與分析情感及建立主題模型進行推薦,是現代計算機科學領域的研究熱點之一。
隨著互聯網信息的不斷擴展及用戶需求的不斷變化,應繼續優化計算機網絡搜索引擎個性化智能推薦算法,深入研究用戶數據收集及處理技術,提高推薦算法的準確性,使推薦結果滿足用戶的真實需求。進一步研究算法模型,深化算法理論,提高算法的可解釋性及可擴展性,使推薦系統更加穩定可靠。隨著物聯網技術的不斷發展,需探索基于物聯網數據及用戶行為數據的常見推薦算法,以提高推薦效率及用戶體驗。嘗試在電子商務、新聞信息、社交網絡等領域應用個性化推薦算法,加強深度學習、群體智能、推薦系統等新技術及方法的應用,提高搜索引擎的智能推薦水平。