冼遠清 張旭新
(廣東海洋大學數學與計算機學院 廣東省湛江市 524088)
隨著計算機技術和移動互聯網技術快速發展,數據日益增長,人們已經處于一個信息爆炸的時代。信息過載,信息碎片化嚴重,是生活中不可避免的普遍現象。如何在短時間內,給用戶提供其感興趣的信息,推薦系統應運而生。
推薦系統本質上是一種信息過濾技術,為用戶返回個性化的信息搜索服務。從信息過濾技術發展歷史來看,可以分為基于內容的過濾技術和協同過濾技術兩大類。基于內容的過濾規則一般采用匹配關鍵詞方式,選取匹配度高的內容,屬于傳統的信息過濾技術。協調過濾則是目前推薦系統中應用較多的技術,皮爾遜相關系數、余弦相似度算法、最近鄰算法、貝葉斯算法、K-means聚類算法等都應用到郵件過濾、電影推薦、電子商務、新聞推薦、文獻資料推薦、商場推薦、旅游推薦等相關領域中。推薦系統的核心是推薦算法,通過分析用戶的歷史數據信息,去預測用戶對未知項目信息的喜好程度。在商品推薦系統中,產品的屬性、客戶的興趣和偏好、同類客戶對產品的評價等三要素共同決定了客戶對產品的喜好程度,最終作為推薦系統考量的重要指標。
針對圖書推薦特定場景,利用爬蟲技術爬取基礎圖書數據,并進行數據清洗,采用Django框架技術進行Web應用開發,利用Vue框架實現前端展示,研究實現基于皮爾遜相關系數、余弦相似度算法的圖書推薦系統,為人們選取圖書提供參考,具有一定的現實意義。……