孫禮輝
(安徽商貿職業技術學院 經濟貿易系,安徽蕪湖241002)
基于地理位置和協同過濾的移動推薦算法
孫禮輝
(安徽商貿職業技術學院 經濟貿易系,安徽蕪湖241002)
針對當前移動推薦中存在的“信息過載”和推薦質量不高等問題,提出一種基于地理位置和協同過濾相結合的移動推薦算法。算法根據用戶與物品間距離對被推薦物品進行預過濾,以縮小推薦范圍,并根據用戶間的相似度,對預過濾的物品進行偏好預測推薦。實驗證明,該算法明顯優于基于用戶協同過濾推薦算法(UserCF)和基于位置的最近距離均值推薦方法(DARS)。
地理位置;協同過濾;移動推薦;O2O
隨著互聯網技術的迅速發展及移動通信設備的普及,我國手機用戶的數量快速增加。工業和信息化部公布的數據顯示,2016年1月我國移動互聯網用戶總數達到 9.8億[1],超過傳統的 PC互聯網用戶數量,這意味著移動電子商務也隨之成為電子商務的主流。越來越多的企業進入移動電商領域,移動互聯網信息服務的內容劇增,而同時由于移動設備處理能力的限制,出現了“移動信息過載”的問題[2]。
移動推薦系統是解決這一問題的重要手段,通過優化移動推薦算法,可以對移動信息進行科學排序,有效幫助用戶進行購買決策。O2O電子商務,即線上與線下相結合的一種電子商務模式,已成為移動電子商務的一個重要發展方向。用戶在線上搜索感興趣的物品后到線下消費這一過程具有很強的地理位置屬性,產品推薦需要考慮到用戶所在的位置及物品與用戶間距離做出人性化的推薦。將地理位置信息引入移動推薦算法中,可以更有效地為O2O用戶推薦所需要的產品,對改進用戶體驗具有重要意義。
本文提出一種結合協同過濾技術,將地理位置融入移動推薦系統的算法,以彌補傳統算法在推薦效果上的不足,并解決以下問題:1)按照與用戶間距離的遠近對被推薦的物品進行預處理,減少推薦算法的計算量,提高推薦算法的效率;2)使新用戶和新物品都有被推薦的機會,規避冷啟動問題。
1.1移動推薦思想
在移動推薦的場景中,用戶是移動的,而物品是固定的,物品的位置可以直接獲得,用戶的位置可以通過移動設備獲得(如運營商的基站定位、GPS定位等)。從地理位置來看,當用戶與物品間距離較近時,用戶接觸和選擇物品的概率較大,同時選擇某物品的用戶也主要集中在該物品附近[3]。據此,本文以移動用戶為推薦對象,選擇與用戶間距離在一定范圍內的物品作為推薦目標,形成推薦場景。
首先,獲取某用戶u的地理位置,以此位置為圓心,以一定距離為半徑的圓作為該用戶的有效推薦區域,并實時統計有效推薦區域內的物品,形成預推薦的目標物品i的集合。接著,對預推薦集合中所有未評過分的目標物品,利用UserCF預測u對i的評分,并將u 與i距離的影響考慮在內進行評分修正,使距離更近的“用戶—物品對”的評分更高。最后,根據u對所有預推薦的目標物品評分的高低,取評分較高的N個物品進行NTop推薦,形成用戶u的物品推薦列表。考慮到用戶是移動的,物品推薦列表會按照特定周期更新,以保證推薦的時效性。
1.2相關定義
為了更好地描述提出的推薦方法,定義以下相關的概念。
定義1:有效推薦距離D。某用戶的有效推薦區域的半徑即為該用戶的有效推薦距離。
定義2:預推薦集P。與用戶地理位置距離小于有效推薦距離的所有物品組成的集合稱為該用戶的預推薦集。預推薦集是對單個用戶而言的,即每一個用戶對應一個預推薦集。
1.3相關計算公式
1.3.1協同過濾
協同過濾包括ItemCF和UserCF兩種。ItemCF是基于物品之間的相似性做出的物品推薦,而UserCF是基于用戶之間的相似性做出的物品推薦。本文采用UserCF算法為用戶推薦與之相似的用戶感興趣的產品。用戶間的相似度采用當前較為流行的皮爾森相關系數(Pearson correlation coefficient)來計算。用戶u和用戶v之間的相似度為

其中:Rui表示用戶u對物品i的評分;Rvi表示用戶v對物品i的評分;iuv表示用戶u和用戶v都評過分的物品集;s(u,v)表示用戶u和用戶v間的相似程度,數值越大表示相似程度越高,反之,相似程度越低。
1.3.2預測評分
用戶u對物品i的預測評分可以通過式(2)的計算得到。

其中,iList表示對物品i評過分的用戶集合。
1.3.3修正評分
根據用戶u與物品i間的實際距離,對預測評分進行修正,修正公式為

1.4推薦算法描述
基于地理位置和協同過濾的移動推薦算法(LBCF)描述如下。
輸入:用戶集合U、物品集合I、用戶對物品歷史評分集R、用戶位置、物品位置和有效推薦距離D。
輸出:每個用戶的物品NTop推薦列表List。
(1)取出用戶集合U中的某個用戶u和物品集合I中所有物品的位置,并根據有效推薦距離D計算出用戶u的預推薦集P。
(2)從歷史評分集R中取出用戶u的評分記錄,形成用戶u的物品評分列表uList。
(3)取出預推薦集P中某物品i,如果u對i有過評分,則直接跳到步驟(7);如果沒有,則通過步驟(4)~(6)進行u對i的評分預測。
(4)從歷史評分集R中取出對物品i評過分的用戶,形成物品i所有歷史評分列表iList。
(5)對iList中每個評分用戶ui,都從R中獲取其評分記錄列表uiList,并根據式(1)計算出用戶u和ui相似度s(u,ui)。
(6)以iList中用戶ui對物品i的評分為值,以用戶u 和ui的相似度為權重,利用式(2)計算用戶u對物品i的預測評分。
(7)對預推薦集P中所有物品都執行步驟(3)~(6),使用戶u對P中的物品均有相應評分。
(8)根據用戶u與預推薦集P中每個物品的距離,利用公式(3)進行評分修正。
(9)根據修正后的評分高低選取NTop個物品進行推薦,形成用戶u的推薦列表。
(10)對用戶集合U中所有用戶都執行步驟(1)~(9),最終獲得推薦列表List,完成推薦。
為了對文中提出的推薦算法的效果進行驗證,我們進行如下實驗。
2.1數據集
實驗數據來自某團購網站2014年8月—2016 年3月的銷售數據。通過對該團購網站會員和物品進行篩選預處理,保留活躍的用戶和熱門的物品,并保證每個用戶至少對一個物品有評分。所形成的數據集包括2 527個用戶對798個團購物品的13 742條團購記錄,數據稀疏度為68.1%。每條記錄中都包括某個用戶購買某個物品的時間、交易產生時的GPS定位信息和用戶的評分信息,其中評分范圍是1~5分。
2.2評價標準
本文中的推薦算法是基于評分計算的,并按照評分的高低進行NTop推薦,實驗結果采用平均絕對誤差MAE(mean absolute error)作為評價標準,記為M。MAE通過計算預測評分與真實評分的平均偏差來度量推薦結果的推薦精度,M值越小說明偏差越小,預測值越準確,推薦精度越高[5]。MAE計算方法為

其中,N表示預測樣本的數量,pi表示第i個樣本的預測評分,qi表示第i個樣本的真實評分。
2.3實驗設計與結果分析
首先將數據集劃分為訓練集和測試集,數據劃分比例為8∶2。用訓練集進行算法模型的訓練,在測試集上進行驗證,并用MAE進行結果評價。同時用UserCF 和DARS作為對比算法進行對比實驗。然后進行有效推薦距離D值的確定:取不同的有效推薦距離D,在訓練集上進行基于地理位置和協同過濾的移動推薦算法(LBCF)訓練,并在測試集上進行測試,得到結果如表1所示。從表1可知,當D取1 000 m時,評分預測精度最高,因此在實驗中D均取此值。

表1 不同有效推薦距離D值的LBCF推薦結果
參數ρ取不同值時的對比實驗結果如圖1所示。圖1中,UserCF與LBCF中協同過濾部分采用相同的相似度計算方法,DARS和LBCF中的有效推薦距離D值也取1 000 m。

圖1 參數ρ在不同取值情況下各算法的MAE
由圖1可知,在設定ρ為0.85時,本文提出的LBCF的推薦精度明顯優于UserCF和DARS。
為了給移動用戶帶來更好的推薦體驗,本文根據O2O電商特點,在現有算法的基礎上,將地理位置信息引入移動推薦算法中,并結合了UserCF算法來改善移動推薦算法的效果。
與傳統的協同過濾推薦相比,保留高交互概率的物品并進行推薦計算的推薦思想可避免大規模相似度計算,大大縮小了推薦范圍,提高了計算效率和推薦效果。與傳統基于位置的移動推薦相比,本文中的推薦利用協同過濾思想對基于位置的推薦進行優化,具有更高的推薦精度。
下一步需要進行的改進工作包括移動用戶位置的歷史軌跡、移動用戶位置的預測和基于預測位置的移動推薦。
[1]工業和信息化部.2016年1月份通信業經濟運行情況[EB/OL].(2016-03-1)[2016-04-1].http://www.miit. gov.cn/newweb/n1146285/n1146352/n3054355/n3057511/ n3057518/c4652953/content.html.
[2]WANG L C,MENG X W,ZHANG Y J.A Cognitive Psychology-based Approach to User Preferences Elicitation for MobileNetworkServic[J].Acta Electronica Sinica,2011,39(11):2547-2553.
[3]李貴,陳盛紅,韓子陽.基于協同過濾的位置感知推薦[J].計算機科學,2014,41(11):340-346.
[4]RICCI F,ROKACH L,SHAPIRA B,et al.Recommender SystemsHandbook[M].Berlin:Springer Press,2011:107-144.
[5]HERLOCKER J L,KONSTAN J A,TERVEEN L G,et al. Evaluating Collaborative Filtering Recommender Systems [J].ACM Transactions on Information Systems,2004,22 (1):5-53.
【責任編輯梅欣麗】
A Mobile Recommendation Algorithm Based on Geographic Location and Collaborative Filtering
SUN Lihui
(Department of Economy and Trade,Anhui Business College,Wuhu 241002,China)
With the rapid development of O2O E-business,mobile recommendation algorithm became a research focus.Aiming at problems such as“information overload”and poor recommendation quality existing in the current mobile recommendation,the paper put forward a mobile recommendation algorithm based on the combination of geographic position and collaborative filtering.In this algorithm,recommended objects were pre-filtered according to the distance between a user and the object so as to narrow the recommendation scope,and then preference prediction were recommended to the pre-filtered objects according to similarity among users.Experimental results showed that the results obtained through this algorithm obviously prevailed over results from the userbased collaborative filtering recommendation algorithm(UserCF)and the position-based minimum distance average recommendation method(DARS).
geographic location;collaborative filtering;mobile recommendation;O2O
TP311
A
2095-7726(2016)09-0030-04
2016-05-13
安徽省高等學校省級質量工程——大學生創客實驗室建設計劃項目(2015ckjh139);安徽省高校優秀青年人才支持計劃重點項目(gxyqZD2016489);安徽商貿職業技術學院科研項目(2016KYZ04)
孫禮輝(1982-),男,安徽巢湖人,講師,碩士,研究方向:電子商務。