陳豪 王澤珺
【摘 要】隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)已經(jīng)不再是匱乏資源,如何利用數(shù)據(jù)成為各界人士的關(guān)注點。在各界學者的研究中,個性化推薦算法無疑是主要研究領(lǐng)域之一,而且個性化推薦已經(jīng)廣泛應(yīng)用到新媒體、電商、游戲等領(lǐng)域。近年來使用頻率較多的個性化推薦算法有協(xié)同過濾的推薦算法、基于圖結(jié)構(gòu)的推薦算法和基于社交網(wǎng)絡(luò)的推薦算法等,文章對這3種個性化推薦算法做了綜述,闡述了它們的原理及用法。
【關(guān)鍵詞】個性化推薦;協(xié)同過濾;社交網(wǎng)絡(luò)推薦
【中圖分類號】TP391.3 【文獻標識碼】A 【文章編號】1674-0688(2019)02-0056-02
0 引言
隨著信息技術(shù)的快速發(fā)展,“互聯(lián)網(wǎng)+”、大數(shù)據(jù)時代的到來,消費者的每個行為甚至每個動作都能以數(shù)據(jù)的形式記錄下來。數(shù)據(jù)不再是稀缺資源,如何利用好這些數(shù)據(jù)已經(jīng)成為學者、商家們所關(guān)心的問題。特別是對于電商平臺而言,數(shù)據(jù)資源的利用已成為重中之重,關(guān)系到商家的生存。在數(shù)據(jù)的利用中,通過數(shù)據(jù)找出消費者的興趣愛好,并向其推薦可能感興趣的物品,即個性化推薦技術(shù)已經(jīng)成為商家的研究重點。
個性化推薦技術(shù)發(fā)展于20世紀90年代,現(xiàn)已經(jīng)廣泛應(yīng)用于書籍、視頻、電商、金融等領(lǐng)域。個性化推薦是一種技術(shù)方法,它可以向用戶推薦用戶可能感興趣的物品。現(xiàn)在較為常用的個性化推薦有基于內(nèi)存的協(xié)同過濾推薦、基于圖結(jié)構(gòu)的推薦和基于社交網(wǎng)絡(luò)的推薦。
1 基于協(xié)同過濾的個性化推薦
基于內(nèi)存的協(xié)同過濾又可以根據(jù)對象的不同分為基于用戶的協(xié)同過濾和基于項目的協(xié)同過濾。其基本思想是計算用戶間的相似度,按照相似度的高低進行排序,設(shè)定相似度閾值或設(shè)置最近鄰用戶閾值,選取出若干個用戶,讓這些用戶評價過的產(chǎn)品形成候選集合,并對這些項目進行加權(quán)計算得分并排序,將評分最高的項目推薦給用戶。如在一個系統(tǒng)中,用戶A與用戶B有相似的購買行為,那么就可以通過計算它們之間的相似度來說明用戶A與用戶B是相似用戶。而用戶A有過購買且用戶B沒有購買過的商品就可以被推薦給用戶B。基于內(nèi)存的推薦一般分為數(shù)據(jù)處理、相似度計算和產(chǎn)生推薦項目3個步驟。
1.1 數(shù)據(jù)處理
數(shù)據(jù)處理就是將數(shù)據(jù)變換成為用戶-項目評分矩陣的過程。用戶對項目的評分一般分為兩種:一是分值制,即用戶給項目打1~10分,分數(shù)越高表示對這個項目越滿意,常見的5個等級的喜歡程度(非常喜歡、喜歡、一般、不喜歡、非常不喜歡)也屬于分值制。二是0-1制打分,即用戶與該項目有過交互行為記為1,否則記為0。數(shù)據(jù)經(jīng)過處理后可得到一個m×n的用戶-項目評分矩陣R,如式(1)所示。
1.2 相似度計算
相似度的計算是協(xié)同過濾算法的核心部分。主流的相似度計算方法有余弦相似度和皮爾遜相關(guān)系數(shù)法。相比于距離相似度的計算方法,余弦相似度更注重兩個向量在方向上的差異,而非距離或長度。其計算公式如式(2)所示,式中Iuv表示用戶u與用戶間共同的評分項目。
皮爾遜相關(guān)系數(shù)法是用來衡量變量的線性關(guān)系,其不同于余弦相似度的地方在于它考慮了不同用戶對項目評分的標準。每個用戶打分的平均分是不同的,在計算相似度時,應(yīng)該盡可能地減小這些誤差。其計算公式如式(3)所示,式中Iuv代表兩名用戶共同評分項目的集合。
1.3 產(chǎn)生推薦項目
在計算好用戶間的相似度后,就可以選取目標推薦用戶的最近鄰用戶賦予權(quán)重,計算每個項目的得分并產(chǎn)生推薦。選取最近鄰用戶的方法一般有兩種:第一種是按照相似度進行排序,選取k個相似度最高的用戶作為最近鄰的用戶。第二種方法是設(shè)置一個閾值,相似度高于閾值的都選取為近鄰用戶。在選取好近鄰用戶后,便可將近鄰用戶有過交互的項目作為候選項目集合,通過賦予近鄰用戶權(quán)重,計算候選項目集合中每個項目的得分,并排序向目標用戶推薦。
2 基于圖結(jié)構(gòu)的個性化推薦
圖結(jié)構(gòu)是網(wǎng)絡(luò)結(jié)構(gòu)中一種特殊的結(jié)構(gòu),僅包含兩類圖節(jié)點及這兩類節(jié)點之間的連線,節(jié)點與線的集合構(gòu)成了圖。
假設(shè)存在一個無向圖網(wǎng)絡(luò),用G={V,E}表示,如果圖的定點集合V可以通過兩個互不相交的子集U和I表示,即 U∈V、I∈V、U∪I=φ。并且對于任意邊所連接的兩個定點u和i均有u∈U、i∈I,則稱圖G是一個二部圖結(jié)構(gòu)。
在應(yīng)用于推薦系統(tǒng)時,用戶類別用圖中的方框圖形代表,物品類別用圖中的圓形圖形代表。一般基于圖推薦的算法與協(xié)同過濾算法一樣,不在意推薦內(nèi)容的形式,可以處理非結(jié)構(gòu)化的數(shù)據(jù),可以應(yīng)用到圖書、電影、音樂等推薦場景中。
基于圖結(jié)構(gòu)的個性化推薦可以通過兩種方式來推薦物品。在第1種方法中,圖中用戶u對物品i的相近距離可以直接用于評估用戶u對物品i的評分。通過這種思維,在系統(tǒng)中為用戶推薦物品,可以直接用于評估用戶u對物品i的評分。通過這種思維,在系統(tǒng)中為用戶推薦物品,可以通過找到用戶u在圖中最近的物品。第2種方法則是將用戶或是物品間的相近距離看成它們之間的相似度權(quán)重,然后使用基于近鄰的推薦方法。
3 基于社交網(wǎng)絡(luò)的個性化推薦
近年來,社交網(wǎng)絡(luò)在移動互聯(lián)網(wǎng)快速發(fā)展,以新浪微博、微信、支付寶為首具有社交屬性的APP已經(jīng)成為手機必備。為此,學界、商界將目光聚集到社交網(wǎng)絡(luò)上,而基于社交網(wǎng)絡(luò)的推薦也得到快速發(fā)展。
社交網(wǎng)絡(luò)是一個維護朋友、家人關(guān)系的平臺,也是認識相同興趣者的一個平臺。在社交網(wǎng)絡(luò)中,我們每個人都是信息的生產(chǎn)者和消費者。基于社交網(wǎng)絡(luò)的推薦即建立在一個人們直接或間接相互關(guān)系之上。
基于社交網(wǎng)絡(luò)的推薦主要是依靠社交關(guān)系中一些指標來量化用戶與用戶間的相似度或者叫信任關(guān)系。通過相似度來判斷目標用戶的近鄰用戶,并將近鄰用戶感興趣的物品形成推薦候選集合。再根據(jù)用戶間的相似度進行加權(quán)計算物品的分值,并向目標用戶推薦感興趣的物品。在社交網(wǎng)絡(luò)的推薦中,計算用戶間相似度的方法是了解好友間的熟悉程度和興趣愛好程度。
兩個用戶的熟悉程度可以從共同的好友數(shù)量來度量,一般來說,共同好友越多,熟悉程度越密切。其計算如公式(4)所示。
兩個用戶的愛好相似度可以通過公式(5)來度量,其原理與計算用戶間的熟悉程度類似。
除了用戶間的相似度外,還可以根據(jù)用戶歷史記錄來預(yù)測目標用戶對該物品的喜好程度,即用戶u對物品i的興趣,可以通過公式(6)計算。
其中,out(u)是用戶u的好友集合,如果用戶u對項目i有過評分,當用戶喜歡該項目時rvi=1,否則rvi=0。
綜合以上因素,最終可以形成用戶的綜合相似度,其公式如(7)所示。
式中,wvu由兩部分構(gòu)成,一部分是用戶u和用戶v的熟悉程度,另一部分是用戶u和用戶v的興趣相似度。
在社交網(wǎng)絡(luò)的個性化推薦中,可以通過研究用戶與朋友之間的興趣及相似度來將朋友喜歡的物品進行加權(quán)排序推薦給目標用戶。
4 結(jié)語
個性化推薦算法的研究有重大的學術(shù)價值和商業(yè)價值。從個人角度來講,它可以幫助用戶快速找到可能感興趣的商品;從公司角度來講,它可以發(fā)現(xiàn)用戶的愛好,幫助用戶節(jié)省挑選商品的時間,讓用戶快速購買商品,讓商家獲得利潤。盡管個性化推薦算法在近些年有了很大的進步,但還有諸多需要改進之處,比如數(shù)據(jù)的稀疏性問題、冷啟動問題等。總的來說,個性化推薦算法的準確性和有效性還需要不斷提高,以適應(yīng)時代的發(fā)展。
參 考 文 獻
[1]劉青文.基于協(xié)同過濾的推薦算法研究[D].北京:中國科學技術(shù)大學,2013.
[2]常慧園.協(xié)同過濾推薦算法研究[D].蘭州:蘭州大學,2014.
[3]董坤.基于協(xié)同過濾算法的高校圖書館圖書推薦系統(tǒng)研究[J].現(xiàn)代圖書情報技術(shù),2011(11):44-47.
[4]馬宏偉,張光衛(wèi),李鵬.協(xié)同過濾推薦算法綜述[J].小型微型計算機系統(tǒng),2009(7):1282-1288.
[5]劉海峰.社交網(wǎng)絡(luò)用戶交互模型及行為偏好預(yù)測研究[D].北京:北京郵電大學,2014.
[6]張志軍.社交網(wǎng)絡(luò)中個性化推薦模型及算法研究[D].濟南:山東師范大學,2015.
[7]邢星.社會網(wǎng)絡(luò)個性化推薦方法研究[D].大連:大連海事大學,2013.
[8]溫瑞龍.基于社交網(wǎng)絡(luò)的個性化推薦系統(tǒng)研究與實現(xiàn)[D].杭州:浙江工業(yè)大學,2015.
[責任編輯:鐘聲賢]