999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于圖網(wǎng)絡(luò)嵌入及BPR的推薦算法

2021-06-28 11:39:24郝志峰蔡瑞初
關(guān)鍵詞:排序用戶信息

吳 彪,溫 雯,郝志峰,2,蔡瑞初

(1.廣東工業(yè)大學(xué) 計(jì)算機(jī)學(xué)院,廣東 廣州 510000; 2.佛山科學(xué)技術(shù)大學(xué) 數(shù)學(xué)與大數(shù)據(jù)學(xué)院,廣東 佛山 528225)

0 引 言

現(xiàn)有的推薦算法主要基于用戶的歷史行為,卻沒(méi)有充分解決兩個(gè)關(guān)鍵性的問(wèn)題:①用戶直接行為的稀疏性以及用戶對(duì)于不同項(xiàng)目的喜好之間的差異性;②在模型中融合各方面的信息,拓展用戶的行為模式。相比于用戶的信息而言,獲取項(xiàng)目的信息則顯得更加容易,如商品的屬性。對(duì)于用戶而言,喜歡的項(xiàng)目往往具有聯(lián)系。因此,利用項(xiàng)目的信息輔助推薦具有重要意義。不同的項(xiàng)目對(duì)于用戶的吸引力存在差異性,如何有效刻畫(huà)項(xiàng)目之間的關(guān)系以及用戶對(duì)其的喜好程度,是一項(xiàng)具有挑戰(zhàn)性的工作。

本文利用用戶-項(xiàng)目的交互記錄和項(xiàng)目的屬性信息,從用戶的相對(duì)喜好的角度出發(fā),設(shè)計(jì)了一個(gè)融合多種復(fù)雜共現(xiàn)信息的框架,將傳統(tǒng)的推薦問(wèn)題轉(zhuǎn)化為異構(gòu)網(wǎng)絡(luò)的節(jié)點(diǎn)嵌入問(wèn)題,同時(shí)將項(xiàng)目的多種信息轉(zhuǎn)化為子圖,從子圖內(nèi)部找出真正具有相近意義的節(jié)點(diǎn),進(jìn)而將稀疏的特性替換成連續(xù)的向量表達(dá)。根據(jù)子圖節(jié)點(diǎn)的不同組合,關(guān)注用戶的多種行為模式,而不局限于關(guān)注用戶的點(diǎn)擊行為。對(duì)于圖而言,通過(guò)不同的節(jié)點(diǎn)跳轉(zhuǎn),引入用戶的間接行為,同時(shí)刻畫(huà)節(jié)點(diǎn)之間相似度的差異,并利用Bayesian personal ranking(BPR)[1]優(yōu)化準(zhǔn)則和隨機(jī)梯度下降算法進(jìn)行模型求解。最后,在多個(gè)數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果表明,本文提出的方法具有更好的推薦效果。

1 相關(guān)工作

推薦算法主要包括以下幾個(gè)方面的技術(shù):

(1)傳統(tǒng)的基于矩陣分解的方法:早期的推薦系統(tǒng)工作主要是基于直接的用戶-物品交互記錄進(jìn)行推薦,但由于交互記錄的高度稀疏性,使得推薦的性能受到一定限制。因此,各種不同的降維方法被用來(lái)解決這個(gè)問(wèn)題,如非負(fù)概率矩陣分解(NMF)[2]、概率矩陣分解(PMF)[3]等,這些方法有助于產(chǎn)生更好的推薦性能,但是它們必須經(jīng)過(guò)復(fù)雜的矩陣分解步驟。為增強(qiáng)項(xiàng)目的表示,Liang等[4]提出用項(xiàng)目共現(xiàn)對(duì)用戶-項(xiàng)目矩陣的分解進(jìn)行正則化,其原理相當(dāng)于在矩陣分解的聯(lián)合目標(biāo)下學(xué)習(xí)用戶和項(xiàng)目的向量化表示,雖然該模型利用了用戶-項(xiàng)目的交互信息和項(xiàng)目-項(xiàng)目之間的共現(xiàn)信息,但是其將所有具有共現(xiàn)的項(xiàng)目進(jìn)行等價(jià)對(duì)待,無(wú)法體現(xiàn)差異性。另一方面,用戶與項(xiàng)目之間的行為還包括間接但更復(fù)雜的形式(例如,“購(gòu)買(mǎi)產(chǎn)品”、“選擇項(xiàng)目標(biāo)簽”或“回答在線問(wèn)題”),這使得用戶的反饋具有多樣化、異構(gòu)性且未必顯而易見(jiàn)等特征。相對(duì)于稀疏的顯式行為而言,用戶的隱式行為則顯得更加稠密。而上述方法僅僅根據(jù)用戶的顯式行為進(jìn)行學(xué)習(xí),并沒(méi)有直接利用隱式行為優(yōu)化其排名。

(2)基于個(gè)性化排序的方法:基于個(gè)性化排序是推薦系統(tǒng)中的一類(lèi)重要技術(shù),其主要思想是將節(jié)點(diǎn)之間傳統(tǒng)的直接關(guān)系轉(zhuǎn)變?yōu)橄鄬?duì)關(guān)系。Rendle等[1]提出基于個(gè)性化排序的算法,用邏輯回歸算法,將個(gè)性化排序融入到推薦系統(tǒng)中,利用隱式反饋解決推薦問(wèn)題,但其局限于用戶的喜好,沒(méi)有利用項(xiàng)目的其它信息。WARP[5]采用權(quán)重近似化,對(duì)節(jié)點(diǎn)進(jìn)行排序。由于用戶的直接行為的高度稀疏性,Yang等[6]在圖上進(jìn)行隨機(jī)游走,為每個(gè)用戶獲取相鄰項(xiàng)之間的高階信息,引入用戶的間接行為,隨后將其轉(zhuǎn)化為用戶對(duì)項(xiàng)目的喜好程度的差異性,采用個(gè)性化排序算法學(xué)習(xí)其向量表示,但是其僅關(guān)注用戶間的行為,使得推薦局限于熱門(mén)的項(xiàng)目。于洪等[7]結(jié)合多種信息獲得個(gè)性化權(quán)重得分,提出一種解決新項(xiàng)目冷啟動(dòng)問(wèn)題的推薦算法。戴琳等[8]則利用多種信息,將個(gè)性化排序用于餐館推薦中,獲得更好的推薦效果。

(3)圖是一種天然的表示用戶-項(xiàng)目交互信息的結(jié)構(gòu),因此基于圖模型的推薦算法受到廣泛關(guān)注。基于圖的推薦方法的主要思想是通過(guò)用戶-項(xiàng)目的記錄建立圖的關(guān)聯(lián),然后應(yīng)用隨機(jī)游走技術(shù)捕獲潛在的信息和生成項(xiàng)目排序。Ming等[9]提出BiNE網(wǎng)絡(luò),將用戶-項(xiàng)目的交互行為視為二分圖,并在二分圖上進(jìn)行高階節(jié)點(diǎn)的映射。Cai等[10]在二分圖的基礎(chǔ)上融合用戶的信息,并用隨機(jī)游走技術(shù)生成用戶-項(xiàng)目對(duì),學(xué)習(xí)用戶、項(xiàng)目的向量表示。隨著Skip-gram[11]思想的發(fā)展,部分工作將一組項(xiàng)目視為單詞序列,并對(duì)用戶-項(xiàng)目交互記錄應(yīng)用skip-gram negative sampling(SGNS)來(lái)學(xué)習(xí)每個(gè)項(xiàng)目的嵌入向量[12,13]。王娜等[14]用SGNS模型分析用戶播放視頻行為,提取視頻的特征,并用聚類(lèi)算法建模用戶興趣分布矩陣。Vasile等[15]在此基礎(chǔ)上加入異構(gòu)信息,豐富該模型。其它類(lèi)似的在異構(gòu)圖上學(xué)習(xí)節(jié)點(diǎn)信息的工作還包括Cen等的研究[16-18]。

2 COIR模型

我們著重關(guān)注帶有項(xiàng)目信息的場(chǎng)景下,學(xué)習(xí)用戶/項(xiàng)目的潛在語(yǔ)義表示,從而進(jìn)行推薦。用戶-項(xiàng)目的直接交互行為能夠提供顯式的信息,而用戶/項(xiàng)目的間接交互行為等其它信息能夠提供隱式的信息。直覺(jué)上,相似的項(xiàng)目往往會(huì)被同一用戶所喜好,但是,用戶對(duì)相似的項(xiàng)目的喜好程度具有一定的差異性,具體體現(xiàn)為用戶是否與該項(xiàng)目具有交互記錄。本節(jié)中,首先給出問(wèn)題的形式化描述及相關(guān)符號(hào)約定(如表1所示),然后給出模型的細(xì)節(jié)和優(yōu)化算法。

表1 符號(hào)及其定義

2.1 問(wèn)題定義

給定用戶的點(diǎn)擊信息及項(xiàng)目的屬性信息,如圖1所示,我們的目標(biāo)是為用戶推薦其可能感興趣的項(xiàng)目。由于項(xiàng)目-項(xiàng)目之間的連接存在多種形式,如通過(guò)類(lèi)別標(biāo)簽進(jìn)行連接,或者通過(guò)用戶進(jìn)行連接。由圖1我們可以觀察到:

(1)兩個(gè)項(xiàng)目之間具有邊,代表它們具有一定的相似度。如圖1所示,項(xiàng)目1和項(xiàng)目2都具有health這個(gè)標(biāo)簽,即項(xiàng)目1和項(xiàng)目2之間有邊存在,代表它們屬于同種類(lèi)別。

(2)相關(guān)聯(lián)的項(xiàng)目之間,其相似性具有一定的差異性,該差異性在推薦系統(tǒng)中體現(xiàn)為用戶對(duì)于不同的項(xiàng)目的喜好程度。如圖1所示,項(xiàng)目1、項(xiàng)目2、項(xiàng)目3都具有共同標(biāo)簽health,但是通過(guò)用戶-項(xiàng)目子圖可以發(fā)現(xiàn),項(xiàng)目2和項(xiàng)目3被更多的用戶所同時(shí)喜愛(ài),因此,相對(duì)于項(xiàng)目1、項(xiàng)目2和項(xiàng)目3之間的相似度更好。

(3)在帶項(xiàng)目屬性的行為數(shù)據(jù)中,通過(guò)節(jié)點(diǎn)之間的跳轉(zhuǎn),用戶可以找到其喜愛(ài)的商品的類(lèi)似商品或者具有相似行為的用戶所喜愛(ài)的商品。如圖1所示,僅僅通過(guò)用戶-項(xiàng)目的交互記錄(即圖中的實(shí)線邊),由于用戶2沒(méi)有和其它用戶具有相似行為,很難對(duì)其進(jìn)行精準(zhǔn)推薦,但可以通過(guò)“項(xiàng)目-標(biāo)簽-項(xiàng)目”的連接,能夠找到相似的項(xiàng)目,從而定位用戶2的興趣。

(4)用戶-項(xiàng)目的直接交互行為很稀疏,但是間接的用戶-項(xiàng)目的行為則稠密很多。如圖1所示,用戶-項(xiàng)目之間的二分圖的邊的稀疏性表明了直接交互行為很少。另外一方面,直接相連的用戶-項(xiàng)目之間相近程度明顯高于非直接相連的用戶-項(xiàng)目,而間接相連的用戶-項(xiàng)目的相似度明顯大于完全不相連的用戶-項(xiàng)目之間的相似度。對(duì)于用戶3而言,其明顯更加喜愛(ài)項(xiàng)目2,而非項(xiàng)目1。

圖1 融合項(xiàng)目屬性信息的u-i圖實(shí)例

結(jié)合上述觀察,為融合不同的方式,我們通過(guò)構(gòu)建圖網(wǎng)絡(luò)來(lái)進(jìn)行描述。對(duì)于具有用戶的點(diǎn)擊信息及項(xiàng)目的屬性信息的推薦任務(wù),可以轉(zhuǎn)化為如下形式化的圖網(wǎng)絡(luò)上的節(jié)點(diǎn)嵌入問(wèn)題。

定義項(xiàng)目子圖GI=,其中I={I1,…,IN}表示項(xiàng)目的節(jié)點(diǎn),EI表示為項(xiàng)目-項(xiàng)目之間的關(guān)聯(lián)邊,具體可體現(xiàn)為具有相同的標(biāo)簽或與同一用戶具有共同交互記錄。

定義用戶-項(xiàng)目子圖GUI=,其中U=,I={I1,…,IN},EUI表示用戶-項(xiàng)目之間的交互信息。

如圖2所示,對(duì)于給定的推薦場(chǎng)景,其包括項(xiàng)目子圖GI以及用戶-項(xiàng)目的子圖GUI,我們的目標(biāo)是在其共同組成的圖網(wǎng)絡(luò)中學(xué)習(xí)用戶和項(xiàng)目在同一向量空間中的低維向量表示,從而找到用戶的興趣,對(duì)用戶推薦其感興趣的項(xiàng)目。

圖2 COIR模型

2.2 模 型

基于用戶-項(xiàng)目之間的交互信息,我們將這兩個(gè)子圖構(gòu)建為一個(gè)異構(gòu)信息網(wǎng)絡(luò),從而在融合各方面的共現(xiàn)信息框架下學(xué)習(xí)用戶/項(xiàng)目的語(yǔ)義表示,以下簡(jiǎn)稱(chēng)為COIR(co-occurrence information ranking algorithm)。

根據(jù)2.1節(jié)所述的觀察,我們的目標(biāo)是基于圖網(wǎng)絡(luò)的節(jié)點(diǎn)嵌入表達(dá)學(xué)習(xí),結(jié)合Skip-gram模型的思想和個(gè)性化排序,分別在兩個(gè)子圖上定義其相關(guān)的損失函數(shù),定義為L(zhǎng)I,LUI,這兩個(gè)損失函數(shù)通過(guò)共同的項(xiàng)目進(jìn)行連接,具體的損失函數(shù)如下

(1)

式中:α是體現(xiàn)每一項(xiàng)重要程度的參數(shù),θ和φ分別是用戶和項(xiàng)目的特征向量表示,λ為正則化系數(shù)。

對(duì)于項(xiàng)目子圖中的損失函數(shù)LI,基于2.1節(jié)觀察(1),觀察(2)可知:給定項(xiàng)目i,假設(shè)項(xiàng)目j是項(xiàng)目i的k階鄰居,則

(2)

式中:wij表示的是該項(xiàng)的置信度。

顯然,根據(jù)前面的觀察可得,項(xiàng)目i與項(xiàng)目j被越多的用戶共同喜歡,置信度越高,且置信度與節(jié)點(diǎn)j距離節(jié)點(diǎn)i的距離相關(guān)。因此,我們將其定義為

(3)

式中:Ieui是一個(gè)指示器,指示用戶u與項(xiàng)目i是否有交互記錄。

為了將節(jié)點(diǎn)網(wǎng)絡(luò)相似度結(jié)合到模型中,可以將LI中的條件概率設(shè)計(jì)為

(4)

顯然,計(jì)算p(j|i)是一項(xiàng)十分耗費(fèi)時(shí)間的工作,因此,采用負(fù)采樣技術(shù)計(jì)算上述公式,從而

(5)

對(duì)于損失函數(shù)LUI,基于個(gè)性化排序的思想以及前面所述的觀察,可得以下?lián)p失函數(shù)

(6)

用戶的間接行為數(shù)量眾多,計(jì)算所有的組合顯然是不現(xiàn)實(shí)的,因此,根據(jù)隨機(jī)游走和負(fù)采樣的技術(shù),生成一定比例的樣本組合Dui和Diu,結(jié)合上述等式,GUI上的損失函數(shù)為

(7)

式中:wuii′和wiuu′表示的是該項(xiàng)的置信度。根據(jù)前面的觀察可得,當(dāng)兩個(gè)節(jié)點(diǎn)越接近,其置信度越高,為此

(8)

式中:kui表示的是用戶u和項(xiàng)目i的距離。

考慮用戶-項(xiàng)目之間的交互節(jié)點(diǎn)網(wǎng)絡(luò)的相似度,對(duì)于概率的計(jì)算方式為

p(i >ui′|θ,φ)∝σ(θ(u)·φ(i)-θ(u)·φ(i′))

(9)

2.3 算 法

基于上一小節(jié)所述的模型,COIR模型的訓(xùn)練框架主要包含兩部分的信息,分別是構(gòu)建子圖,生成訓(xùn)練樣本和優(yōu)化損失函數(shù),更新向量,具體處理步驟如下:

步驟1 構(gòu)建項(xiàng)目子圖GI,用戶項(xiàng)目交互子圖GUI。根據(jù)子圖GI和GUI定義,分別構(gòu)建對(duì)應(yīng)的子圖。其中,對(duì)于項(xiàng)目子圖GI,其邊EI表示為具有相同的標(biāo)簽或與同一用戶具有共同交互記錄。

步驟2 生成訓(xùn)練樣本Di、Dui與Diu。訓(xùn)練樣本的生成算法如算法1所示,其中,Dui與Diu的生成過(guò)程與Di相類(lèi)似,其差異僅在于二者的概率轉(zhuǎn)移矩陣不同。概率轉(zhuǎn)移矩陣是根據(jù)對(duì)應(yīng)子圖的鄰接矩陣的行元素做歸一化后獲得的。

步驟3 隨機(jī)初始化用戶低維向量表示θ,項(xiàng)目的低維向量表示φ。

步驟4 根據(jù)式(1)計(jì)算損失函數(shù)L。

步驟5 使用隨機(jī)梯度下降算法優(yōu)化損失函數(shù),更新θ和φ。

對(duì)于訓(xùn)練樣本的生成算法如算法1所示,其主要思想是對(duì)于每個(gè)節(jié)點(diǎn),根據(jù)概率轉(zhuǎn)移矩陣隨機(jī)生成下一節(jié)點(diǎn),獲取K階鄰居,同時(shí)補(bǔ)充一定數(shù)量的負(fù)樣本(非鄰居節(jié)點(diǎn)),從而生成一定數(shù)量節(jié)點(diǎn)對(duì),并根據(jù)式(3)計(jì)算相應(yīng)節(jié)點(diǎn)對(duì)的權(quán)重。

算法1:生成訓(xùn)練樣本

輸入:項(xiàng)目子圖GI,項(xiàng)目概率轉(zhuǎn)移矩陣Ti,最大階數(shù)K,每個(gè)節(jié)點(diǎn)重復(fù)次數(shù)R,負(fù)樣本比例NS

輸出:樣本集Di

(1)初始化Di為空集

(2)for r ← 1 to R do //每個(gè)節(jié)點(diǎn)重復(fù)R次

(3) for i in GIdo

(4) Cnode = node

(5) for k ← 1 to K do

(7) P(i) = unode ∪ P(i)

(8) Cnode = unode

(9) end for

(10) for n ← 1 to NS do //生成負(fù)樣本

(11) Nv ~ NegativeSample(Cnode)

(12) NP(i) = Nv ∪ NP(i)

(13) end for

(14) for nodes in P(i) do //生成節(jié)點(diǎn)對(duì)

(15) j ~ P(i)

(16) j’~ P(i)

(17) Calculate wijj’as formulate(3)//根

據(jù)式(3)計(jì)算權(quán)重

(18) Di ∪

(19) end for

(20) for nv in NP(i) do //生成節(jié)點(diǎn)對(duì)

(21) Di ∪

(22) end for

(23) end for

(24) end for

2.4 復(fù)雜度分析

由框架流程可知,訓(xùn)練過(guò)程最主要的時(shí)間花費(fèi)包括兩部分:

(1)樣本生成過(guò)程

如算法1所述,對(duì)于GI中的每個(gè)節(jié)點(diǎn)i,生成R個(gè)序列,最大階數(shù)為K,假設(shè)每個(gè)節(jié)點(diǎn)的平均出度為|E|,N為項(xiàng)目的總節(jié)點(diǎn)數(shù),即總共生成的樣本數(shù)量為|K-1!|×R×N對(duì),而負(fù)樣本比例為NS,所以總共生成|NS×K×R×N|個(gè)樣本對(duì),在樣本Di生成過(guò)程中,花費(fèi)時(shí)間為O(|K-1!|×R×M)+O(|NS×K×R×N|),由于|E|<

Dui、Diu的生成過(guò)程與Di生成過(guò)程類(lèi)似,差異僅在于節(jié)點(diǎn)之間的概率轉(zhuǎn)移矩陣Tui與Ti不同,意味著Dui、Diu具有更多的節(jié)點(diǎn)集合,因此,樣本Dui與Diu生成過(guò)程其時(shí)間復(fù)雜度為O(|NS×K×R×N×M|),其中,M為用戶節(jié)點(diǎn)數(shù)。

所以,樣本生成過(guò)程的總的時(shí)間復(fù)雜度為O(|NS×K×R×N2|)+O(|NS×K×R×N×M|)。

(2)訓(xùn)練優(yōu)化過(guò)程

在優(yōu)化的過(guò)程中,梯度計(jì)算和變量更新的傳播與生成的樣本數(shù)量、變量的維度d相關(guān)。因此,該過(guò)程的時(shí)間復(fù)雜度為O(d×NS×K×R×(N+M))。

綜上所述,本文的算法的總復(fù)雜度為O(|NS×K×R×N2|)+O(|NS×K×R×N×M|)+O(d×NS×K×R×(N+M)),由于維度d遠(yuǎn)遠(yuǎn)小于用戶和項(xiàng)目的節(jié)點(diǎn)數(shù)目,從而,總體時(shí)間復(fù)雜度為O(|NS×K×R×N2|)+ O(|NS×K×R×N×M|)。

一般而言,傳統(tǒng)的矩陣分解算法,其時(shí)間復(fù)雜度為O(|M×N|)。對(duì)于BPR算法,其時(shí)間復(fù)雜度與訓(xùn)練樣本數(shù)、節(jié)點(diǎn)數(shù)相關(guān),且其算法包括采樣部分,具體可概括為O(|NS×R×N×M|)。對(duì)于HopRec算法,同樣包括高階行為的樣本產(chǎn)生過(guò)程且該過(guò)程與本文類(lèi)似,即算法復(fù)雜度為O(|NS×K×R×N×M|)。由于N、K、R一般數(shù)值較小,因此以上幾類(lèi)算法時(shí)間復(fù)雜度差異較小,而上述幾類(lèi)算法被廣泛用于實(shí)際的推薦系統(tǒng)中,包括大規(guī)模數(shù)據(jù)集。因此,本文的算法與上述幾類(lèi)算法具有同樣的適用性。

3 實(shí)驗(yàn)與結(jié)果分析

3.1 數(shù)據(jù)集

本文使用了QAR數(shù)據(jù)集和Citation數(shù)據(jù)集,具體數(shù)據(jù)集的情況見(jiàn)表2,其基本特征如下:

表2 數(shù)據(jù)集情況

QAR(https://biendata.com/competition/bytecup2016):該數(shù)據(jù)集來(lái)自一個(gè)數(shù)據(jù)競(jìng)賽,其包括應(yīng)答者-問(wèn)題交互記錄、應(yīng)答者/問(wèn)題標(biāo)簽。該數(shù)據(jù)集中共有28 745個(gè)用戶,8090個(gè)問(wèn)題和33 981條回答記錄。此外,還有143個(gè)用戶標(biāo)簽和20個(gè)問(wèn)題標(biāo)簽。每個(gè)用戶平均有兩個(gè)回答記錄,每個(gè)問(wèn)題有一個(gè)問(wèn)題標(biāo)簽。

Citation(https://www.aminer.cn/citation):該數(shù)據(jù)集是一個(gè)廣泛使用的數(shù)據(jù)集,用于評(píng)估社交網(wǎng)絡(luò)上的各種數(shù)據(jù)挖掘任務(wù)。該數(shù)據(jù)集包括學(xué)術(shù)論文及其引用關(guān)系。通過(guò)刪除沒(méi)有任何標(biāo)記的作者/文章,選擇17 959名作者和8074篇文章進(jìn)行評(píng)估。引用關(guān)系被視為評(píng)價(jià)作者是否真的對(duì)某篇論文感興趣的依據(jù)。

CiteULike(http://www.wanghao.in/CDL.htm):該數(shù)據(jù)集來(lái)自CiteULike和谷歌Scholar,主要用于評(píng)估推薦任務(wù)。其包括7947個(gè)用戶,25 975個(gè)項(xiàng)目。

以上所有的數(shù)據(jù)集均采用隨機(jī)抽樣的方式,隨機(jī)抽取80%的用戶-項(xiàng)目交互記錄作為訓(xùn)練樣本,剩余的20%作為測(cè)試樣本。

3.2 評(píng)價(jià)指標(biāo)

對(duì)于每個(gè)待評(píng)測(cè)的用戶,選擇與其最接近的Top-K個(gè)項(xiàng)目作為候選列表,本文用HR(hit ratio)、NDCG(normalized discounted cumulative gain)和MAP(mean average precision)作為推薦質(zhì)量的評(píng)價(jià)指標(biāo)。這些指標(biāo)被廣泛用于信息檢索和推薦系統(tǒng)中。

3.3 模型對(duì)比

以下幾類(lèi)算法被用于作為基礎(chǔ)模型進(jìn)行對(duì)比實(shí)驗(yàn),選擇這些算法的原因是:它們與本文的模型密切相關(guān),并且被廣泛用于各種推薦系統(tǒng)。

(1)PMF[3]:矩陣分解的模型,根據(jù)用戶-項(xiàng)目的交互行為進(jìn)行矩陣分解。

(2)WARP[5]:一種有效估計(jì)排序函數(shù)的近似方法,其主要思想是根據(jù)節(jié)點(diǎn)對(duì)在排名列表中的位置,衡量它們的差異性。

(3)BPR[1]:基于矩陣分解的模型,將推薦問(wèn)題轉(zhuǎn)化為排序問(wèn)題。根據(jù)可觀測(cè)到的正樣本,從未觀測(cè)到的數(shù)據(jù)中隨機(jī)抽取與其對(duì)應(yīng)的實(shí)例作為負(fù)樣本,最后用于隱式反饋推薦。

(4)HopRec[6]:基于用戶-項(xiàng)目的直接行為,同時(shí)考慮用戶-項(xiàng)目的間接行為,利用隨機(jī)游走技術(shù)生成一定比例的間接行為,最后轉(zhuǎn)化為矩陣分解進(jìn)行求解。

(5)Meta-Prod2vec[15]:基于用戶-項(xiàng)目交互信息,融入額外的項(xiàng)目信息構(gòu)成異構(gòu)圖,并在此異構(gòu)圖上采用Skip-Gram的思想進(jìn)行求解。

3.4 參數(shù)設(shè)置

模型涉及了主要參數(shù)包括權(quán)重α,階數(shù)K。在本次實(shí)驗(yàn)中,α設(shè)置為1,階數(shù)K為2。隨機(jī)梯度下降算法使用的是ADAM[19]算法。在對(duì)比方法的設(shè)置中,采用了網(wǎng)格搜索的形式,展示其在較優(yōu)參數(shù)設(shè)置下的結(jié)果。

3.5 結(jié)果與分析

本文將從以下2個(gè)角度分析COIR模型:①將COIR模型與現(xiàn)有的基準(zhǔn)模型進(jìn)行對(duì)比,比較它們?cè)诓煌脑u(píng)價(jià)指標(biāo)下的效果;②討論參數(shù)敏感度對(duì)結(jié)果的影響。

3.5.1 總體實(shí)驗(yàn)結(jié)果

在3個(gè)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果分別見(jiàn)表3~表5。顯然,我們的方法在各個(gè)數(shù)據(jù)集上有突出的作用,也驗(yàn)證了我們的設(shè)置是有效的。相較于傳統(tǒng)的矩陣分解方法PMF,BPR模型利用用戶的顯式行為和隱式行為之間的排名,效果相對(duì)突出。HopRec算法增加了用戶的間接行為,并對(duì)其進(jìn)行排序,其比直接的帶權(quán)排序算法WARP的效果有所提升,由此可見(jiàn)用戶的間接行為也是有效的。Meta-Prod2vec通過(guò)額外的項(xiàng)目信息,增加了項(xiàng)目之間的連接,其結(jié)果比只用用戶-項(xiàng)目交互行為的PMF模型更好,驗(yàn)證了項(xiàng)目-項(xiàng)目的共現(xiàn)信息是有用的。相比于Meta-Prod2vec模型,我們的模型增加了用戶間接行為的個(gè)性化排序信息,在3個(gè)數(shù)據(jù)集上各項(xiàng)指標(biāo)都有所提高,而且具有更加穩(wěn)定的效果,由此表明間接的行為的個(gè)性化排序是有效的。相比于個(gè)性化排序模型,我們的COIR模型融合了項(xiàng)目的信息,對(duì)比效果最好的個(gè)性化排序模型,在3個(gè)數(shù)據(jù)集上HR值分別提高了10%、12%和24%,NDCG值分別提高了15%、17%和30%,MAP值分別提高了18%、19%和16%,實(shí)驗(yàn)結(jié)果表明了前面所述的假設(shè)的正確性,即項(xiàng)目的信息對(duì)于推薦的效果的提高是有意義的。

表3 QAR數(shù)據(jù)集上Top10的實(shí)驗(yàn)結(jié)果

表4 Citation數(shù)據(jù)集上Top10的實(shí)驗(yàn)結(jié)果

表5 CiteULike數(shù)據(jù)集上Top10的實(shí)驗(yàn)結(jié)果

3.5.2 參數(shù)敏感度

該部分將重點(diǎn)討論包括本文方法在內(nèi)的幾種方法共有的參數(shù),即維度d對(duì)于實(shí)驗(yàn)效果的影響,并用MAP值(平均精度均值)展示實(shí)驗(yàn)的效果。設(shè)置維度d的范圍為{50,100,200,300,400,500},其效果如圖3所示。顯然,COIR模型的效果隨著維度的增加而上升,當(dāng)d≥300時(shí),效果趨向穩(wěn)定,由此可見(jiàn),COIR模型能夠有效融合多種復(fù)雜的信息。

圖3 維度對(duì)比

4 結(jié)束語(yǔ)

本文將傳統(tǒng)的推薦問(wèn)題轉(zhuǎn)化為圖的表示學(xué)習(xí)問(wèn)題,利用不同的信息構(gòu)建不同的子圖,通過(guò)子圖節(jié)點(diǎn)的跳轉(zhuǎn),刻畫(huà)用戶的不同行為喜好。同時(shí)為了解決數(shù)據(jù)稀疏性,引入了項(xiàng)目的信息和用戶的間接行為并對(duì)其進(jìn)行個(gè)性化排序,最終將多種復(fù)雜的信息融合在一個(gè)模型中進(jìn)行用戶、項(xiàng)目的向量化表示學(xué)習(xí)。實(shí)驗(yàn)結(jié)果表明,COIR方法是有效的。顯然,引入項(xiàng)目的信息和用戶的間接行為,一定程度上能夠處理數(shù)據(jù)稀疏性問(wèn)題,并通過(guò)用戶行為相似度的排序,進(jìn)行更精準(zhǔn)的推薦。然而,兩個(gè)組成部分的作用在適應(yīng)性上有一定的局限性,下一步將引入注意力機(jī)制,使得框架自己學(xué)習(xí)各個(gè)部分的權(quán)重,從而具有更好的可拓展性。另外,該模型僅僅是一個(gè)不考慮時(shí)效性的模型,下一步的研究工作將拓展到在線學(xué)習(xí)方面的工作,并應(yīng)用到具有時(shí)序信息的用戶行為。

猜你喜歡
排序用戶信息
排序不等式
恐怖排序
節(jié)日排序
刻舟求劍
兒童繪本(2018年5期)2018-04-12 16:45:32
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
關(guān)注用戶
關(guān)注用戶
關(guān)注用戶
如何獲取一億海外用戶
展會(huì)信息
主站蜘蛛池模板: 国产玖玖视频| 色综合久久综合网| 久久婷婷六月| 欧美日韩一区二区在线免费观看| 久久青草热| 一级黄色片网| 在线另类稀缺国产呦| 国产黑丝视频在线观看| 在线免费a视频| a天堂视频| 在线亚洲小视频| 伊人国产无码高清视频| 亚洲天堂网视频| 亚洲av片在线免费观看| 国产a在视频线精品视频下载| 国产精选小视频在线观看| 国产精品美女免费视频大全| 国产精品一线天| 国产精品白浆无码流出在线看| 国产在线小视频| 免费A级毛片无码免费视频| 91在线一9|永久视频在线| a国产精品| 91精品国产福利| 国产网站在线看| 88av在线| 国产精品一区二区久久精品无码| 国产精品福利尤物youwu | 免费va国产在线观看| 视频国产精品丝袜第一页| 亚洲天堂网2014| 国产精品自在线天天看片| 无码'专区第一页| 国产欧美在线观看视频| 国产激爽大片在线播放| 亚洲精品中文字幕无乱码| 午夜国产理论| 在线a视频免费观看| 国产青榴视频| 国产乱码精品一区二区三区中文 | 亚洲乱码视频| 亚洲欧洲AV一区二区三区| 成人国产免费| 欧美中文字幕一区| 欧美日韩中文国产va另类| 精品无码视频在线观看| 2021国产在线视频| 久久这里只有精品国产99| 新SSS无码手机在线观看| 亚洲午夜18| 国产丝袜丝视频在线观看| 成人福利视频网| 国产精品精品视频| 狠狠五月天中文字幕| 亚洲无码视频一区二区三区| 香蕉久久永久视频| 91久久天天躁狠狠躁夜夜| aaa国产一级毛片| 色久综合在线| 精品人妻一区二区三区蜜桃AⅤ| 91久久国产综合精品女同我| 国产精品尤物铁牛tv| 日日拍夜夜嗷嗷叫国产| 波多野结衣的av一区二区三区| 亚洲综合中文字幕国产精品欧美| 91在线播放国产| 国产亚洲视频播放9000| 国产拍揄自揄精品视频网站| 国产乱肥老妇精品视频| 亚洲中文字幕23页在线| 99re这里只有国产中文精品国产精品 | 国产日韩欧美在线播放| 中文纯内无码H| 欧美午夜视频在线| 91精品国产麻豆国产自产在线| 天天婬欲婬香婬色婬视频播放| 国产在线专区| 欧美一级夜夜爽| 国产内射一区亚洲| 亚洲欧美综合在线观看| 欧美中日韩在线| 538国产视频|