999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于局部模型融合的交互式電影推薦系統(tǒng)

2021-09-17 09:43:12王攸妍孫康高湯穎
關(guān)鍵詞:用戶模型系統(tǒng)

王攸妍,孫康高,湯穎

浙江工業(yè)大學(xué),計算機科學(xué)與技術(shù)學(xué)院,浙江 杭州 310000

引言

中國已成為全球最大的電影市場,每年有成百上千部影視新作。由于人們對電影有著各自的喜好,為不同的人推薦適宜的電影對于觀眾與電影推廣方都是一件重要而有意義的工作。為此,出現(xiàn)了各種類型的推薦系統(tǒng)。

傳統(tǒng)的推薦算法通常對所有用戶構(gòu)建一個單一的全局模型,認為兩個相同的物品在任何人群中的相似程度都是一致的。然而,真實情況并非如此,例如,愛好戰(zhàn)爭題材的用戶群體,通常戰(zhàn)爭類型的電影中打分較為活躍,而在溫情電影中打分較為稀疏。對于喜歡溫情類電影的用戶群體,打分行為則恰恰相反。但對于一些較為熱門、口碑較好的電影,無論屬于什么題材,任何用戶群體對它們的打分都較為活躍。根據(jù)上述情況,基于鄰域的協(xié)同過濾算法通過分析用戶對物品產(chǎn)生的行為來計算物品之間的相似性,會將愛情電影和熱門戰(zhàn)爭電影記為相似電影,因為大多數(shù)看過愛情電影的用戶也看過這部熱門戰(zhàn)爭電影。實際上,這部熱門戰(zhàn)爭電影對于喜歡軍事題材的用戶是相似的,而對于喜歡愛情類電影的用戶是不相似的。若使用單一模型,則無法準確捕獲用戶群體的喜好,使得推薦結(jié)果不夠好。

當前,已存在一些使用多個局部模型的推薦系統(tǒng),這些工作大多依賴于用戶-物品矩陣,利用聚類算法構(gòu)建多個局部模型[1-4]。但是,這些推薦系統(tǒng)使用的用戶評分矩陣總是稀疏的,例如,有的用戶觀看電影后沒有對電影打分,損失了部分偏好信息,使得系統(tǒng)無法獲得足夠的用戶特征。

此外,這些推薦系統(tǒng)往往只將推薦的結(jié)果展示給用戶,而不對推薦的結(jié)果進行解釋,這使得用戶無法理解推薦結(jié)果是如何產(chǎn)生的,從而降低了用戶對該系統(tǒng)的信任度。因此,解決推薦系統(tǒng)的黑盒模型問題,以及改善用戶的系統(tǒng)體驗對于推薦系統(tǒng)開發(fā)人員而言也是十分重要的。除此之外,由于用戶的喜好存在階段性和臨時性,這種喜好可能和他的歷史行為信息不符,而傳統(tǒng)的推薦系統(tǒng)通常不提供交互功能,以致于用戶不能向系統(tǒng)反饋信息,或控制推薦過程,也就無法滿足用戶的實時需求。

為了幫助用戶準確地獲得感興趣的電影,并理解推薦結(jié)果,本文提出了基于多模型融合的交互式電影推薦系統(tǒng)。不同于上述基于用戶的電影評分矩陣對用戶聚類并構(gòu)建多個局部模型的推薦系統(tǒng),本文的系統(tǒng)使用用戶觀影記錄中的標簽信息,通過LDA[5]模型提取每個用戶的偏好信息,利用SLIM[6]模型訓(xùn)練局部推薦模型。因為電影評分信息是稀疏的,但是每部電影的標簽信息是切實存在的,因此,標簽信息更能反映用戶的觀影偏好。對于推薦系統(tǒng)的“黑盒問題”,我們設(shè)計了電影標簽詞云展示用戶觀影記錄的標簽分布,主題雷達圖則描繪了每個用戶觀影喜好的分布,主題層次氣泡圖則展示主題的詳細信息,通過用戶畫像可以解釋推薦結(jié)果產(chǎn)生的原因。除此之外,用戶可以通過電影氣泡云圖與推薦系統(tǒng)進行交互,以生成可以滿足用戶臨時偏好的推薦。基于上述內(nèi)容,我們利用從豆瓣電影網(wǎng)站中爬取的真實數(shù)據(jù),驗證了本文系統(tǒng)的有效性。

本文的主要工作為:

(1)利用電影標簽的語義信息描述用戶特征,而非物品-用戶二分圖,在一定程度上解決了評分數(shù)據(jù)的稀疏性,并使用基于用戶聚類的局部模型加權(quán)融合推薦算法,準確捕捉用戶偏好的局部特征,提供更加個性化的推薦。

(2)設(shè)計了一個可視化交互方案,不僅促進了用戶對推薦結(jié)果的理解,通過標簽氣泡云的交互實時推薦功能,以及對融合參數(shù)的控制,創(chuàng)造性地增加了用戶在推薦過程中的參與感。

(3)利用豆瓣電影數(shù)據(jù)驗證了本文的電影推薦算法和可視推薦系統(tǒng)的實用性和有效性。

本文的內(nèi)容安排如下:第1 章節(jié)說明了該系統(tǒng)的相關(guān)工作;第2 章節(jié)為本文系統(tǒng)的概述;第3 章節(jié)介紹了模型的相關(guān)內(nèi)容;第4 章節(jié)講述了系統(tǒng)的可視方案;本文在第5 章節(jié)提供了案例分析;最后在第6 章節(jié)進行了總結(jié)。

1 相關(guān)工作

1.1 Top-N 推薦算法

Top-N 推薦[7]是電影推薦系統(tǒng)中最常見的推薦方式,該方法生成一個經(jīng)過排名且大小為N 的物品列表并把該列表推薦給用戶。Top-N 推薦可以被分成兩種類型[8],分別為基于鄰域[9]和基于模型的協(xié)同過濾方法。在模型表現(xiàn)方面,后者往往優(yōu)于前者。其中,以矩陣分解為代表的隱因子模型在該類算法較為出色,最常見的矩陣推薦算法包括Funk 提出的FunkSVD[10],Koren 等人在Netflix 比賽中提出的多種基于FunkSVD 改進的推薦算法,BiasSVD[11]、SVD++[12]、timeSVD++[13]等,這些推薦算法也適用于評分預(yù)測。另外,Hu 等人提出WRMF[14],該模型結(jié)合隱式用戶反饋信息將推薦問題轉(zhuǎn)換為加權(quán)正則化的最小二乘問題。

在近年來的研究中,Connor[1]等人提出通過訓(xùn)練多個局部推薦模型,再融合局部模型來提升總體推薦效果的算法受到了廣泛關(guān)注。Xu[2]等人改進了這項工作,提出使用co-cluster 聚類算法把用戶-物品矩陣聚類成多個子分組,每個子分組都包括一個物品子集和一組相似偏好的用戶,并基于這些子分組進行推薦。另外,Lee[15]等人基于“評分矩陣在特定條件下是低秩的”思想,提出了局部最小二乘矩陣近似法LLORMA 來最小化排名誤差,并得到了局部用戶和物品的隱式因子矩陣,最后融合局部模型進行推薦[3]。Christakopoulou[4]等人提出了GLSLIM,該模型首先對用戶-物品矩陣進行聚類,構(gòu)建用戶分組,然后對每個分組訓(xùn)練SLIM 推薦模型,最終實現(xiàn)了局部模型與全局模型的加權(quán)融合。

在上述系統(tǒng)中,訓(xùn)練和使用的局部模型都是同一種推薦算法。然而,推薦模型可以使用多種不同的推薦模型并進行適當?shù)募訖?quán)融合從而得到更優(yōu)的模型,如論文[16]和[17]。Kouki[18]等人引入了統(tǒng)計關(guān)系學(xué)習(xí)框架,開發(fā)通用且可擴展的混合推薦系統(tǒng)。Strub[19]等人使用了一種基于自動編碼器的構(gòu)架,并合并了輔助信息而提出了一種混合式推薦方法。Hussein T[20]等人,提出一種用于構(gòu)建復(fù)雜上下文感知應(yīng)用程序的軟件框架,稱為Hybreed。Kim[21]等人,將卷積神經(jīng)網(wǎng)絡(luò)集成到含有物品統(tǒng)計信息的概率矩陣分解上,提出了一種魯棒的文檔上下文感知混合方法。Cantador[22]提出了一種三重知識表示方法,在用戶和項目之間合并了一個明確的、語義豐富的領(lǐng)域知識空間,最后應(yīng)用到新聞推薦系統(tǒng)中。

1.2 推薦系統(tǒng)可視化

為了讓用戶理解推薦系統(tǒng)的推薦機制,并以一種有意義的方式參與到推薦過程中,現(xiàn)有工作提出了許多不同的可視化策略,本文將簡要介紹這一領(lǐng)域的主要工作。

亞馬遜公司提出了一種自適應(yīng)個性化可視推薦系統(tǒng)[23],該系統(tǒng)對用戶偏愛的商品類別進行預(yù)測,并不斷更新推薦列表。He[24]等人從滿意度、信任度、透明度和控制感等角度入手,提出了一種交互式可視化框架。

除此之外,O’Donovan 等人,提出了一個帶有交互式圖形解釋界面的推薦系統(tǒng)PeerChooser[25],該系統(tǒng)旨在向用戶解釋推薦原理。為了增加推薦系統(tǒng)的透明性,Gretarsson 等人設(shè)計了SmallWorlds[26],該系統(tǒng)能為用戶提供個性化、完全透明的項目推薦。以上兩個可視交互推薦系統(tǒng)因其可視化方案的限制,僅適用于小規(guī)模樣本下的推薦場景。Parra 等人提出一種用于混合推薦的用戶可控的可視化系統(tǒng)SetFusion[27],使用戶能夠手動控制推薦策略的重要性。

致力于增進用戶對推薦結(jié)果的理解,提高用戶對其的信任度,Vig 等人提出了一個電影可視推薦系統(tǒng)Tagsplanations[28],該系統(tǒng)對推薦結(jié)果的標簽以及用戶對該標簽的偏愛程度進行可視化。TalkExplorer[29]是一種為學(xué)術(shù)會議的參會人員開發(fā)的交互式可視化工具,能夠讓用戶參與推薦的過程。MoviExplain[30]是一個面向電影數(shù)據(jù)的可視推薦解釋系統(tǒng),該系統(tǒng)通過表格的方式對當前推薦結(jié)果產(chǎn)生的原因進行展示。Saito 等人提出音樂可視推薦系統(tǒng)MusiCube[31],該系統(tǒng)將交互式遺傳算法應(yīng)用于多維音樂特征空間。

Bostandjiev 等人提出了一種交互式混合推薦系統(tǒng)TasteWeights[32],該系統(tǒng)可從多個網(wǎng)絡(luò)資源中對音樂數(shù)據(jù)生成可視化推薦,同時用戶可以為不同的數(shù)據(jù)源分配不同的權(quán)重。TIGRS[33]在基于圖形的可視化中,使推薦的論文根據(jù)相關(guān)性與其關(guān)鍵字相連接,該相關(guān)性則由文本挖掘方法計算。Wegba[34]等人通過SVD 模型來獲取電影的隱語義,提出了基于隱語義分析和敘事模式的交互式可視電影推薦系統(tǒng)。

2 系統(tǒng)概述

本文提出的電影推薦可視分析系統(tǒng)流程可分為三個階段:數(shù)據(jù)預(yù)處理、模型訓(xùn)練和交互式可視分析,如圖1所示。

圖1 可視分析系統(tǒng)流程圖Fig.1 Flow chart of visual analysis system

在數(shù)據(jù)處理階段,我們從豆瓣電影網(wǎng)站抓取了真實的電影數(shù)據(jù)和用戶數(shù)據(jù),確保每部電影被20 名用戶觀看過,每個用戶至少觀看了15 部電影。最終數(shù)據(jù)包含了3,155 個用戶,3,524 部電影,302,662 個評分,4,221 個電影標簽。

在模型訓(xùn)練階段,我們將用戶看過的電影的標簽作為文檔,通過潛在狄利克雷分布(Latent Dirichlet Allocation,LDA)計算這些文檔的主題分布,將其作為這些用戶的特征向量。計算完特征向量之后,我們對這些用戶進行譜聚類,以劃分局部人群。然后我們使用稀疏線性模型(Sparse Linear Model,SLIM)來對局部和全局的模型進行訓(xùn)練。最后,通過線性加權(quán)的方式將兩個部分的模型進行融合,實現(xiàn)最終的推薦模型。

在交互式可視分析階段,我們將系統(tǒng)布置在Web 網(wǎng)頁端。當用戶登錄賬號進入系統(tǒng)后,可看到用戶畫像和交互推薦兩個模塊。在用戶畫像模塊,我們通過標簽詞云(圖3a)展示了用戶的標簽喜好,通過主題雷達圖(圖3b)描述了用戶對各電影主題的偏好分布。如果用戶想要進一步了解主題雷達圖中各主題的具體內(nèi)容,可以點擊主題層次氣泡圖(圖3b)中對應(yīng)的主題,系統(tǒng)提供該主題下更詳細的標簽信息。在交互推薦模塊,我們使用電影海報的形式向用戶展示推薦內(nèi)容,點擊電影海報后,系統(tǒng)將自動鏈接至豆瓣電影網(wǎng)中該電影的介紹頁面。另外,該系統(tǒng)在交互式推薦模塊的電影氣泡云(圖5)中展示了排名最高的前100 部電影。如果用戶對推薦結(jié)果不滿意,可以在電影氣泡云中選擇當下感興趣的電影,系統(tǒng)會根據(jù)用戶的選擇計算出新的推薦結(jié)果,并實時推送給用戶。

圖5 可交互的電影氣泡云圖Fig.5 Interactive movie bubble cloud chart

3 基于局部模型融合的推薦

3.1 特征提取及模型構(gòu)建

本文對推薦模型的構(gòu)建采用了湯[35]等人提出的局部模型加權(quán)融合推薦模型。該模型首先利用LDA主題模型從用戶觀影記錄的標簽集合中提取用戶特征,然后通過譜聚類算法對用戶特征進行用戶群體劃分,接著利用SLIM 模型訓(xùn)練全局推薦模型以及為每個用戶群體訓(xùn)練局部推薦模型,最終,通過線性加權(quán)的方式將全局模型與局部模型進行融合,融合公式如公式(1)[35]所示。

基于該推薦算法,我們將豆瓣電影的標簽映射成單詞w,單個用戶的觀影標簽集合映射成一篇文檔d,數(shù)據(jù)中若有n個用戶,則生成包含n篇文檔的語料庫,我們也通過LDA 對該語料庫進行訓(xùn)練,最終得到用戶-主題分布和主題-標簽分布。

從表1 可知,10 個主題向量大致分出了幾種用戶喜愛的電影類型。例如,主題2 表示這類群體純粹喜歡日本動漫,主題0 表示喜歡看電視劇的群體,主題6 反映了偏愛香港動作片和喜劇片的群體。

表1 主題-標簽分布Table 1 Topic-label distribution

另外,為了增加用戶對推薦過程的控制,我們

3.2 推薦效果

為了驗證該推薦模型的有效性,本文采用留一法交叉驗證,同時本文使用命中率(HR)和平均排名命中率(ARHR)來衡量模型的推薦質(zhì)量。

本文采用的對比算法包括基于用戶的推薦(UserKNN)、基于熱度的推薦(TopPop)、基于物品的推薦(ItemKNN)、稀疏線性模型(SLIM)、加權(quán)正則的矩陣分解(WRMF),并將本文的基于用戶聚類的局部模型加權(quán)融合推薦算法記為LM1。其中,基于熱度的推薦算法通過篩選熱度最高的前N 部電影推薦給用戶,這里的熱度代表電影的評分人數(shù),評分人數(shù)越多,電影越熱門。而基于用戶的協(xié)同過濾和基于物品的協(xié)同過濾是推薦系統(tǒng)發(fā)展早期所出現(xiàn)的經(jīng)典算法,實現(xiàn)簡單且推薦效果出眾,在業(yè)界得到了廣泛的應(yīng)用。加權(quán)正則矩陣分解算法和稀疏線性模型的推薦效果較優(yōu),分別通過矩陣分解和線性擬合方法來訓(xùn)練推薦模型。

我們將以上推薦算法分別在Top5、Top10、Top20 的條件下進行對比實驗,結(jié)果如圖2所示。由圖可知,推薦算法SLIM、WRMF 和LM1 的總體表現(xiàn)要比UserKNN、TopPop 和ItemKNN 好很多。產(chǎn)生上述結(jié)果的原因是這些表現(xiàn)較差的方法對于數(shù)據(jù)的都是較為淺層的。其中TopPop 的表現(xiàn)是最差的,因為它不是個性化推薦,給每位用戶推薦的都是相同的熱門電影。而ItemKNN 和UserKNN 僅僅通過電影或用戶之間的協(xié)同關(guān)系分別計算電影相似度(ItemKNN)和用戶相似度(UserKNN),所以這兩種方法得出的推薦結(jié)果并不理想。而SLIM、 WRMF和LM1 這三種推薦算法則使用機器學(xué)習(xí)的方法得到結(jié)果,它們通過學(xué)習(xí)的方式挖掘電影和用戶的潛在特征,這比不使用機器學(xué)習(xí)的方法挖掘得更深層。總體而言,本文的推薦模型是優(yōu)于其他推薦算法的。

圖2 推薦模型在兩個指標下的表現(xiàn)結(jié)果Fig.2 The performance results of the recommended model under two indicators

4 可視設(shè)計與交互

4.1 設(shè)計目標

為了解決推薦系統(tǒng)的黑盒問題,改善用戶的使用體驗,以及滿足用戶的實時推薦需求,本文確定了3 個設(shè)計需求來指導(dǎo)推薦可視化系統(tǒng)的設(shè)計。

R1:提供系統(tǒng)推薦結(jié)果的直觀展示

R2:為推薦結(jié)果提供上下文信息及推薦原因

R3:為用戶提供交互反饋功能,以及基于反饋結(jié)果的實時推薦

基于上述需求,我們開發(fā)了一個可視分析系統(tǒng)RecVis。該系統(tǒng)使用了多種可視化技術(shù),使推薦系統(tǒng)的透明性得到了顯著的提高,同時系統(tǒng)能夠記錄下用戶的歷史行為,并借助該信息實時地與用戶交互推薦其可能感興趣的電影。本文的系統(tǒng)可以被分成三個模塊,其中基本功能模塊提供了用戶注冊、登錄、使用說明和修改信息等基本功能。其余兩個模塊分別為用戶畫像模塊和交互式推薦模塊,以下將著重介紹。

4.2 用戶畫像模塊

用戶畫像包括標簽詞云、主題雷達圖以及主題層次氣泡圖三個部分。其中,用戶的主題偏好和標簽偏好來源于用戶的歷史觀影信息。該模塊直觀地展示了用戶歷史觀影記錄的特征,這能夠讓用戶對自己的觀影喜好更加了解,從而在一定程度上能夠起到解釋推薦系統(tǒng)結(jié)果的作用,同時提高推薦系統(tǒng)的可信度。該模塊在圖3 中進行了展示。

4.2.1 標簽詞云

該模塊統(tǒng)計了每一位用戶看過的所有電影標簽集合(即LDA 主題模型中的用戶文檔d),然后根據(jù)出現(xiàn)次數(shù)從每位用戶的標簽文檔d 中取TOP-100 個電影標簽進行可視化。如圖3 中視圖a所示,詞云中標簽的大小與該標簽在文檔d 中出現(xiàn)的詞頻成正比。通過此視圖,用戶對自己的觀影喜好可以一望而知,從而幫助用戶更好地理解系統(tǒng)的個性化推薦結(jié)果。

4.2.2 主題雷達圖

主題雷達圖描述了用戶的觀影偏好在10 個主題上的分布情況。此部分由LDA 主題模型為每個用戶訓(xùn)練用戶特征向量,該向量有10 個維度,每個維度代表當前用戶屬于對應(yīng)主題的隸屬度。因此,該特征向量能夠表示用戶的觀影偏好,以及當前用戶更傾向于哪一類電影。另外,隸屬度值小于指定閾值的維度會被過濾掉。

4.2.3 主題層次氣泡圖

上述主題雷達圖僅展示了用戶觀影歷史與主題間的關(guān)系,但用戶并不明白對應(yīng)主題所蘊含的具體語義信息。因此,我們在主題雷達圖周圍設(shè)計了層次化的主題氣泡圖,幫助用戶迅速提取主題的核心內(nèi)容,通過交互可以了解主題的詳細信息。如圖3視圖b所示,層次氣泡圖使用分布在外圍的10 個氣泡來表示10 個不同的主題,與中間的雷達圖坐標相對應(yīng),氣泡的大小反映了屬于該主題的人群比例。另外,我們在每個主題氣泡中展示了該主題最具代表性的4 個標簽,該標簽同時考慮了出現(xiàn)頻次和各主題間的唯一性。若用戶想深入了解主題的詳細內(nèi)容,可點擊相應(yīng)主題氣泡,系統(tǒng)將在中心位置顯示該主題前20 個標簽,如圖4所示。在該圖中,代表主題3、主題5 和主題7 的氣泡較大,表明喜歡這些主題的人較多。點擊主題氣泡8,可知喜歡該主題的人通常會喜歡貼有驚悚、神秘、恐怖等標簽的電影。此外,居中的大氣泡包含了許多小氣泡,每個小氣泡都與一個電影標簽相對應(yīng),氣泡的面積大小與其對應(yīng)的標簽在主題中的概率成正比。如果用戶希望查看相關(guān)標簽的電影,他可以通過點擊氣泡的操作來達成目的,此時系統(tǒng)的頁面會跳轉(zhuǎn)到所選標簽對應(yīng)的豆瓣電影頁面。

圖3 用戶畫像,視圖a 為標簽詞云,視圖b 由主題氣泡圖和主題雷達圖構(gòu)成Fig.3 (a)User portrait View,which includes Tag word-cloud;(b)Topic bubble chart and Topic radar chart

圖4 層次氣泡圖Fig.4 Hierarchical bubble chart

4.3 交互式推薦模型

交互式推薦模塊包含兩個部分:推薦展示和電影氣泡云圖。根據(jù)用戶的歷史觀影信息,系統(tǒng)將通過電影海報的方式向用戶展示推薦結(jié)果,而電影氣泡云圖則提供了一種不使用歷史觀影數(shù)據(jù),并為用戶實時推薦電影的方式。用戶通過點擊選擇當下感興趣的電影氣泡并設(shè)置推薦模型的融合參數(shù),系統(tǒng)可實時提升了推薦的靈活性,增加了用戶在推薦過程中的參與感。

4.3.1 推薦展示

系統(tǒng)將通過列表的方式向用戶展示個性化推薦列表中TOP-10 的電影,該列表包含了電影海報,電影名稱、電影評分以及內(nèi)容簡介。此外,用戶可點擊感興趣的電影海報,將跳轉(zhuǎn)至豆瓣電影網(wǎng)站對應(yīng)的電影頁面來查看更細節(jié)的信息。圖6(b)顯示了推薦展示界面的示例。

4.3.2 電影氣泡云圖

該視圖由數(shù)據(jù)集中綜合評分排名最高的前100部電影構(gòu)成。綜合評分考慮了電影評分和電影流行度,計算方法如公式2所示。

在電影氣泡云圖中,每個氣泡代表一部電影,氣泡的半徑與對應(yīng)電影的newRate 值成正比。用戶可點擊氣泡選擇感興趣的電影,拉動滑動條來改變?nèi)诤舷禂?shù),選擇完畢后,點擊“生成推薦”按鈕,系統(tǒng)將在推薦展示模塊實時展示新的推薦結(jié)果,因為此推薦過程不考慮用戶的歷史行為信息,不需要對模型進行預(yù)訓(xùn)練,故生成推薦結(jié)果的過程不需要等待,可立即完成。另外,氣泡云圖中的電影名已超鏈接至該電影的豆瓣介紹界面。

5 案例分析

本節(jié)將展開RecVis 系統(tǒng)的多個案例分析,以驗證該可視推薦系統(tǒng)的有效性和實用性。另外,可通過鏈接對本系統(tǒng)進行訪問:http://39.105.145.46:5000/。

5.1 用戶畫像案例分析

此案例分析選擇了兩個代表性的用戶:用戶38和用戶15。首先來看用戶38 的案例分析,從圖6(a)中的用戶標簽詞云可知,該用戶特別喜歡看帶有美國標簽的電影,同時,從圖6(b)所示的推薦結(jié)果中發(fā)現(xiàn),這10 部個性化推薦電影中有7 部都是美國電影。此外,我們還發(fā)現(xiàn)愛情、喜劇、文藝等標簽也有較大的權(quán)重,并從推薦結(jié)果中看到屬于愛情標簽的電影有《愛在日落黃昏時》、《愛再來一次》、《泰坦尼克號 3D 版》;屬于喜劇標簽的電影有《愛情與靈藥》、《龍門鏢局》;以及屬于文藝類的電影《音樂之聲》等。由此可知,推薦結(jié)果與用戶的歷史觀影偏好十分吻合,證明了本文推薦系統(tǒng)的有效性。

圖6 用戶編號為38 的案例分析Fig.6 Case study with user number 38

接著,我們從圖6(a)所示的用戶主題雷達圖中發(fā)現(xiàn),該用戶在主題3 和主題7 上的隸屬度最高,結(jié)合圖4 中的主題層次氣泡圖進行分析,我們發(fā)現(xiàn)這兩個主題包含了與上述詞云標簽相同或相似的內(nèi)容。由此可知,用戶畫像直觀且準確地展示了用戶的觀影偏好。

接下來,我們對用戶15 進行分析,該用戶的用戶畫像以及推薦結(jié)果如圖7所示。

圖7 用戶編號為15 的案例分析Fig.7 Case study with user number 38

從用戶雷達圖可知,該用戶在主題5 下的隸屬度格外突出,結(jié)合圖8 的主題氣泡圖進行詳細分析,可知該用戶喜歡科幻、動作、懸疑、犯罪類電影,與標簽詞云中較大權(quán)重的詞相吻合。同時,我們發(fā)現(xiàn)該用戶的標簽詞云中美國一詞有較大權(quán)重,這是否意味著用戶15 和用戶38 一樣都喜歡美國電影呢?為了尋找答案,我們查看了用戶15 的觀影記錄,發(fā)現(xiàn)帶有美國標簽的電影幾乎為科幻、動作、犯罪類電影,而帶有中國標簽的一般為愛情、喜劇、劇情類電影。這一發(fā)現(xiàn)表明該用戶不是喜歡看貼有美國標簽的電影,而是因為喜歡的科幻類電影太多來自于美國,以致于在標簽集合中美國的權(quán)重較大。這一發(fā)現(xiàn)也與事實相符,因為美國的科幻電影確實舉不勝舉,是好萊塢大片的主題之一,特效炫酷,概念超前,一直深受大眾喜愛。

圖8 主題5 的細節(jié)語義信息Fig.8 Detailed semantic information of topic 5

接著,我們查看了針對用戶15 的推薦結(jié)果,圖7(b)所示,有4 部動作、科幻類電影,其中《罪惡之城》、《全面回憶》、《火星救援》屬于美國電影,《竊聽風(fēng)云》屬于中國電影。除此之外,《冰雪奇緣》、《沉睡魔咒》屬于美國的奇幻冒險類電影;中國的《分手合約》、《全球熱戀》屬于愛情劇情類電影。由此可知,推薦結(jié)果與用戶的歷史觀影偏好一致,證明了本文推薦系統(tǒng)的有效性。

經(jīng)過以上案例分析可知,通過用戶畫像模塊,用戶可以很直觀地了解自己的觀影喜好,同時對自己的觀影歷史也能有概括性的審視。

5.2 交互式推薦案例分析

為了評估電影氣泡圖中的交互推薦功能,以及模型融合系數(shù)g 對最終推薦結(jié)果的影響,本文將使用四個測試案例進行分析。

5.2.1 單一用戶案例分析

為了驗證不同用戶反饋對實時推薦結(jié)果的影響,我們將模擬同一用戶在電影氣泡圖中選擇不同的電影作為反饋信息,以此查看不同反饋下的推薦結(jié)果間的差異,共進行了3 次推薦測試,下面將一一介紹。

在第一次推薦測試中,我們模擬了想要尋找人性、經(jīng)典、勵志、溫情、正能量的高分電影,故在電影氣泡圖中選了《海上鋼琴師》、《阿甘正傳》以及《肖申克的救贖》,如圖9(a)右所示,這三部電影都是眾人皆知的經(jīng)典電影,常用標簽有人生、勵志、經(jīng)典、成長、愛情等,屬于豆瓣必看榜上的前50。隨后,我們將全局模型參數(shù)設(shè)置為0.7。根據(jù)以上反饋信息生成的最終推薦結(jié)果如圖9(a)左所示。從該推薦結(jié)果的海報描述中,我們發(fā)現(xiàn)這10 部電影都是經(jīng)典的高分電影,最低也是8.7 分。其中,《當幸福來敲門》屬于勵志、感動、人生類電影;《霸王別姬》屬于經(jīng)典、人性、愛情類電影,探討人性的電影有《辛德勒的名單》,而《這個殺手不太冷》、《放牛班的春天》則屬于成長、溫情類題材的電影。綜上所述,該推薦結(jié)果符合我們的尋找初衷,證明了該系統(tǒng)能夠根據(jù)用戶的興趣推薦出合適的電影。

圖9 推薦結(jié)果Fig.9 Recommended results

第二次測試,我們模擬了想要尋找探案、間諜、懸疑類題材的用戶需求。全局模型參數(shù)仍為0.7,但在電影氣泡圖中,我們選擇了《神探夏洛克 第一季》、《潛伏》、《疑犯追蹤 第一集》等高分懸疑犯罪類電影。根據(jù)以上反饋信息生成的實時推薦結(jié)果如圖9(b)右所示。通過點擊海報查看電影的詳細信息后我們發(fā)現(xiàn),這10 部影片幾乎都是犯罪或懸疑類電影,包括《神探夏洛克 第二季》、《神探夏洛克第三季》以及《風(fēng)聲》、《黑鏡》等,也有愛情類電影《兩小無猜》、《蝸居》和《贖罪》,查看了用戶畫像發(fā)現(xiàn),推薦愛情類電影是由于用戶曾經(jīng)觀看過許多愛情類電影。

綜上所述,電影氣泡圖的推薦結(jié)果確實能夠滿足用戶當下的需求,且不需要等待計算過程,能夠做到實時推薦。

在第三次測試中,我們登錄了用戶107 的賬號,并選擇了和第一次測試相同的電影。然后,將全局模型參數(shù)分別設(shè)置為0.1 和0.8,最終推薦結(jié)果分別如圖10(a)、(b)所示,在圖10(a)中,系統(tǒng)推薦了有關(guān)愛情與喜劇的影片《兩小無猜》和《非常完美》,可以發(fā)現(xiàn)這兩部電影與我們選擇的人性、勵志類題材電影截然不同。通過對用戶畫像的分析,我們發(fā)現(xiàn)該用戶喜歡愛情、美國、經(jīng)典、喜劇等電影。因此,當全局系數(shù)較小時,局部模型對最終推薦結(jié)果的影響較大。圖10(b)展示的推薦結(jié)果所獨有的兩部影片都是newRate 值很高的電影——《這個殺手不太冷》和《辛德勒的名單》。這表示全局參數(shù)更大時,推薦結(jié)果從“更個性化”轉(zhuǎn)為“更普適性”。通過上述測試,驗證了全局模型參數(shù)的影響,證明了我們的系統(tǒng)可以讓用戶更準確地控制推薦結(jié)果。

圖10 不同全局模型參數(shù)的推薦結(jié)果Fig.10 Recommended results for different global model parameters

5.2.2 局部人群內(nèi)部用戶案例分析

在對推薦系統(tǒng)中的局部人群內(nèi)部進行案例分析后發(fā)現(xiàn),任意兩個用戶在電影氣泡云中選擇相同的電影,只要他們屬于同一個子群,那么推薦結(jié)果總是相同的。這與推薦系統(tǒng)的最初設(shè)計意圖一致,針對不同的用戶群體訓(xùn)練不同的推薦模型,而處于同一群體的用戶由相同的推薦引擎生產(chǎn)推薦結(jié)果。

5.2.3 局部人群間用戶案例分析

除了對同一局部人群進行測試外,我們使用用戶87(子群4)和用戶109(子群3)對不同局部群展開了分析。與上述測試案例一樣,選取了《阿甘正傳》、《美麗人生》、《放牛班的春天》這三部電影,并將全局參數(shù)設(shè)置為0.1。最終推薦結(jié)果如圖11所示。

圖11 不同局部人群的推薦結(jié)果Fig.11 Recommendation results for different local populations

在對比兩組推薦結(jié)果后發(fā)現(xiàn),《飛越瘋?cè)嗽骸贰ⅰ队赂业男摹贰ⅰ肚c千尋》、《霸王別姬》、《怦然心動》和《天使愛美麗》等電影只出現(xiàn)在用戶87 的推薦結(jié)果中。《機器人總動員》、《泰坦尼克號》、《3 傻大鬧寶萊塢》、《辛德勒的名單》、《這個殺手不太冷》和《羅馬假日》等6 部電影則屬于用戶109。由此可知,即使初始電影和全局參數(shù)相同,只要屬于不同局部模型,推薦結(jié)果的差異就會很大。這也說明不同局部人群的偏好區(qū)別大,融合模型能夠個性化推薦。

通過以上案例分析,我們驗證了推薦系統(tǒng)RecVis 推薦結(jié)果的準確性,反映了基于局部模型融合的推薦策略的合理性。

5.2.4 用戶體驗分析

為了驗證本系統(tǒng)的可行性,我們邀請了12 位非推薦算法領(lǐng)域的普通用戶對該系統(tǒng)進行深度體驗,這項研究是基于個人進行的。首先,我們在沒有任何介紹說明的情況下,讓用戶自行根據(jù)系統(tǒng)首頁的簡單介紹來了解該系統(tǒng)的大致功能和內(nèi)容,用戶可以自由探索并熟悉了解這個系統(tǒng)。隨后,他們將完成一系列的評估任務(wù),并回答下列問題。

表2 任務(wù)-提問內(nèi)容Table 2 Task and Question content

這些評估任務(wù)的設(shè)計目的與我們之前總結(jié)的分析任務(wù)一致,若受訪者回答正確,則視為通過該任務(wù)。最后,受試者需要填寫一份調(diào)查問卷,該問卷包含6 個問題,其中1-5 的問題通過打分進行評估,最后一個問題為開放性問題。問題Q1:RecVis 的界面是否直觀和易于使用?工作流程是否容易學(xué)習(xí)? Q2:用戶畫像中的主題分類是否合理?是否能夠正確反映用戶的觀影歷史?Q3:主題氣泡圖、主題雷達圖以及推薦結(jié)果的結(jié)合分析,能否幫助您理解推薦結(jié)果的生成原因?Q4:通過電影氣泡云圖的實時推薦是否符合預(yù)期?Q5:該系統(tǒng)對您理解推薦結(jié)果的生成原因有多大幫助?Q6:該系統(tǒng)還有哪些需要改進地方?

基于任務(wù)的用戶調(diào)查中,每個受訪者熟悉系統(tǒng)并完成所有任務(wù)總共平均花費10 分鐘,且?guī)缀醵寄苷_回答所設(shè)任務(wù)問題,僅有兩人在面對任務(wù)2 中的第一個問題時存在遲疑,無法準確分辨電影類型特征,但在點擊電影海報查看詳情后立刻理解了電影特征。最后,我們根據(jù)受訪者填寫的問卷信息進行了匯總,打分情況如圖12所示。

圖12 用戶滿意度打分匯總表Fig.12 User Satisfaction ratings

從圖中針對問題1 的打分情況可知,我們的系統(tǒng)是符合普通用戶要求的,受訪者就用戶所需學(xué)習(xí)時間成本和圖表的直觀性而言給予了較高分數(shù)。另外,受訪者均對通過LDA 主題模型針對電影主題的分類結(jié)果表示十分認可,例如主題2 中有“日本”、“動畫”、“宮崎駿”、“二次元”等關(guān)鍵詞,這與實際非常貼合,因為從1917年開始,日本的動畫產(chǎn)業(yè)就沒有間斷過,甚至在全球范圍內(nèi)也是十分昌盛的,只是演員人名和電影類型標簽的混合稍微讓人感覺混亂。滿意度最低的情況出現(xiàn)在問題4 中,有三成用戶認為可以增加電影氣泡云圖選中電影后實時更新用戶畫像的功能,以增加對推薦結(jié)果生成原因的理解以及更多交互探索功能。總體而言,該系統(tǒng)符合普通用戶需求,可以很好地展示用戶的歷史觀影記錄特征與推薦結(jié)果之間的關(guān)系,幫助普通用戶理解推薦結(jié)果,增加了用戶在推薦過程中的參與感。

6 總結(jié)

本文介紹了一種基于多模型融合的交互式電影推薦系統(tǒng)的設(shè)計、實現(xiàn)和測試。該系統(tǒng)相比于傳統(tǒng)推薦算法使用用戶-物品二部圖來挖掘用戶歷史觀影特性,使用基于標簽的方法來描述用戶的潛在喜好,并采用基于用戶聚類的加權(quán)局部模型融合推薦算法,準確地捕獲用戶的局部特征,提供更個性化的推薦。此外,該系統(tǒng)使用基于Web 的可視交互系統(tǒng)RecVis,以提高用戶對推薦結(jié)果的理解,并為其提供了參數(shù)控制和實時交互推薦等功能,能夠增加用戶在推薦過程中的參與感,提高用戶體驗。

為了驗證本文推薦系統(tǒng)的準確性,我們對該領(lǐng)域中經(jīng)典的推薦算法進行性能比較,最終結(jié)果表明,本文的算法表現(xiàn)更優(yōu)。除此之外,還提出了一系列詳盡的案例分析,從各方面驗證了可視推薦系統(tǒng)RecVis 的有效性。

在未來的工作中,我們將對現(xiàn)有模型進行以下幾個方面的改進。首先,在生成用戶特征向量時,同時考慮用戶-物品矩陣信息和用戶觀看電影的標簽信息,使得模型能夠更準確地挖掘用戶偏好。其次,優(yōu)化SLIM 線性稀疏模型,以提高最終融合系統(tǒng)的推薦質(zhì)量。第三,設(shè)計更加合理的可視化模式。例如,將所有視圖通過更加簡練的方式合并在同一個頁面,以實現(xiàn)更好的綜合分析和交互效果。

利益沖突聲明

所有作者聲明不存在利益沖突關(guān)系。

猜你喜歡
用戶模型系統(tǒng)
一半模型
Smartflower POP 一體式光伏系統(tǒng)
WJ-700無人機系統(tǒng)
ZC系列無人機遙感系統(tǒng)
北京測繪(2020年12期)2020-12-29 01:33:58
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
主站蜘蛛池模板: 尤物精品国产福利网站| 伊人精品视频免费在线| 久久精品亚洲热综合一区二区| 免费在线看黄网址| 国产日产欧美精品| 国产一级无码不卡视频| 91精品视频在线播放| 成年女人a毛片免费视频| 欧美黑人欧美精品刺激| 久久午夜夜伦鲁鲁片无码免费| 亚洲AV电影不卡在线观看| 性色在线视频精品| 国产精品一区二区在线播放| 亚洲VA中文字幕| 97在线观看视频免费| 丁香婷婷久久| 国产精品女主播| 99热免费在线| 日韩欧美中文字幕一本| 成人午夜久久| 欧美成人手机在线视频| 欧美在线精品一区二区三区| 国产精品吹潮在线观看中文| 亚洲av中文无码乱人伦在线r| 高清欧美性猛交XXXX黑人猛交| 999精品色在线观看| 亚洲无线观看| 1769国产精品免费视频| 在线视频一区二区三区不卡| m男亚洲一区中文字幕| 日本手机在线视频| 伊人丁香五月天久久综合| 一本大道无码日韩精品影视| 日韩毛片基地| 国产精品视频导航| 欧美激情网址| 在线看片免费人成视久网下载| 国产一区二区免费播放| 国产成人精彩在线视频50| 中文字幕第1页在线播| 黄色网页在线观看| 日韩福利视频导航| 亚洲性视频网站| 亚洲精品色AV无码看| 久久综合伊人 六十路| 午夜视频在线观看免费网站| 国产在线视频欧美亚综合| 69国产精品视频免费| 国产区免费| 99草精品视频| 国产视频入口| 丁香亚洲综合五月天婷婷| 日韩色图区| 国产精品吹潮在线观看中文| 99ri精品视频在线观看播放| 久久精品aⅴ无码中文字幕| 国产日韩欧美在线视频免费观看| 欧美在线免费| 日本不卡在线播放| 亚洲色欲色欲www网| 在线观看精品国产入口| 熟妇人妻无乱码中文字幕真矢织江 | 国产AV无码专区亚洲精品网站| 日本AⅤ精品一区二区三区日| 日韩激情成人| 国产自视频| 91探花在线观看国产最新| 九色视频一区| 亚洲伦理一区二区| 亚洲综合在线最大成人| 国产伦精品一区二区三区视频优播| 亚洲性影院| 热久久综合这里只有精品电影| 亚洲av综合网| 国产精品无码AⅤ在线观看播放| 97国内精品久久久久不卡| 久久久久久久久18禁秘| 无码高潮喷水专区久久| 久996视频精品免费观看| 日韩AV无码免费一二三区| 91毛片网| 思思热在线视频精品|