




摘 要: 在缺乏用戶交互互補項目方面數據的情況下,將用戶對項目的偏好融合到只考慮項目關系的互補項目推薦中,提高推薦模型的性能。提出一種基于知識圖譜的互補項目推薦方法,在用戶歷史交互項目集中推測用戶交互的互補項目,基于知識圖譜提取用戶對互補項目的偏好,利用圖像與文本學習項目之間的互補關系,最后基于神經網絡實現兩者的共同學習。提出的方法在Amazon數據集上與次優的基線方法相比,ACC提升了7%,precision提升了3%,這說明提出的方法性能優異。該算法共同學習用戶對項目的偏好與項目之間的互補關系,提升了推薦性能。
關鍵詞: 用戶偏好; 互補項目; 知識圖譜; 推薦
中圖分類號: TP393 ""文獻標志碼: A
文章編號: 1001-3695(2022)05-016-1380-06
doi:10.19734/j.issn.1001-3695.2021.10.0461
Recommendation of complementary items based on knowledge graph
Liu Guangming, Liang Yongquan, Ji Shujuan, Li Lin
(College of Computer Science amp; Engineering, Shandong University of Science amp; Technology, Qingdao Shandong 266590, China)
Abstract: In the absence of data on user interaction complementary items,this paper integrated user preferences for items into complementary item recommendation that only considered item relationships to improve the performance of the recommendation model.This paper proposed a method for recommending complementary items based on a knowledge graph,inferring the complementary items of user interaction in the user’s historical interaction items,extracting the user’s preference for complementary items based on the knowledge graph,and using the difference between image and text learning items complementary relationship,and finally realized the common learning based on neural network.Compared with the sub-optimal baseline method on the Amazon data set,the proposed method has a 7% increase in ACC and a 3% increase in precision,which shows that the performance of the proposed method is excellent.The method in this paper jointly learns the complementary relationship between the user’s preference for items and the items,and improves the recommendation performance.
Key words: user preferences; complementary projects; knowledge graph; recommendation
0 引言
互補項目推薦(complementary product recommendation,CPR)對亞馬遜、淘寶等在線電子商務的成功越來越重要。互補項目推薦通常幫助用戶找到一套高質量的相關項目,這些產品總是配套購買和使用以促進共同的需求,例如手機和手機殼。CPR可以激發顧客更多的潛在需求,帶來更大利潤的同時又提供更好的購物體驗。
現有基于互補項目的推薦方法大部分考慮的是如何對項目之間的互補關系進行建模,這是一個多模態信息表示的問題。在此領域,文本與圖像的整合是一個重要問題。Zhang等人[1]提出的LMSC通過子空間聚類,可以將多個視圖整合為一個綜合的潛在表示,并編碼多視圖間的互補信息。Song等人[2]提出的MMCNN-MIML方法首先從圖像和文本信息中生成多模態的表示,然后將兩者的嵌入連接起來,通過共享同一組內的標簽層,將類標簽分組直接合并到網絡中。Zhang等人[3]提出一種基于神經網絡的image-text表示方法,通過神經網絡來對文本與圖像的聯合嵌入進行融合。
根據基于項目信息的不同,互補項目推薦方法可以分為基于圖像、基于文本以及圖像與文本相結合。例如,McAuley等人[4]討論了如何在一個style space中發現可替換項目;Sun等人[5]利用關聯規則來尋找項目之間的隱式關系,并將其作為矩陣分解的正則化項;McAuley等人[6]認為用戶評論對于發現項目之間的關系非常有幫助;Xu等人[7]基于項目的上下文信息提出了一種對偶嵌入框架來捕捉項目之間互補關系的方法;McAuley等人[8]從項目的評論文本中學習替代品與互補品的語義,以此來區分替代品與互補品;Zhang等人[9]設計了一個基于神經網絡的框架,將從項目評論文本中提取的語義特征與項目嵌入相結合,以此來挖掘項目之間的替換與互補關系;Wang等人[10]提出了一個路徑約束框架,將項目嵌入通過映射函數投影到兩個獨立的空間中,在每個嵌入中加入路徑約束,以此來區分替代項目與互補項目;Hao等人[11]提出了一個深度學習框架,首先利用編/解碼器網絡預測多個互補產品類型,然后開發一個轉移度量學習網絡,將目標項目的嵌入投影到每個預測的互補產品類型子空間,并基于遠端監督標簽進一步學習互補關系;Zhang等人[12]將項目的圖像與文本信息相結合,提出了一種新的神經網絡框架。
然而CPR本質上是一個推薦問題,最終的服務對象是用戶,所以在CPR中不僅要考慮項目之間的互補問題,還要考慮用戶對項目的偏好。本文總結了將用戶偏好融入到CPR中所要面臨的三個問題:首先,用戶的歷史交互項目有限,即用戶—項目交互的稀疏性,難以從少量的數據中提取用戶的偏好;其次,如何平衡用戶對項的偏好與項目之間的互補關系;最后,缺乏用戶交互互補項目的數據。
首先,在推薦領域對于用戶—項目交互的稀疏性問題,可以通過引入側信息來緩解。在各種各樣的側信息中,知識圖譜(knowledge graph,KG)通常包含更豐富的事實與項目之間的聯系。KG是一種有向異構圖,其中節點對應實體,邊對應關系。自提出以來,KG在很多領域都受到了廣泛的關注。在推薦方面,由于KG結構化的知識能夠為項目提供豐富的側信息,所以KG被廣泛應用到相似項目推薦中,顯著提高了推薦系統的性能。受Wang等人[13]的啟發,本文引入了KG,并采用一種基于k-hop鄰居集合的方法來提取用戶偏好。此方法的關鍵思想是偏好傳播:對于一個用戶,其歷史交互項目在KG中的鄰居實體包含了用戶的潛在偏好;而以用戶歷史交互項目為起點沿著KG中的三元組迭代擴展的過程,是用戶偏好傳播的一個過程。
其次,對于項目之間互補關系,現有方法主要基于項目的圖像信息或者文本信息進行建模。而基于圖像信息的方法雖然在特定場景下的性能優異,但是缺乏泛用性。例如,McAuley等人[4]提出一種基于圖像信息的精心設計的項目互補關系建模方法,雖然在服飾領域性能表現優異,但在電子產品等領域的表現一般。因此,本文采用文本與圖像相結合的方法,從多方面對項目之間的互補關系進行建模。
最后,考慮到用戶對互補項目的選擇可能是互補關系與用戶偏好的復雜組合,本文提出了一種新的基于知識圖譜的互補項目推薦方法(KG based complementary item recommendation,KGCR),共同學習用戶偏好與項目之間的互補關系。KGCR同時考慮了用戶偏好與項目之間的互補關系,并能夠從用戶的歷史交互項目集中得到用戶交互的互補項目,從而解決用戶交互互補項目的問題。本文通過在大型Amazon數據集上進行實驗,將KGCR與一套最先進的基線方法的性能進行比較,結果表明KGCR的性能優于其他基線方法。
2.5 實驗結果
本文首先研究KGCR相對于基線方法的性能差異。所有方法的實驗結果如表3所示,以下幾點觀察結果非常突出:
a)在ACC方面,KGCR的準確率是最高的,同時相比于使用了相同的文本與圖像信息的ENCORE平均高出了8%,這表明考慮用戶偏好的KGCR對互補項目的推薦是非常有幫助的。
b)在precision方面,對于P@5與P@10,KGCR的表現都是最好的,相比于次優ENCORE的模型,分別提高了14.04%與16.76%,這表明考慮用戶的偏好要比考慮用戶的質量對互補項目的推薦更加有效,因為推薦的最終是對用戶的推薦。
c)與Amazon-book(AB)相比,在Amazon-book(BT)上,基本所有方法的表現最差,這是因為雖然BT對項目之間的互補關系表現最強,但是BT數據過于稀疏,不如AB稠密;在Amazon-book(AB+BT)上大部分方法的表現都要優于在Amazon-book(AB)與Amazon-book(BT)上,這是因為AB與BT合并,不僅緩解了BT的數據稀疏問題,而且增強了AB對項目之間互補關系的表現力。
為了進一步研究用戶偏好、文本、圖像以及神經網絡對KGCR的影響,本文將KGCR與其幾個變體進行性能比較,結果如表4所示(Δ表示與KGCR-M相比的ACC變化;AB表示also_bought;BT表示bought_tought)。在這里本文只關注了ACC,同樣的結果也適用于P@5與P@10。
a)KGCR-MT相對于KGCR-M性能是有一定提高的,尤其是also-bought與AB+BT分別提高了2.05%與 0.91%,這說明項目的文本信息對挖掘項目之間的互補關系是非常有幫助的。
b)相對于KGCR-MT與KGCR-M,考慮用戶偏好的KGCR-MTP在AB與AB+BT的性能有明顯提高,這說明在向用戶推薦互補項目時,用戶偏好是必須要考慮的問題。在BT上KGCR-MTP的性能降低,可能是因為BT的數據稀疏性問題,使得加入用戶偏好的優勢沒有體現出來。
c)KGCR-NT與KGCR-NM與KGCR相比,在性能上都有一定程度的下降,這表示項目的文本與圖像信息對于項目之間互補關系的建模都是非常重要的。
d)KGCR相對于KGCR-MTP性能在AB、BT與AB+BT均有一定提升,這表明在同時考慮用戶偏好的基礎上,神經網絡能夠更好地處理用戶偏好信息與項目互補關系信息之間的復雜關系。
e)總體來看,幾個方法在BT的性能差別不大,這可能還是因為數據過于稀疏,使得各變體之間的不同無法明顯體現出來。
3 結束語
本文提出了一種基于知識圖譜的互補項目推薦方法。首先,KGCR可以基于知識圖譜提取特定用戶的偏好并預測用戶對項目的偏好;其次,它從文本與圖像兩個方面挖掘項目之間的互補關系;最后,KGCR通過神經網絡來學習三者之間的復雜關系。本文在Amazon-book數據集上進行了廣泛的實驗,結果表明,與基線相比,KGCR將用戶對項目的偏好融合到互補項目推薦中,極大地提高了推薦模型的性能,并且,融合用戶對項目偏好的互補推薦項目更符合用戶的要求。
本文方法還存在一些不足,比如未能充分挖掘用戶歷史交互項目與未來互補項目之間的聯系,下一步需要對這方面進行深入研究。另外,本文方法對數據稀疏性的依賴也是在未來工作中要解決的重點問題。
參考文獻:
[1]Zhang Changqing,Fu Huazhu,Hu Qinghua,et al.Generalized latent multi-view subspace clustering[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2020,42(1):86-99.
[2]Song Lingyun,Liu Jun,Qian Buyue,et al.A deep multi-modal CNN for multi-instance multi-label image classification[J].IEEE Trans on Image Processing,2018,27(12):6025-6038.
[3]Zhang Yin,Lu Haokai,Niu Wei,et al.Quality-aware neural complementary item recommendation[C]//Proc of the 12th ACM Confe-rence on Recommender Systems.New York:ACM Press,2018:77-85.
[4]McAuley J,Targett C,Shi Qinfeng,et al.Image-based recommendations on styles and substitutes[C]//Proc of the 38th International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2015:43-52.
[5]Sun Jianshan,Wang Gang,Cheng Xusen,et al.Mining affective text to improve social media item recommendation[J].Information Processing and Management:an International Journal,2015,51(4):444-457.
[6]McAuley J,Yang A.Addressing complex and subjective product-related queries with customer reviews[C]//Proc of the 25th International Conference on World Wide Web.2016:625-635.
[7]Xu Da,Ruan Chuanwei,Cho J,et al.Knowledge-aware complementary product representation learning[C]//Proc of the 13th International Conference on Web Search and Data Mining.2020:681-689.
[8]McAuley J,Pandey R,Leskovec J.Inferring networks of substitutable and complementary products[C]//Proc of the 21st ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.New York:ACM Press,2015:785-794.
[9]Zhang Mingyue,Wei Xuan,Guo Xunhua,et al.Identifying complements and substitutes of products:a neural network framework based on product embedding[J].ACM Trans on Knowledge Discovery from Data,2019,13(3):1-29.
[10]Wang Zihan,Jiang Ziheng,Ren Zhaochun,et al.A path-constrained framework for discriminating substitutable and complementary pro-ducts in e-commerce[C]//Proc of the 11th ACM International Confe-rence on Web Search and Data Mining.New York:ACM Press,2018:619-627.
[11]Hao Junheng,Zhao Tong,Li Jin,et al.P-companion:a principled framework for diversified complementary product recommendation[C]//Proc of the 29th ACM International Conference on Information amp; Knowledge Management.New York:ACM Press,2020:2517-2524.
[12]Zhang Yin,Lu Haokai,Niu Wei,et al.Quality-aware neural complementary item recommendation[C]//Proc of the 12th ACM Confe-rence on Recommender Systems.New York:ACM Press,2018:77-85.
[13]Wang Hongwei,Zhang Fuzheng,Wang Jialin,et al.RippleNet:propagating user preferences on the knowledge graph for recommender systems[C]//Proc of the 27th ACM International Conference on Information and Knowledge Management.New York:ACM Press,2018:417-426.
[14]Zhang Yin,Lu Haokai,Niu Wei,et al.Quality-aware neural complementary item recommendation[C]//Proc of the 12th ACM Confe-rence on Recommender Systems.New York:ACM Press,2018:77-85.
[15]Krizhevsky A,Sutskever I,Hinton G E.ImageNet classification with deep convolutional neural networks[J].Communications of the ACM,2017,60(6):84-90.
[16]He Ruining,Packer C,McAuley J.Learning compatibility across categories for heterogeneous item recommendation[C]//Proc of the 16th International Conference on Data Mining.Piscataway,NJ:IEEE Press,2016:937-942.
[17]Le Q,Mikolov T.Distributed representations of sentences and documents[C]//Proc of the 31st International Conference on International Conference on Machine Learning.2014:1188-1196.
[18]Mikolov T,Chen Kai,Corrado G,et al.Efficient estimation of word representations in vector space[EB/OL].(2013-09-07).https://arxiv.org/abs/1301.3781.
[19]Zhang Fuzheng,Yuan N J,Lian Defu,et al.Collaborative knowledge base embedding for recommender systems[C]//Proc of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.New York:ACM Press,2016:353-362.
[20]Mikolov T,Sutskever I,Chen Kai,et al.Distributed representations of words and phrases and their compositionality[C]//Proc of the 26th International Conference on Neural Information Processing Systems.2013:3111-3119.
[21]McAuley J,Targett C,Shi Qinfeng,et al.Image-based recommendations on styles and substitutes[C]//Proc of the 38th International ACM SIGIR Conference on Research and Development in Information Retrieval.2015:43-52.
[22]He Ruining,Packer C,Mcauley J.Learning compatibility across categories for heterogeneous item recommendation[C]//Proc of the 16th International Conference on Data Mining.Piscataway,NJ:IEEE Press,2016:937-942.