999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

新聞推薦系統中的邊信息融合Transformer

2023-05-30 06:27:37賀雋文邵偉衛剛
電腦知識與技術 2023年1期
關鍵詞:深度學習

賀雋文 邵偉 衛剛

摘要:推薦系統中對多模態的數據處理方式是業界長期關注的重點,基于各類數據的特點設計模型,可以有效利用信息,從而提升推薦效率。文章針對新聞推薦系統提出SIA-Transformer結構,在傳統Transformer的基礎上結合了新聞的邊信息。通過多組內積的形式,將單詞特征與邊信息特征在多頭注意力層中進行交叉,提高了邊信息利用率的同時,也豐富了文本特征提取的語義,使得基于SIA-Transformer的新聞文本特征提取方法獲取到更多信息,從而提高了推薦的效果。文章基于微軟MSN開放的大型新聞數據集MIND進行了實驗,驗證了模型的效果。

關鍵詞:新聞推薦系統;邊信息;多模態;深度學習

中圖分類號:TP311? ? ? ? 文獻標識碼:A

文章編號:1009-3044(2023)01-0004-03

1 概述

隨著消費互聯網的快速發展,互聯網的馬太效應帶來了嚴重的信息過載問題,推薦系統在互聯網平臺解決信息過載問題的過程中發揮了巨大作用。以新聞推薦系統為例,通常需要基于新聞內容、用戶信息以及用戶的歷史行為等特征,使用自然語言處理、統計機器學習、計算機視覺等技術,精準地將新聞推送給用戶。面對多模態的數據,如離散型和連續型數據、文本和圖像數據、圖數據等,業界的常用做法是針對不同類型的數據,分別獨立地提取數據特征。當獨立處理各模態數據時,缺乏各模態數據之間的交互與監督,因此難以提取到各模態數據之間的關聯,導致信息的損耗。

個性化新聞推薦系統中通常包含新聞模型與用戶模型兩大模塊,前者是基于內容理解技術提取新聞的內容和特點,后者則是基于用戶信息與歷史點擊行為來建模用戶的興趣愛好?;趨f同過濾的推薦算法主要是根據用戶與商品交互記錄來進行推薦,本質上是基于用戶/商品相似度的統計方法。在新聞推薦系統中,由于新聞商品往往具有較強的時效性,因此會面臨嚴重的商品冷啟動問題。對標題、摘要等文本信息和主題、類別等邊信息的利用則是緩解商品冷啟動問題的主要辦法,也是新聞推薦系統中優化文本特征提取的動機。

1.1 相關工作

現有主流的基于深度學習的新聞推薦系統通常使用自動編碼器、CNN[1](卷積神經網絡)、RNN(循環神經網絡)、Transformer來進行文本特征的提取。

Okura[2]等引入帶有弱監督的自動編碼器實現文本特征提取,Zhang等[3]進一步使用改進的自動編碼器SDAE(stacked denoising auto-encoder) 作為文本特征提取器。An等[4]提出使用CNN網絡來提取新聞標題及類別中的文本特征,并在用戶興趣建模中使用GRU(Gated Recurrent Unit) 處理用戶歷史點擊的新聞稿件特征,從而實現對用戶的長短期興趣的建模。Lee[5]等則使用BIGRU(Bi-directional Gated Recurrent Unit) 來進行文本特征提取。Wu等[6]在用戶興趣建模中引入注意力機制,從而更好地聚合用戶的歷史點擊新聞特征。Wu等[8]則使用Transformer作為文本的特征提取器。

部分模型將邊信息引入了新聞商品的文本特征提取流程中,取得了更好的效果,如Wang等[7]在文本提取過程中引入邊信息,將新聞的類別特征也視作文本與標題中的文本拼接后再輸入3D卷積網絡。但此方法融合邊信息的方式過于簡單,且僅利用了文本類的邊信息。因此,面對不同類型的邊信息,對現有文本提取網絡進行優化改進,從而在文本特征提取過程中最大程度地發揮邊信息的約束與監督作用,是本文的改進重點。

2 模型結構

2.1 SIA-Transformer框架

如圖1所示,SIA-Transformer基于傳統Transformer網絡的編碼層,在其基礎上將邊信息引入到最核心的多頭注意力層中,邊信息類型可以包括文本信息(如用戶評論、新聞類別),圖片信息(如新聞封面、知識圖譜等),統一以embedding的形式輸入到多頭注意力層中。

2.2 邊信息融合

2.3 邊信息注意力權重

傳統Transformer認為,每個單詞的特征表示由其他單詞的V向量根據注意力權重聚合而成,注意力權重則通過由目標單詞的Q向量點乘其他單詞的K向量,再通過softmax歸一化后得到。

考慮到在不同類別的新聞文本當中,對相同單詞的關注程度是不相同的,因此本文將邊信息引入到多頭注意力層中注意力權重的計算過程中,改良后的注意力權重計算方式如圖2所示。

2.4 邊信息融合特征

3 實驗結果與分析

本文選用微軟MSN大規模數據集MIND,通過對比不同模型中分別使用傳統Transformer與SIA-Transformer作為文本特征提取器的效果,驗證本文中方法的有效性。實驗中使用新聞的一級與二級類別作為邊信息,選用AUC作為模型效果指標,以經典新聞推薦模型NPA和LSTUR作為基線模型的對比結果,如表1所示。

通過實驗結果可以看到,在NPA及LSTUR中,相較于Transformer,以SIA-Transformer作為文本特征提取器,使得auc指標在驗證集上均取得了正向收益,說明了模型的有效性。

4 結束語

本文中提出的SIA-Transformer作為新聞推薦系統中的文本特征提取器,通過引入邊信息到多頭注意力層中,使得邊信息能夠更充分地約束與指引文本特征的提取,使得提取的單詞特征向量具有更準確與豐富的語義,在實驗中取得了較好的效果。

同時,本文中的方法也存在一些問題與待改進的方向。首先,本文中只使用了新聞的一級與二級類別邊信息,還有待于擴展到其他模態的邊信息,從而獲取到更多的信息增益,如圖像信息、知識圖譜實體映射關系等。另外,本文中邊信息作用于注意力權重及特征融合的方式較為簡單,更復雜與精巧的設計可以在將來的研究中再進一步探索。最后,提取文本特征的方法除了在Transformer的基礎上進行改進以外,還可以考慮自然語言處理領域的其他最新成果,如Bert模型,如何將其他自然語言處理領域的最新成果與新聞推薦的任務結合起來優化模型,從而獲取到更好的推薦效果,也是未來的研究方向之一。

參考文獻:

[1] Zhang Y, Wallace B C. A sensitivity analysis of (and practitioners guide to) convolutional neural networks for sentence classification[C]//Proceedings of the Eighth International Joint Conference on Natural Language Processing.Taipei:Asian Federation of Natural Language Processing,2017:253-263.

[2] Okura S,Tagami Y,Ono S,et al.Embedding-based news recommendation for millions of users[C]// Halifax,NS,Canada:Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,2017. New York:ACM,2017:1933-1942.

[3] Zhang F Z,Yuan N J,Lian D F,et al.Collaborative knowledge base embedding for recommender systems[C]// San Francisco,California,USA:Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,2016. New York:ACM,2016:353-362.

[4] An Mingxiao,Wu Fangzhao,Wu Chuhan,et al.Neural News Recommendation with Long- and Short-term User Representations[J].ACL,2019(1):336-345.

[5] Lee D,Oh B,Seo S,et al.News recommendation with topic-enriched knowledge graphs[C]// Virtual Event,Ireland:Proceedings of the 29th ACM International Conference on Information & Knowledge Management,2020. New York:ACM,2020:695-704.

[6] Wu C H,Wu F Z,An M X,et al.Neural news recommendation with attentive multi-view learning[J].CoRR,2019,abs/1907.05576:3863-3869.

[7] Wang H Y,Wu F Z,Liu Z,et al.Fine-grained interest matching for neural news recommendation[C]//Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics.Online.Stroudsburg,PA,USA:Association for Computational Linguistics,2020:836-845.

[8] Wu C H,Wu F Z,Huang Y F,et al.Neural news recommendation with negative feedback[J].CCF Transactions on Pervasive Computing and Interaction,2020,2(3):178-188.

【通聯編輯:唐一東】

猜你喜歡
深度學習
從合坐走向合學:淺議新學習模式的構建
面向大數據遠程開放實驗平臺構建研究
基于自動智能分類器的圖書館亂架圖書檢測
搭建深度學習的三級階梯
有體驗的學習才是有意義的學習
電子商務中基于深度學習的虛假交易識別研究
現代情報(2016年10期)2016-12-15 11:50:53
利用網絡技術促進學生深度學習的幾大策略
考試周刊(2016年94期)2016-12-12 12:15:04
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
深度學習算法應用于巖石圖像處理的可行性研究
軟件導刊(2016年9期)2016-11-07 22:20:49
主站蜘蛛池模板: 亚洲毛片一级带毛片基地| 2021最新国产精品网站| 色综合热无码热国产| 亚洲精品免费网站| 欧美日韩动态图| aaa国产一级毛片| 日韩美一区二区| 91免费观看视频| 欧美在线国产| 国产一区免费在线观看| 国内熟女少妇一线天| 亚洲日韩在线满18点击进入| 亚洲人成成无码网WWW| 久久精品嫩草研究院| 国产爽歪歪免费视频在线观看| 成年看免费观看视频拍拍| 最新无码专区超级碰碰碰| 99草精品视频| 免费观看国产小粉嫩喷水| 色妞www精品视频一级下载| 亚欧美国产综合| 国产精品无码久久久久久| 国产人妖视频一区在线观看| 亚洲欧美成人综合| 一本大道香蕉久中文在线播放| 国产无遮挡猛进猛出免费软件| 无遮挡国产高潮视频免费观看 | 国产免费精彩视频| 9啪在线视频| 欧美日韩成人| 国产三区二区| 波多野结衣亚洲一区| 在线看片国产| 欧美日韩综合网| 久久五月天国产自| 免费jizz在线播放| 永久天堂网Av| 97视频免费在线观看| 欧美日韩一区二区三区在线视频| 色网站在线免费观看| 国产福利观看| 国产男女免费完整版视频| av免费在线观看美女叉开腿| 亚洲侵犯无码网址在线观看| 综合色在线| 黄色在线网| 免费一级无码在线网站| 成人免费黄色小视频| 国产簧片免费在线播放| 亚洲天堂精品视频| 久久这里只有精品2| 日韩少妇激情一区二区| 草草线在成年免费视频2| 日韩精品无码免费一区二区三区| 午夜性刺激在线观看免费| 亚洲va在线∨a天堂va欧美va| 色婷婷色丁香| 色亚洲激情综合精品无码视频| 国产凹凸视频在线观看| 欧美日本视频在线观看| 久久亚洲国产一区二区| 一区二区三区国产精品视频| 丝袜美女被出水视频一区| 色天堂无毒不卡| 亚洲国产日韩在线成人蜜芽| 国产免费福利网站| 在线精品欧美日韩| 国产亚洲第一页| 99热这里只有精品国产99| 色老二精品视频在线观看| 亚洲AV人人澡人人双人| 亚洲永久精品ww47国产| 久久96热在精品国产高清 | 麻豆国产精品一二三在线观看| 超碰精品无码一区二区| 熟妇无码人妻| 中国国语毛片免费观看视频| 久久久久青草大香线综合精品| 国产在线观看精品| 国产成人无码AV在线播放动漫| 一区二区三区国产| 婷婷丁香色|