999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于知識圖譜的新聞推薦系統研究

2021-12-27 08:53:01楊敬慧
科學與信息化 2021年18期
關鍵詞:深度用戶

楊敬慧

新華通訊社 北京 100803

引言

隨著互聯網的發展,人們的新聞閱讀習慣已逐漸從紙質媒體轉變為在線新聞網站。而網絡新聞平臺一個較為顯著缺點是新聞的數量之大讓用戶難以承受。為了減輕信息過載影響,幫助用戶針對自己的閱讀興趣,提出個性化的建議則顯得尤為重要。

考慮到在新聞推薦的特點和受到知識圖譜廣泛成功應用的啟發,本文提出了一種新的針對新聞內容推薦的框架,即深層知識knowledge-aware網絡(DKN)。DKN是一個基于內容的模型對于點擊率(CTR)的預測,這需要一個候選新聞和一個用戶的點擊歷史記錄作為輸入和輸出用戶點擊新聞的概率。DKN 模型主要分成三部分:知識抽取(Knowledge Distillation)、知識感知卷積神經網絡(KCNN:Knowledge-aware CNN)、用于抽取用戶興趣的注意力網絡(Attention Network:Attention-based User Interest Extraction)。下面對這三部分進行詳細的介紹。

1 知識抽取

知識抽取模塊的輸入是一些用戶點擊的新聞標題。首先將標題拆成一組詞,然后將標題中的詞與知識庫的實體進行鏈接,那么再接著找出距離鏈接實體一跳之內的所有鄰接實體,并將這些鄰接實體稱之為上下文實體。這樣,根據新聞標題可以得到三部分的信息,分別是詞,鏈接實體,以及上下文實體。由此分別得到了詞、鏈接實體、上下文實體的向量表示[1]。

2 知識感知卷積神經網絡 KCNN

KCNN是傳統CNN的擴展,它允許靈活地將知識圖譜中的符號知識整合到句子表示學習中,利用KCNN,我們得到了每一條新聞的知識感知表示向量。為了獲得用戶對當前候選新聞的動態表示,我們使用關注模塊將候選新聞自動匹配到每一條點擊的新聞,并用不同的權重聚合用戶的歷史。最后利用深度神經網絡(DNN)對用戶的嵌入和候選新聞的嵌入進行預測[2]。

3 注意力網絡

由于用戶對新聞主題的興趣可能多種多樣,并且在考慮用戶i是否會點擊候選新聞 時,用戶i的歷史點擊新聞可能會對候選新聞 產生不同的影響。為了表征用戶的不同興趣,文中使用注意力網絡來建模用戶點擊的新聞對候選新聞的不同影響,輸入:給定用戶i的點擊歷史新聞標題分別為{t1i,t2i,…,tNi};該用戶的點擊新聞則可以假設為e(t1i),e(t2i),…,e(tNi)。step1:將輸入的嵌入進行串聯,然后將使用深度神經網絡 H 計算歸一化的影響權重:

step2:得到影響權重s之后,將用戶i點擊的歷史新聞標題嵌入乘上影響權重,即可得到當前用戶的嵌入e(i)。

輸出:在給定用戶i嵌入e(i)和候選新聞 嵌入e(tj),在經過深度神經網絡可以得到預測用戶i點擊新聞的概率[3]。

4 實踐

我們的數據集來自進博會專題新聞庫的數據。每條數據主要包含時間戳、用戶id、新聞url、新聞標題和點擊計數(0表示未點擊,1表示點擊)。我們收集了大量隨機抽樣數據集作為測試集。此外,我們在進博會專題庫知識圖譜中搜索數據集中出現的所有實體以及它們一跳內的實體,并提取其中所有置信度大于0.8的邊。

基本的統計和分布給出了新聞數據集的知識圖譜特點如下:

第一,我們將一條新聞的生命周期定義為期限從出版日期至最后一次收到日期點擊。我們觀察到90%的新聞都是在兩分鐘內被點擊的,這證明了網絡新聞的時間敏感性極高并被頻率更高的新基因所取代。

第二,對于用戶而言,被點擊的新聞的分布數量規律為:80%的用戶點擊的新聞不超過5條。充分說明了新聞推薦中的數據稀疏性場景。

第三,數量的分布分別是新聞標題中的詞(沒有終止詞)和實體。每個標題的平均字數是8,實體是3.9,表明在新聞中幾乎平均每兩個詞中都會出現一個實體。高密度出現的實體也經驗性證明了KCNN的設計。

第四,發生時間分布一個實體在新聞數據集中的分布和編號提取出的知識圖中某個實體的上下文實體。充分說明了網絡新聞中實體的出現模式是稀疏的,且存在較長時間尾部(80%的實體出現次數不超過10次),但實體在知識圖中一般具有豐富的上下文:每個實體的上下文實體的平均數量為44。因此,上下文實體可以極大地豐富新聞推薦中單個實體的表示形式[4]。

5 結束語

本文提出了一種利用知識圖譜表示的深度知識網絡DKN。DKN在新聞推薦業務場景中面臨三大挑戰:

第一,與基于ID的col-laborative過濾方法不同,DKN是一種基于內容的深度點擊率預測模型,適合于高時間敏感的新聞。

第二,為了充分利用新聞內容中的知識實體和常識,設計了DKN中的KCNN模塊,從新聞的語義層次和知識層次表示兩個方面進行聯合學習。多通道、多個詞和實體的對齊使KCNN能夠結合來自異構源的信息,并保持每個單詞的不同嵌入的對應關系。

第三,為了模擬用戶不同歷史興趣對當前候選新聞的不同影響,DKN使用注意模塊動態計算用戶的聚合歷史表現。

我們在專題庫數據集上進行了廣泛的實驗。結果表明,DKN與強基線相比具有顯著的優越性,以及知識實體嵌入和注意模塊的使用效果。筆者認為,DKN 的特點是融合了知識圖譜與深度學習,從語義層面和知識兩個層面對新聞進行表示,而且實體和單詞的對齊機制融合了異構的信息源,能更好地捕捉新聞之間的隱含關系。利用知識提升深度神經網絡的效果將可能是一個值得研究的方向。

猜你喜歡
深度用戶
深度理解一元一次方程
深度觀察
深度觀察
深度觀察
深度觀察
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
提升深度報道量與質
新聞傳播(2015年10期)2015-07-18 11:05:40
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
主站蜘蛛池模板: 四虎国产精品永久一区| 热这里只有精品国产热门精品| 精品一区二区三区无码视频无码| 丰满人妻一区二区三区视频| 欧美综合中文字幕久久| 亚洲日本一本dvd高清| 视频一本大道香蕉久在线播放 | 欧美日本在线观看| 中文字幕一区二区人妻电影| 久久精品欧美一区二区| 九九香蕉视频| 国产成人精品2021欧美日韩| 久久91精品牛牛| 国产99视频在线| 欧美成人手机在线观看网址| www亚洲精品| 国产精品成人一区二区不卡| 最新国产你懂的在线网址| 亚洲无码日韩一区| 一本大道无码日韩精品影视| 久久久久亚洲av成人网人人软件| 久久精品国产国语对白| 伊人久久大香线蕉影院| 久热精品免费| 青青青伊人色综合久久| 这里只有精品在线| 欧美专区在线观看| 国产一区免费在线观看| 欧美天堂久久| 9丨情侣偷在线精品国产| 国产成人福利在线视老湿机| 成人免费黄色小视频| 67194在线午夜亚洲| 久久免费精品琪琪| 久久国产精品波多野结衣| 无码啪啪精品天堂浪潮av| 日韩久久精品无码aV| 国产午夜不卡| 风韵丰满熟妇啪啪区老熟熟女| 国产成人一区免费观看| 老司国产精品视频| 国产网站在线看| 亚洲综合激情另类专区| 日韩成人在线网站| 婷婷色狠狠干| 精品免费在线视频| 九色在线观看视频| 99re在线观看视频| 亚洲无码在线午夜电影| 在线看片国产| 国产浮力第一页永久地址| 久久一色本道亚洲| 91久久偷偷做嫩草影院| 美女亚洲一区| 国产高清无码麻豆精品| jizz在线免费播放| 午夜激情婷婷| 黄色成年视频| 亚洲精品在线91| 亚洲人成网站在线播放2019| 9cao视频精品| 日韩精品视频久久| 99草精品视频| 日日噜噜夜夜狠狠视频| 91久久国产综合精品女同我| 99久久精品久久久久久婷婷| 97青青青国产在线播放| 中文字幕亚洲电影| 特级毛片免费视频| 日韩欧美国产三级| 日本91视频| 亚洲欧洲天堂色AV| 伊人网址在线| 久久青草热| 99免费视频观看| 天天综合网站| 久久精品国产一区二区小说| 国产十八禁在线观看免费| 欧美精品另类| 丁香六月激情婷婷| 超碰精品无码一区二区| 无码专区在线观看|