999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于知識圖譜的網絡用戶長短期偏好推薦算法

2021-11-17 06:36:04佘學兵蔡愛平劉承啟
計算機仿真 2021年8期
關鍵詞:語義用戶模型

佘學兵,蔡愛平,劉承啟

(1.江西科技學院信息工程學院,江西 南昌 330098;2.南昌大學網絡中心,江西 南昌 330031)

1 引言

對于大多數網絡用戶來說,瀏覽網絡頁面信息時,頁面信息過多且極其復雜,信息結構較為松散等問題,導致獲取相關信息較為困難[1]。傳統的推薦算法僅考慮網絡用戶的短期偏好,易忽略用戶長期穩定的歷史偏好,通常情況下,過時信息容易被較新的信息所取代[2]。知識圖譜作為一種極為豐富的關聯語義網絡,可為推薦領域提供潛在的輔助信息,是解決上述問題的有效途徑。因此,對知識圖譜與網絡用戶長短期偏好相結合的推薦技術研究具有重要意義[3]。

王衛紅[4]等人提出基于聚類和用戶偏好的協同過濾推薦算法,該算法將網絡用戶信息類型的平均評價分數融合到評分矩陣中,并結合網絡用戶的自身屬性相似度;該算法在推薦過程中沒有對潛在的語義信息進行挖掘與補充,導致推薦結果的平方根間誤差較高。陳昊文[5]等人提出基于概念鄰域的Top-N推薦算法,該算法把用戶全局偏好度與鄰域偏好度進行結合實現對目標用戶的推薦結果。該算法的平均絕對誤差較高。王余斌[6]等人提出基于用戶評論評分與信任度的協同過濾推薦算法,該算法利用用戶的特征差異性對評論數據進行計算,引入用戶信任度可更準確地計算用戶相似度,進而實現對目標用戶的推薦結果。該算法在推薦過程中沒有對網絡用戶的歷史行為進行分析與解釋,導致推薦結果的召回率較低。

為解決上述算法存在的問題,提出基于知識圖譜的網絡用戶長短期偏好推薦算法,通過建立知識圖譜,再結合項目嵌入與用戶長短期學習來完成推薦。

2 知識圖譜的知識表示與融合

如圖1所示,知識圖譜的建立主要由4個部分組成,分別為知識抽取、知識表示、知識融合、知識推理。知識圖譜的構成首先對知識數據進一步提取知識,在數據庫中提取屬性、概念及實體間的對應關系,產生對應體系的知識表達,由于知識數據范圍較廣,并且數據均以不同的形式存在,因此對知識數據進行融合,獲取可靠的知識數據,經過嚴謹的數據質量評估得到合格的知識數據存儲于知識庫中,構成高質量的知識庫,以高質量知識庫為基礎,對知識圖譜更深層次的知識進行挖掘與推理[7]。

圖1 知識圖譜結構圖

通常情況下,知識圖譜以網絡結構的形式進行表示。知識表示主要根據人腦的工作機制,把實體的語義信息映射到低維向量空間中,稱為稠密低維實值向量,若對知識進行分布式表示,則在低維空間中可利用綜合向量對實體和關系的語義相似度進行計算,有效解決了數據稀疏等問題。

知識表示的主要應用分為語義相似度計算和鏈路預測。語義相似度計算在知識表示中,通過稠密低維的向量來表示實體的語義信息,實體間的語義相似度可利用計算相似度的公式進行計算。鏈路預測在知識表示中,對于知識圖譜隨機給出的實體,鏈路預測可將實體間的對應關系進行預測,并對實體間對應關系的正確性進行分析,鏈路預測使知識圖譜中的實體與關系更加全面化[9]。

知識庫中的數據均從不同類型的數據庫進行抽取,使取得的數據與已存在的實體或概念的語義信息產生不同的語義關系。因此,對于此語義關系描述不夠準確,需經過知識融合,使得實體間數據去除矛盾信息,將原始的低質量數據庫進行整合,達到相同標準的實體或概念的語義描述關系以及構成可靠的高層次知識組織,以此為后續的知識推理做好鋪墊[10]。

知識融合的主要步驟為數據預處理、實體對齊、屬性值決策以及關系建立。數據預處理主要是對錯誤數據、重復數據以及信息量少的數據進行處理;實體對齊主要是對于不同的數據描述關系進行整合;屬性值決策主要是在實體屬性發生沖突時,根據相關數據置信度提供準確的屬性值;關系建立是知識融合的重要步驟,首先對實體進行挖掘,獲取相同的實體或者關聯性較強的實體,利用實體記錄鏈接對實體進行計算與分析,根據實體的所屬特征對其它實體進行驗證并建立相關關系。

3 基于知識圖譜的網絡用戶長短期偏好推薦算法

基于知識圖譜的網絡用戶長短期偏好推薦算法首先獲取模型的知識表示形式與計算結果,構建知識圖譜,然后通過項目嵌入和判別性偏好學習來完成推薦[11]。

模型的知識表示形式與計算步驟如下:

1)距離模型(SE):結構化的表示方法首先將三元組中實體用分布式向量進行表示,然后把初始實體向量與終端實體向量均映射到與關系向量同一維度的空間中,分別表示為Ny,1、Ny,2,通過對投影向量間的距離進行計算,根據計算結果來判斷實體間在關系下的語義相似度,向量間的距離越小,越能證明實體間存在關系。對于結構化的表示方法對應的損失函數定義為fy(h,t),其計算公式如下

fy(h,t)=|Ny,1kh-Ny,2kt|

(1)

由于此模型對初始實體和終端實體進行映射操作的關系向量不同,導致實體與關系的語義聯系不夠準確、協同性較差。

2)單層神經網絡模型(SLM):該模型以距離模型為基礎,通過非線性操作對距離模型進行優化,消除距離模型協同性差、準確度低等問題,但SLM模型的計算過程較為復雜,其具體計算公式如下

(2)

3)雙線性模型:該模型對實體存在的對應關系進行雙線性變換,對實體間存在關系的語義相似性進行描述,該模型的計算過程較為簡單,并且可有效提高實體與關系的語義協同性,其具體計算公式如下

(3)

式中,關系y雙線性變換矩陣表示為Ny∈Rd×d。

4)神經張量模型(NTN):該模型主要是把不同維度的初始實體向量與終端實體向量通過雙線性張量進行連接,使實體間的語義聯系更加準確,其計算公式如下

(4)

5)矩陣分解模型:該模型通過矩陣分解對實體的低維向量進行表示,分解公式如下

(5)

式中,對張量M進行分解,即分解結果為Mhyt。

6)翻譯模型(TransE):該模型是在向量空間平移不變的情況下進行翻譯,對初始實體向量至終端實體向量的翻譯定義為關系y。在關系y中,三元組(h,y,t)的關系向量表示為ky,初始實體向量表示為kh,終端實體向量表示為kt,通過關系向量ky把實體向量kh、kt進行連接,即kh+ky≈kt。kh+ky與K1或K2的距離定義為損失函數,取得結果越小則距離越小,即

fy(h,t)=|kh+ky+kt|K1K2

(6)

該模型的知識表示形式與計算過程較為簡單,實用性較強。基于此,抽取知識圖譜序列,并得到序列集合。項目嵌入的原理是構建隨機游走序列,然后提取用戶實體序列,通過Node2vec算法對抽取的實體間的同質性與同構性進行遍歷,其隨機游走的幾率計算公式為

(7)

式中,已進行歸一化處理的數據表示為z,未進行歸一化處理的幾率為κvx,關系式κvx=αqp(t,x)·wvx是針對于常見的隨機游走序列進行表示,其具體表示為κvx與實體權重間的關系。式中的系數αqp(t,x)計算公式如下

(8)

式中,上一節點表示為t,對下一步隨機游走的節點進行預計,其游走節點目標表示為x,對隨機游走節點的深度游走與廣度游走進行控制,其控制值分別表示為q和p,t與x間的最短距離表示為dtx。

把知識圖譜抽取到的序列與現有的用戶序列進行結合,得到項目的嵌入向量。知識圖譜序列針對項目序列易忽略項目內容信息等問題,可以進行彌補與整合。首先對知識圖譜進行抽取序列,得到序列集合,表示為Ik={H1,H2,…,Hn},現有的用戶交互序列集合表示為I={S1,S2,…,Sn},隨機游走序列表示為Hi={x1,x2,…,xn}。其獲取最大化目標函數定義為

(9)

式中,K是序列Si和Hi的長度,xi表示序列中的項目。

在上述分析基礎上可知,在歷史交互序列和知識圖譜中獲取捕捉項目的相似性,同時形成項目空間,獲取對應的嵌入式交互序列

Qu={v1,v2,…,vT}

(10)

其中,vj表示項目xj的d維潛在向量。

在得到項目嵌入后,利用兩個相互獨立的循環神經網絡學習用戶偏好,確保推薦目標用戶能夠在下次訪問中大概率的訪問項目。其中用戶的決策過程主要受到以下兩方面因素的影響,分別為:

1)短期偏好

主要是指用戶在短期內的動態,同時最近的波動針對短期特征反應具有十分重要的作用。

2)長期偏好

主要是指長期偏好行為學習中描述用戶穩定的歷史偏好。

將長期偏好和短期偏好神經網絡對應的層次進行連接,形成下一個項目。同時,結合項目嵌入,完成網絡用戶長短期偏好推薦[12]。

4 實驗與結果

為驗證基于知識圖譜的網絡用戶長短期偏好推薦算法的可行性與有效性,需對基于知識圖譜的網絡用戶長短期偏好推薦算法進行測試與分析。本次實驗的硬件環境為window10系統,Intel core i7CPU 16G內存,軟件環境為Python3.6。本次實驗采用所提的基于知識圖譜的網絡用戶長短期偏好推薦算法(算法1)、文獻[4]提出的基于聚類和用戶偏好的協同過濾推薦算法(算法2)、文獻[5]提出的基于概念鄰域的Top-N推薦算法(算法3)進行測試,將推薦結果的均方根誤差、平均絕對誤差和召回率作為測試指標進行相關測試,具體測試結果如下。

1)不同算法的均方根誤差指標對比

利用圖2對比3種算法的均方根誤差。

圖2 均方根誤差

分析圖2可知,所提算法的均方根誤差低于算法2與算法3,證明所提算法的推薦準確率更高,由于所提算法在對網絡用戶進行推薦時,首先通過知識圖譜對潛在的語義信息進行輔助與補充,可深層次對用戶及項目的相關信息進行挖掘,增加數據信息的稠密度,并且提高了推薦算法的準確性。

2)不同算法的平均絕對誤差指標對比

利用圖3對比3種算法的平均絕對誤差。

圖3 平均絕對誤差

由圖3可知,算法2與算法3的平均絕對誤差均高于所提算法,證明所提算法的推薦準確性更高,因為所提算法在對網絡用戶進行推薦時,首先通過知識圖譜對潛在的語義信息進行提供相關的信息鏈接,并根據不同語義間的相互關系進行發散挖掘,有效地避免了推薦結果的單一性或重復性,從而提高了推薦算法的準確性。

3)不同算法的召回率指標對比

利用圖4對比3種算法的召回率。

圖4 召回率

根據圖4所得實驗數據可知,所提算法的召回率高于算法2與算法3,證明所提算法的推薦準確性更高,因為所提算法在對網絡用戶進行推薦時,首先通過知識圖譜對網絡用戶的歷史行為進行分析,根據分析結果實現推薦,知識圖譜可將兩者進行連接,對相關推薦結果進行解釋,給出相應依據,進而提高用戶對推薦結果的認可與接受程度,增強了推薦算法的準確性。

5 結束語

本文針對目前推薦算法推薦結果不理想、不準確、不能夠得到網絡用戶的接收與認可,對此問題提出了基于知識圖譜的網絡用戶長短期偏好推薦算法,建立知識圖譜,對網絡用戶信息的潛在語義進行輔助與補充及深層次的信息挖掘,并對網絡用戶信息的潛在語義進行連接,對網絡用戶的歷史行為以及推薦結果作出解釋,提供相關依據,結合項目嵌入與網絡用戶長短期學習來完成推薦。并設計了多項對比實驗,實驗結果表明,該算法有效地解決了當前算法中存在的問題,提高用戶對推薦結果的認可與接受程度,并提高了推薦準確度。

猜你喜歡
語義用戶模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
語言與語義
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
認知范疇模糊與語義模糊
主站蜘蛛池模板: 欧美一区二区啪啪| 免费在线播放毛片| 亚洲第七页| 经典三级久久| 国产欧美日韩va另类在线播放 | 欧美日韩中文字幕在线| 久久精品亚洲专区| 色综合网址| 亚洲黄网视频| 成人免费黄色小视频| 国产欧美视频在线| 亚洲av无码久久无遮挡| 丝袜无码一区二区三区| 国产亚洲欧美在线专区| 亚洲天堂高清| 亚洲成A人V欧美综合| 国产电话自拍伊人| 成人一区在线| 又爽又黄又无遮挡网站| 色婷婷色丁香| 亚洲大尺度在线| 欧美一级在线播放| 一本大道视频精品人妻 | 在线免费观看AV| 日韩经典精品无码一区二区| 欧美一道本| 亚洲无限乱码| 自拍亚洲欧美精品| 9966国产精品视频| 曰AV在线无码| 欧美有码在线观看| 久久精品国产精品一区二区| 国产日韩欧美在线播放| 91久久性奴调教国产免费| 成人免费网站久久久| 在线播放真实国产乱子伦| 日韩黄色精品| 日韩麻豆小视频| 久久精品国产国语对白| 狠狠五月天中文字幕| 四虎国产精品永久一区| 亚洲欧美日韩中文字幕在线| 人妻夜夜爽天天爽| 拍国产真实乱人偷精品| 视频一本大道香蕉久在线播放| 第一区免费在线观看| 99久久精品国产综合婷婷| 99九九成人免费视频精品| 美女无遮挡拍拍拍免费视频| 美女一级毛片无遮挡内谢| 国产中文在线亚洲精品官网| 五月激情婷婷综合| 日韩福利在线视频| 国产人成乱码视频免费观看| 亚洲开心婷婷中文字幕| 国产精品黄色片| 欧美在线视频a| 毛片在线播放网址| 中文国产成人精品久久一| 91青青草视频| 欧美一级在线播放| 国产美女主播一级成人毛片| 久久中文无码精品| 伊人大杳蕉中文无码| 一区二区三区成人| 免费亚洲成人| JIZZ亚洲国产| 欧美日韩va| 精品久久综合1区2区3区激情| 亚洲欧洲天堂色AV| 日日拍夜夜操| 99精品视频在线观看免费播放| 婷婷色狠狠干| 丁香六月激情婷婷| 超薄丝袜足j国产在线视频| 亚洲水蜜桃久久综合网站| 激情成人综合网| 曰AV在线无码| 三级欧美在线| 国产精品污视频| 欧美高清视频一区二区三区| 中文成人无码国产亚洲|