999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種結合矩陣分解和深度學習技術的POI推薦模型

2020-06-29 12:50:04
計算機測量與控制 2020年6期
關鍵詞:特征用戶模型

(西安建筑科技大學 信息與控制工程學院,西安 710055)

0 引言

近年來, LBSN平臺吸引了無數用戶并產生了大量簽到數據。通過對簽到數據建模并結合傳統推薦技術來實現用戶POI的推薦,可以從推薦結果中得出用戶的日常喜好和行為模式;幫助商家發現潛在客戶、調整經營策略,具有極大的經濟和社會效益[1]。

目前,基于LBSN的用戶POI推薦研究,無論是基于傳統協同過濾、矩陣分解方法還是基于影響因素或文本信息考慮的POI推薦模型均存在以下的問題:

大部分POI推薦研究采用傳統協同過濾算法[2-4],對用戶和簽到的POI進行建模,給出最后推薦。但這種基于LBSN的用戶簽到信息很容易遭遇數據稀疏問題。又有研究者提出基于矩陣分解的協同過濾算法[5-6]。分別用一個隱式向量代表用戶和POI,隱式向量間的內積表示用戶和POI之間的線性交互。這些算法有效緩解了數據稀疏問題且對用戶和個性化POI特征提取做出改進。但由于隱式向量內積操作只是簡單向量間的線性乘法,不足以提取用戶和POI之間高階歷史交互特征(非線性特征),尤其是無法捕捉用戶簽到的序列特征。

為了解決序列建模的問題,有研究者[7]利用矩陣分解和馬爾科夫模型建模用戶的序列行為,但馬氏模型只考慮用戶訪問的最近一個POI點信息,所包含信息量太少,不能很好表示用戶行為特點。深度神經網絡能夠有效學習和提取多個特征的高階非線性關系,特別是循環神經網絡(RNN)能夠很好地對序列進行建模。Q.Liu等人[8]提出ST-RNN模型,Zhao等人[9]改進提出ST-LSTM模型。這類模型雖然能有效建模用戶簽到的序列行為,但從用戶細粒度興趣來看:單一的RNN無法同時學習用戶長期和短期的興趣特征,從模型整體來看:忽略了多影響因素之間的聯合作用。

綜合以上問題,文章的具體研究內容如下:1)針對簽到數據的稀疏問題,提出一種基于分解矩陣的協同過濾方法。計算得到POI的特征向量;2)針對用戶細粒度興趣(即長期興趣和短期興趣)序列建模問題,提出一個基于注意力機制(Attention)的深度神經網絡模型。可分別提取用戶長、短期興趣特征[10-11];3)針對多影響因素之間的聯合作用問題,將矩陣分解提取的POI特征向量以及計算得到的用戶特征向量按照用戶簽到序列輸入帶有注意力機制的深度學習網絡進行模型訓練。設計得到多特征高階非線性交互的POI推薦模型(MF-ADNN)。該模型可對LBSN中的地理、時間、社交和序列影響進行綜合考慮,分別對用戶簽到數據集的4階段(早、午、晚、夜)進行訓練,做出不同時間段的POI推薦。

1 問題定義和用戶細粒度興趣分析

POI推薦模型旨在為用戶推薦其感興趣的POI點。表1是本文用到的基本數學符號及含義。

表1 基本數學符號及含義

1.1 問題定義

U={u1,u2,...,un}表示用戶集合,P={p1,p2,...,pm}表示興趣點,給定用戶u的歷史簽到記錄Du,當前的時間t,文章所提出的POI推薦模型最終的操作是:從POI集合P中返回N個興趣點序列{pre1,pre2,...,preN}。序列集pre,即未來某階段內用戶u最有可能訪問的興趣點集。

1.2 細粒度興趣

用戶興趣隨著時間的推移可能會發生變化,即用戶簽到行為可分為長期興趣和短期興趣兩種,本文稱之為用戶的細粒度興趣。

1.2.1 用戶長期興趣

用戶的長期興趣一般指用戶周期性訪問的POI。RNN結構具有記憶功能,能夠很好地為用戶的簽到序列行為特征進行建模,對于捕獲用戶的長期興趣是一個好的選擇。但一般的RNN存在梯度消失的問題,故采用LSTM來捕獲用戶的長期興趣。具體模型情況參見第3.3節CF-ADNN模型的LM模塊。

1.2.2 用戶短期興趣

用戶的短期興趣最有可能影響后續的興趣點訪問,一般主要指與上一個訪問的興趣點距離和類別相近的POI。故采用帶有Attention機制的seq2seq架構。將用戶歷史興趣點編碼成一個向量,利用Attention機制關注最相近的幾個興趣點進行解碼,最終得到用戶的短期興趣。具體模型情況參見3.3節CF-ADNN模型的SM模塊。

2 結合矩陣分解和深度學習技術的POI推薦模型

本節介紹結合矩陣分解和深度學習的個性化POI推薦模型CF-ADNN的構建及訓練過程。將矩陣分解提取的POI特征向量以及計算得到的用戶特征向量作為以上兩個模塊的輸入,構建POI推薦模型CF-ADNN,并對該模型進行訓練。

2.1 基于矩陣分解的興趣點特征表示

為了解決簽到數據的稀疏問題,利用簽到數據集中興趣點的ID,地理坐標和所屬類別這三個維度信息,建立POI同現矩陣、位置近似矩陣以及類別同屬矩陣。再基于一種矩陣分解方法得到POI在同現、位置和類別特征中的隱向量,將上述三種隱向量拼接成一個整體的POI特征向量表示[12]。

2.1.1 構造特征矩陣

1)POI同現矩陣:初始化一個POI同現矩陣O∈Nn×n,表示POI在用戶訪問模式上的關聯關系,n等于POI數。具體來說,Opp′表示同時訪問過p和p′興趣點的用戶個數,對角線元素Opp表示訪問p的用戶個數。一般的,Opp′值越高,表明p和p′頻繁地被先后訪問,則證明關聯性越強。

2)位置近似矩陣:與POI同現矩陣類似,初始化一個位置近似矩陣G∈Nn×n,表示用戶的簽到行為和POI的地理位置高度關聯。引入距離閾值m=10 km,根據簽到點的經緯度坐標計算p(lon,lat)和p′(lon′,lat′)之間的距離D,若小于m,則Gpp′=1;否則Gpp′=0。特別的,Gpp=1。D的計算公式:

C=sin(lat)*sin(lat′ )*cos(lon-lon′)+cos(lat)*cos(lat′)

D=R*Arccos(C)*PI/180

(1)

其中:R為地球平均半徑6 371.004 km。

3)類別同屬矩陣:類別同屬矩陣R∈Nn×n,表示POI在類別信息上的關聯,利用了POI的內容信息。若p和p′屬于同一個類別,Rpp′=1;否則Rpp′=0。特別的,Rpp=1。

構建特征矩陣過程示例如圖1所示。

圖1 構建特征矩陣示意圖

2.1.2 對稱矩陣分解

將上述3個對稱矩陣進行矩陣分解:

1)POI同現矩陣分解:對于POI同現矩陣O∈Nn×n,把這個矩陣分解成兩個矩陣的點乘,如公式(2)所示:

O(n,n)=Eo*ETo

(2)

使兩個同階的矩陣相似程度最小,得到最接近原始矩陣,如公式(3):

(3)

為了進一步說明對稱矩陣分解的優點,給出兩個POI隱向量的相似度近似計算公式(4)~(5):

(4)

(5)

通過觀察近似公式可知,隱向量的相似性與用戶臨近POI訪問率有關,說明上述分解方法能夠很好地學習、表示興趣點在該特征空間的相互關聯;同時抑制了熱門POI對最終推薦結果的影響,有利于POI推薦結果的多樣化。

2)位置近似矩陣分解:與POI同現矩陣分解方法相同,具體的分解形式如式(6)所示:

(6)

3)類別同屬矩陣分解:與上述矩陣分解方法相同,具體的分解如公式(7)所示:

(7)

2.1.3 計算特征向量

拼接上述3個矩陣分解所得的隱向量,得到一個整體的POI特征向量表示。具體如公式(8):

(8)

2.2 用戶特征向量計算

計算用戶特征向量時,可結合考慮用戶的社交影響因素,即共同計算用戶與用戶好友特征向量。文章將用戶特征向量表示成該用戶與該用戶的好友訪問過的所有POI的特征向量的期望,從而得到用戶特征向量。用戶特征向量eu計算公式(9)如下:

(9)

Pu和Pu′分別表示用戶u和他的好友u′訪問過的POI集合,|Pu|表示用戶u訪問過的POI數量。

2.3 POI推薦模型CF-ADNN

CF-ADNN模型旨在構建不同的神經網絡模型分別學習用戶長期和短期興趣特征。將前兩節基于矩陣分解提取的POI特征向量,以及計算得到的用戶特征向量按用戶簽到序列輸入模型,訓練模型的高階交互特征,預測未來最有可能訪問的興趣點集。

2.3.1 CF-ADNN模型結構

圖2展示了CF-ADNN模型的整體架構。該模型主要分為兩個主要模塊:LM模塊獲取的是用戶的長期興趣的隱含向量;SM模塊獲取的是短期的隱含向量。

圖2 CF-ADNN模型整體架構圖

1)LM模塊:

用戶的長期興趣主要考慮的是用戶周期性訪問的模式。為了捕獲長期興趣,采用LSTM來捕獲用戶的長期興趣。具體的公式如下:

(10)

(11)

(12)

2)SM模塊:

用戶的短期興趣主要指與上一個訪問的興趣點相近的(距離和類別)的興趣點。選擇相同類別且兩個連續簽到點距離小于10 km的興趣點作為用戶的短期興趣。SM模塊采用帶有Attention+seq2seq架構,seq2seq架構主要分為Encoder和Decoder。用戶的短期興趣表示方法:通過Encoder把用戶訪問的興趣點編碼成一個向量,編碼方式選擇LSTM網絡。編碼過程公式如下:

(13)

(14)

具體公式如下:

Ct=∑sαtshs

(15)

(16)

score(hn,hs)=vTtanh(ω1hn+ω2hs)

(17)

其中:vT、ω1和ω2是模型需要學習得到的參數。這里Ct最為重要,表示通過Attention計算得到的上下文向量。進一步計算得到引入注意力的隱藏狀態向量:

Sn=f(Ct,hn)=tanh(Wc[Ct+hn])

(18)

以及解碼器生產的目標興趣點序列:

S[yt|{y1,y2…yt-1},Ct]=softmax(WcSn)

(19)

長期興趣Lt+1以及短期興趣序列St+1結合起來,得到最終的推薦結果Ot+1:

Ot+1=Lt+1∪St+1

(20)

2.3.2 推薦模型訓練

從時間維度分析,為了訓練一個模型來適應不同時間段的用戶簽到,這里將簽到數據分為4個時間段:夜(0∶01-6∶00)、早(6∶01-12∶00)、午(12∶01-18∶00)、晚(18∶01-24∶00)分別進行訓練,得到適應不同時間段的POI推薦模型。

CF-ADNN推薦模型學習算法

輸入:eu、ep、t、T

輸出:Ot+1(最終的推薦結果)L(最小損失值)

1.Repeat

2.Foreachu∈UDo

3.輸入eu和ep,SM訓練用戶短期興趣S

4.Fort

5.輸入eu和ep,LM訓練用戶長期興趣L

7. End for

9.梯度下降法最小化損失lu

10. ift>Torlu足夠小

11.End for

12.Returnlu、Ot+1

13.End procedure

3 實驗與分析

3.1 實驗數據集

本文采用Foursquare簽到網站的開源數據集作為實驗數據,驗證模型的有效性。選取美國舊金山市(SFO)的用戶簽到信息,統計結果如表2所示。

表2 用戶簽到信息統計表

訓練時,將用戶前80%的簽到數據集作為訓練集,最近的20%作為測試集。

3.2 評價指標

性能評價指標選用準確率、召回率,分別用PRE@N,REC@N表示。對于一個用戶u,模型的推薦結果是:

(21)

用戶真實的訪問序列是:

(22)

其中:N為模型預測返回的POI個數。

則準確率和召回率的公式如下:

(23)

(24)

3.3 實驗結果及分析

3.3.1 參數影響

訓練模型時選取的參數會對推薦結果造成影響。本文主要討論影響模型最重要的兩個參數:

1)特征向量維度d:eu和ep作為模型的輸入可以看出,特征向量維度d是影響整個模型的重要因素。d越大模型需要的計算量越大。

圖3 特征向量維度d對模型影響

固定矩陣分解中的正則項參數λo=λg=λr=0.000 01,設置維度d為100、150、200、250、300。實驗結果如圖3所示,當維度超過200后模型的性能開始降低,故本實驗將d設置成200。

2)關注長度δ:用戶短期興趣建模主要用到基于Attention機制的序列模型,Attention關注長度δ對模型十分重要。δ過長,模型會變得復雜;δ過短,可能會使得數據不足。

圖4 關注長度δ對模型影響

分別設置關注長度δ為 5,10,20,40 進行試驗,實驗結果如圖4所示,當δ為10模型效果最好。

3.3.2 不同推薦模型對比結果

為了驗證CF-ADNN模型的性能,文章選擇3個在矩陣分解和深度學習POI推薦算法領域,具有代表性的模型進行試驗對比。GeoMF[5]:基于矩陣分解的地理位置信息POI推薦;ST-RNN[8]:基于時空上下文RNN模型的POI推薦;ST-LSTM[9]:基于時空上下文LSTM模型的POI推薦。

CF-ADNN模型與以上3種算法的性能對比結果如圖5所示。

圖5 算法性能對比結果圖

從圖5的對比結果可知,GeoMF模型的指標率最低。這說明基于矩陣分解方法的POI推薦模型雖然有效緩解了數據稀疏性,但由于隱式向量內積操作只是簡單向量間的線性乘法,不足以提取用戶和POI之間高階歷史交互特征尤其無法捕捉用戶簽到的序列特征。而ST-RNN和ST-LSTM模型將用戶的歷史簽到記錄用序列方式傳入RNN來學習用戶及POI的向量表達,可有效建模用戶簽到的序列行為,故推薦性能指標明顯高于GeoMF模型。同時,ST-LSTM模型對ST-RNN進行改進,避免了梯度消失,故ST-LSTM模型推薦性能優于ST-RNN。而MF-ADNN結合矩陣分解技術和帶有注意力機制的用戶簽到序列建模技術,可以降低簽到數據的稀疏性;細粒度建模用戶興趣;更好學習聯合影響因素的高階非線性交互特征。因此與其它3個模型相比,MF-ADNN在準確率和召回率上均有更優的表現。

5 結束語

文章提出一個結合矩陣分解和帶有注意力機制深度學習技術的POI推薦模型。該模型融合了時間影響、地理影響、社交影響以及序列影響4個因素實現用戶POI推薦。主要任務包括:通過構建特征矩陣緩解簽到數據稀疏問題,矩陣分解得到隱藏因子,計算POI的特征向量;構建一種帶注意力機制的用戶細粒度興趣的序列建模方式,有效學習用戶長期和短期的興趣特征,提高POI推薦精確度;結合上述兩種方法,最終得到可以融合多種影響因素的POI推薦模型。試驗結果表明,該POI推薦模型具有較好性能。文章未考慮的影響因素還有很多,如評論信息、文本信息等,未來的工作將考慮在模型中融入這些特征,進一步提升推薦算法的性能。

猜你喜歡
特征用戶模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
主站蜘蛛池模板: 午夜啪啪福利| 免费看黄片一区二区三区| 国产69精品久久久久孕妇大杂乱 | 国产精品爆乳99久久| 国产jizzjizz视频| 福利片91| 97影院午夜在线观看视频| 99re精彩视频| 99偷拍视频精品一区二区| 97se亚洲| 色精品视频| 国产亚洲一区二区三区在线| 精品一区二区三区四区五区| 黄色网址免费在线| 国产中文一区a级毛片视频| 国产欧美日韩资源在线观看| 日本人又色又爽的视频| 试看120秒男女啪啪免费| 精品亚洲国产成人AV| 午夜无码一区二区三区| 国产熟女一级毛片| 天天干天天色综合网| 999国产精品永久免费视频精品久久| 十八禁美女裸体网站| 女人18毛片一级毛片在线 | 国产极品美女在线观看| 亚洲国产午夜精华无码福利| 亚洲国产精品一区二区第一页免| 中国一级特黄视频| 欧美激情视频二区| 国产精品19p| 国产女主播一区| 精品国产黑色丝袜高跟鞋| 亚洲天堂网视频| 美臀人妻中出中文字幕在线| 亚洲无线国产观看| 精品无码人妻一区二区| 全部免费特黄特色大片视频| 亚洲a免费| 亚洲一区国色天香| 国产极品美女在线播放| 免费又黄又爽又猛大片午夜| 久精品色妇丰满人妻| 精品无码一区二区三区在线视频| 国产福利不卡视频| 毛片三级在线观看| 999精品在线视频| 伊人久综合| 国产精品页| 亚洲中文在线看视频一区| 国产成人综合亚洲欧洲色就色| 亚洲精品无码不卡在线播放| 久久精品只有这里有| 最新亚洲人成无码网站欣赏网| 久草国产在线观看| 专干老肥熟女视频网站| 香蕉国产精品视频| 人妻无码一区二区视频| 不卡视频国产| 五月天丁香婷婷综合久久| 91免费国产在线观看尤物| 国产精品欧美在线观看| 国产人免费人成免费视频| 国产门事件在线| 好吊日免费视频| 久久精品女人天堂aaa| 亚洲无码久久久久| 国产性生交xxxxx免费| 欧美日韩动态图| 91啦中文字幕| 国产精品19p| 午夜一级做a爰片久久毛片| 国产尤物视频网址导航| 免费观看成人久久网免费观看| 国产在线精品网址你懂的| 国产特级毛片aaaaaa| 91精品专区国产盗摄| 精品国产网| 免费无码网站| 91福利免费| 亚洲第一视频网| 丰满人妻中出白浆|