圖神經(jīng)網(wǎng)絡(luò)在冷啟動推薦中的實現(xiàn)

2022-10-01 02:41:30朱風(fēng)蘭李大舟周河曉陳思思

計算機工程與設(shè)計 2022年9期

高巍，朱風(fēng)蘭，李大舟，周河曉，陳思思

(沈陽化工大學(xué) 計算機科學(xué)與技術(shù)學(xué)院，遼寧沈陽 110142)

0 引言

在互聯(lián)網(wǎng)快速發(fā)展的時代，推薦系統(tǒng)的出現(xiàn)刺激了互聯(lián)網(wǎng)經(jīng)濟的爆炸增長。由于數(shù)據(jù)的高度稀疏性，推薦系統(tǒng)中存在用戶冷啟動和項目冷啟動兩個嚴重問題。用戶冷啟動主要解決了如何為新用戶提供個性化推薦的問題。當新用戶進入平臺時，該平臺沒有行為數(shù)據(jù)，因此無法基于其歷史行為進行預(yù)測，而導(dǎo)致不能提出個性化推薦。項目冷啟動無法向有興趣的用戶推薦新啟動的項目。解決用戶冷啟動和項目冷啟動問題成為了當前研究領(lǐng)域的熱點。相關(guān)研究可以提高企業(yè)的收益率、平臺的留存率和用戶的使用舒適度。實現(xiàn)冷啟動推薦對企業(yè)、用戶和平臺的發(fā)展具有重要意義。

1 相關(guān)工作

推薦系統(tǒng)面臨著稀疏性和冷啟動[1,2]問題。解決該問題的傳統(tǒng)方法是對矩陣分解[3,4]的目標函數(shù)進行正則化，但并沒有為電商提供良好的推薦結(jié)果。此外，在解決具有多模態(tài)、大規(guī)模、數(shù)據(jù)稀疏等復(fù)雜特征的冷啟動問題工作中，利用輔助信息能夠比矩陣分解帶來更好的效果，例如上下文信息[5]、用戶和項目的關(guān)系[6,7]。推薦系統(tǒng)中的用戶信息和項目信息在本質(zhì)上具有圖結(jié)構(gòu)。可以構(gòu)建同構(gòu)圖和異構(gòu)圖的圖神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu)[8]便開始被應(yīng)用于推薦系統(tǒng)。

YING等[9]提出一種采用局部卷積的可伸縮的圖卷積算法，即PinSage算法，該算法解決了模型訓(xùn)練時間復(fù)雜度大的問題。ZHANG等[10]提出了一種層疊和重構(gòu)的圖卷積網(wǎng)絡(luò)，即STAR-GCN結(jié)構(gòu)，該結(jié)構(gòu)提高了推薦的效果。LEE等[11]提出了一種基于優(yōu)化的元學(xué)習(xí)MeLU算法，解決了圖卷積神經(jīng)網(wǎng)絡(luò)難以設(shè)置較深的層數(shù)學(xué)習(xí)節(jié)點表征形式的問題。LU等[12]提出了一種采用元學(xué)習(xí)支持集的MetaHIN算法，解決了元學(xué)習(xí)者在任務(wù)特定參數(shù)之前適應(yīng)全局參數(shù)的問題。吳等[13]提出了一種基于用戶與項目節(jié)點間關(guān)系的圖神經(jīng)網(wǎng)絡(luò)算法，提高了冷啟動推薦的效果。

2 基于圖神經(jīng)網(wǎng)絡(luò)的冷啟動推薦模型(IGNN)

在用戶冷啟動和項目冷啟動推薦系統(tǒng)中，難點在于缺少用戶和項目的偏好信息即歷史交互。對于此難點，可以使用用戶或項目的特征來表示屬性信息，但仍存在兩個問題。一是如何將屬性表示轉(zhuǎn)換為偏好表示，二是如何有效聚合鄰域中節(jié)點的不同模態(tài)屬性。由于推薦系統(tǒng)的大部分數(shù)據(jù)本質(zhì)上有圖結(jié)構(gòu)，并且圖神經(jīng)網(wǎng)絡(luò)技術(shù)在捕獲節(jié)點間的連接和圖數(shù)據(jù)的表示學(xué)習(xí)方面有強大的功能。此外，圖神經(jīng)網(wǎng)絡(luò)可以構(gòu)建同構(gòu)屬性圖，解決稀疏度高的問題。因此，本文提出了一種同構(gòu)屬性特點的圖神經(jīng)網(wǎng)絡(luò)的冷啟動推薦模型，即信息圖神經(jīng)網(wǎng)絡(luò)(infographic neural network，IGNN)。IGNN模型結(jié)構(gòu)如圖1所示。

圖1 本文提出的IGNN模型結(jié)構(gòu)

IGNN模型由4部分組成：輸入層、屬性交互層、門控注意力層和預(yù)測層。輸入層對原始數(shù)據(jù)進行獨熱編碼，構(gòu)造用戶間信息圖和項目間信息圖，兩圖均為同構(gòu)屬性圖，解決了屬性信息的表示問題；屬性交互層對圖中的節(jié)點進行高階交互，并使用改進的圖變分自編碼器重構(gòu)偏好嵌入，解決了如何將屬性表示轉(zhuǎn)換為偏好表示和偏好缺失問題；門控注意力層使用門控注意力聚合器，解決了聚合鄰域中節(jié)點不同模態(tài)的多屬性問題；預(yù)測層拼接用戶和項目的聚合表示并利用多層感知機(multilayer perceptron，MLP)解決過擬合、梯度彌散等問題，得到最終的評分分數(shù)。

2.1 輸入層

輸入層由圖1中用戶間信息圖和項目間信息圖兩個部分構(gòu)成。圖1中用戶間信息圖，圓圈表示用戶，連接線表示用戶與用戶之間的關(guān)系；項目間信息圖，圓圈表示項目，連接線表示項目與項目之間的關(guān)系。以用戶間信息圖為例，信息圖包含著屬性信息和結(jié)構(gòu)信息兩種信息，兩者分別描述了信息圖中節(jié)點的固有性質(zhì)和節(jié)點之間的關(guān)聯(lián)性質(zhì)，這兩者對信息圖中節(jié)點和全圖的刻畫起著關(guān)鍵作用。項目間信息圖結(jié)構(gòu)特點、內(nèi)容與用戶信息圖相似。輸入層的輸入為原始數(shù)據(jù)，輸出為用戶間信息圖和項目間信息圖。

(1)輸入層中對每個用戶和項目的屬性信息進行獨熱編碼，并且不考慮之間的交互關(guān)系，將多個屬性的獨熱編碼簡單的連接為一個長向量，以構(gòu)成原始數(shù)據(jù)的每個用戶和每個項目的一組信息關(guān)聯(lián)。以用戶u為例，其原始數(shù)據(jù)分別為性別：男、年齡段：16歲～25歲、用戶等級：4、注冊時間：2016年，即共有4個屬性。用戶屬性信息獨熱編碼中具有特征的位置標記為1，沒有的標記為0，而用戶屬性信息多熱編碼則是獨熱編碼的簡單連接，圖2是用戶u的屬性信息編碼示例。項目屬性信息獨熱編碼和多熱編碼的原理與用戶編碼方法相似。

圖2 用戶u信息編碼

(2)對于用戶，若兩個用戶有相似的屬性信息，例性別、年齡等；對于項目，若兩個項目有相似的屬性信息，例品牌、型號等，則定義用戶與用戶之間、項目與項目之間有較高的屬性相似度。對于用戶，若兩個用戶有相似的行為記錄列表,則定義用戶與用戶之間有較高的偏好相似度；對于項目，若兩個項目有相似的記錄列表，則定義項目與項目之間有較高的偏好相似度。屬性相似度和偏好相似度都可以使用修正的余弦距離來測量。修正的余弦相似度在余弦相似度的基礎(chǔ)上，進一步把所有評分都減去該評分所對應(yīng)的用戶的評分均值，結(jié)果越大，相似度越高。計算方法如式(1)所示

(1)

(2)

式中：att為屬性相似度，pre為偏好相似度。

(3)輸入層將與目標節(jié)點具有top p%的總體相似度sim的所有節(jié)點都添加到候選池。在接下來的每輪訓(xùn)練中，根據(jù)相似度對節(jié)點的鄰居從候選池采樣，為保證鄰域多樣性使用年齡作為決定鄰居的主要因素，若沒有年齡，則選擇用戶等級作為主要因素進行動態(tài)圖構(gòu)建策略，一旦圖被構(gòu)造，將保持固定數(shù)量的鄰居。得到圖1中輸入層的用戶間信息圖和項目間信息圖。

2.2 屬性交互層

屬性交互層由圖1的屬性交互和重構(gòu)偏好嵌入兩部分構(gòu)成。由于在構(gòu)造的用戶間信息圖和項目間信息圖中，每個節(jié)點都包含多熱屬性編碼和表示身份唯一的獨熱編碼，并且推薦系統(tǒng)中的用戶和項目數(shù)量眾多，導(dǎo)致節(jié)點的獨熱編碼表示維數(shù)較高，因此屬性交互層目標是減少獨熱編碼的維數(shù)，并學(xué)習(xí)多熱信息編碼表示的高階信息交互。以用戶u和項目i為例，定義用戶屬性為xu、用戶偏好為mu、項目屬性為yi和項目特征為ni。對于冷啟動節(jié)點來說，由于新用戶和新項目沒有交互信息，因此用戶偏好和項目屬性不存在，所以需要對圖1中屬性交互層節(jié)點進行重構(gòu)偏好嵌入。

(1)屬性交互

圖1中的屬性交互層首先將節(jié)點的獨熱編碼轉(zhuǎn)換為低維的密集向量并構(gòu)建查找表。查找表對應(yīng)于用戶的參數(shù)矩陣M和項目的參數(shù)矩陣N兩個參數(shù)矩陣。屬性交互層然后使用雙向交互池操作捕獲高階屬性間的交互，最后增加了線性組合操作。屬性交互層采用的雙向交互和線性組合操作定義如式(3)所示

(3)

式中：ai和aj是屬性編碼，vi和vj是屬性編碼中的第i類屬性和第j類屬性的嵌入向量，⊙表示按元素乘積。

在二階交互和線性組合之后分別使用一個全連接層，實現(xiàn)了對高階特征交互的學(xué)習(xí)，fFC函數(shù)計算方法如式(4)所示

(4)

式中：Wfc，bfc和LeakyReLU分別是權(quán)重矩陣、偏置向量和激活函數(shù)。用戶u的屬性編碼au和項目i的屬性編碼ai分別被饋入fFC函數(shù)，產(chǎn)生了用戶的屬性嵌入xu和項目的屬性嵌入yi，如式(5)所示

xu=fFC(au),yi=fFC(ai)

(5)

(2)重構(gòu)偏好嵌入

重構(gòu)偏好嵌入是圖1中的屬性交互層的第二部分。對于用戶冷啟動和項目冷啟動問題，則是由于新用戶和新項目缺少歷史交互引起的，即缺少偏好。針對上述問題，本文提出改進的變分圖自編碼器(improved variational graph autoencoder，IVGAE)從用戶和項目的信息分布中重構(gòu)偏好，其結(jié)構(gòu)包含3個部分：①推斷模型；②生成模型；③近似模型。以用戶u為例，如圖3所示。

圖3 改進的變分圖自編碼器(IVGAE)結(jié)構(gòu)

推斷模型又稱為編碼器，由圖卷積神經(jīng)網(wǎng)絡(luò)(graph convolutional network，GCN)[14]組成，由圖3的推斷模型部分看出，對于用戶u，它以用戶屬性xu和參數(shù)矩陣M作為輸入，輸出embedding空間的變量Z。ReLU函數(shù)用于推斷模型，可以克服梯度消失并且加快訓(xùn)練速度，第一個隱藏層生成一個低維特征矩陣。GCN的計算方法如式(6)所示

(6)

第二個隱藏層生成μ和logσ2，如式(7)所示

(7)

聯(lián)立第一個隱藏層和第二個隱藏層，可以得到編碼器的計算，如式(8)所示

(8)

下采樣以μ,logσ2的分布作為輸入，輸出embedding空間變量Z，如式(9)所示

Z=μ+σ×ε,ε～N(0,1)

(9)

生成模型又稱為解碼器，生成模型由embedding變量Z之間的內(nèi)積定義；由圖3的生成模型部分看出，解碼器的輸出是一個重構(gòu)的用戶屬性x′u，計算過程如式(10)所示。引入生成模型的所有參數(shù)，參數(shù)化為多層感知機。同理，項目i重構(gòu)的項目特征為y′i

x′u=sigmoid(ZZT)

(10)

從圖3的近似模型部分看出，屬性交互層將用戶重構(gòu)嵌入x′u約束為用戶偏好嵌入mu，項目重構(gòu)嵌入y′i約束為項目特征嵌入ni。綜上，可以得到mu～x′u和ni～y′i。

最后，本文將偏好嵌入和屬性嵌入融合到節(jié)點嵌入中，使每個節(jié)點既包含歷史偏好又包含其自身的信息，計算過程如式(11)所示。其中 [;] 表示向量級聯(lián)運算，Wu和Wi分別為用戶u和項目i的權(quán)重矩陣，bu和bi分別為用戶u和項目i的偏置向量，mu是用戶u的偏好，ni是項目i的特征。項目在屬性交互層的操作過程和用戶相似。屬性交互層的輸出為用戶節(jié)點嵌入Pu和項目節(jié)點嵌入qi

Pu=Wu[mu;xu]+bu,qi=Wi[ni;yi]+bi

(11)

2.3 門控注意力層

門控注意力層的目的是有效的聚集鄰域中不同模態(tài)的各種屬性，包括多頭注意力和學(xué)習(xí)門兩部分。

針對鄰域聚集問題，門控注意力層采用了鍵值注意力機制和點積注意力，計算一個附加軟門在0(低重要性)和1(高重要性)之間，賦予每個磁頭不同的重要性，結(jié)合多頭注意力聚合器，得到了本文設(shè)計的門控注意力網(wǎng)絡(luò)結(jié)構(gòu)[15]。門控注意力網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示，以兩個用戶的中心節(jié)點的三頭門控注意力聚合器為例，不同的顏色代表不同的注意頭，在學(xué)習(xí)門中，深色的門代表較大的值。

圖4 門控注意力網(wǎng)絡(luò)結(jié)構(gòu)

本文給定一個用戶節(jié)點u，其節(jié)點嵌入為Pu，Nu為節(jié)點u的相鄰節(jié)點，ZNu={Zv|v∈Nu} 是相鄰節(jié)點中參考矢量的集合。用戶節(jié)點的鄰居聚合和節(jié)點更新過程包含以下3個步驟：

(12)

(13)

步驟2 圖4中的學(xué)習(xí)門以鄰居嵌入ZNu和步驟1得到的注意力權(quán)重作為輸入，進行細粒度聚合操作。為了確保增加門不會引入太多的附加參數(shù)，門控注意力層使用卷積網(wǎng)絡(luò)ψg，該卷積網(wǎng)絡(luò)采用中心節(jié)點和相鄰節(jié)點的特征生成門值。計算過程如式(14)所示

(14)

本文結(jié)合了平均池和最大池來構(gòu)建卷積網(wǎng)絡(luò)，如式(15)所示

(15)

式中：θm將相鄰特征映射到dm維向量，然后取元素方向的最大值，θg將連接的特征映射到最終的K門。

通過設(shè)置一個小的dm，用于計算門的子網(wǎng)的計算開銷可以忽略不計。

綜合3個步驟可以得到門控注意力聚合器的公式，如式(16)所示

(16)

2.4 預(yù)測層

圖5 MLP的模型

本文將用戶u對項目i的預(yù)測評分計算如式(17)所示

(17)

3 實驗設(shè)計

3.1 實驗環(huán)境

本實驗在Ubuntu18.02系統(tǒng)下進行，使用Intel@i5-7200U作為計算單元，內(nèi)存為8 GB。模型使用Pytorch框架進行搭建，版本為1.8.1?；赑ytorch框架進行用戶和項目評分預(yù)測模型的搭建和訓(xùn)練，使用DGL庫來進行圖神經(jīng)網(wǎng)絡(luò)的構(gòu)建。本文的實驗環(huán)境配置見表1。

表1 實驗環(huán)境配置

3.2 實驗數(shù)據(jù)集

本文使用京東2016年2月至4月的高潛用戶購買意向預(yù)測數(shù)據(jù)集來評估提出模型。京東數(shù)據(jù)集由103 525個用戶、17 181個商品、2 861 262條評分信息組成。數(shù)據(jù)集由5個文件組成，各個文件信息見表2。本文對數(shù)據(jù)進行清洗，將用戶行為數(shù)據(jù)文件合并為一個文件JData_Action。

表2 數(shù)據(jù)集基本信息

3.3 評價指標

本文采用了廣泛用于評分預(yù)測任務(wù)的3個評價指標：均方誤差(mean square error，MSE)、均方根誤差(root mean square error，RMSE)和平均絕對誤差(mean absolute error，MAE)。

(1)均方誤差(MSE)

均方誤差是線性回歸中最常用的損失函數(shù)。MSE可以評價數(shù)據(jù)的變化程度，MSE的值越小，說明預(yù)測模型描述實驗數(shù)據(jù)具有更好的精確度。MSE的定義如式(18)所示

(18)

(2)均方根誤差(RMSE)

均方根誤差衡量的是預(yù)測值與真實值之間的偏差，并且對數(shù)據(jù)中的異常值較為敏感。RMSE的定義如式(19)所示

(19)

(3)平均絕對誤差(MAE)

平均絕對誤差是絕對誤差的平均值，它其實是更一般形式的誤差平均值。因為如果誤差是[-1,0,1]，平均值就是0，但這并不意味之系統(tǒng)不存在誤差，只是正負相互抵消了，因此要加上絕對值。MAE的定義如式(20)所示

(20)

3.4 參數(shù)設(shè)置

本文提出的IGNN模型，按照經(jīng)驗設(shè)置批次大小為128、LeakyReLU的斜率為0.01和初始學(xué)習(xí)率為0.0005。本文討論了模型計算結(jié)果中隱藏向量維數(shù)D和候選集閾值p在構(gòu)造用戶間信息圖和項目間信息圖過程中的最優(yōu)參數(shù)的設(shè)定問題。實驗初始設(shè)置方式如下：隱藏向量維數(shù)D=40，候選集閾值p=5。

在優(yōu)化隱藏向量維數(shù)D的過程中，實驗通過更改不同維度的集合 {10,20,30,40,50} 來進行討論。實驗首先將候選集閾值p設(shè)置為5，然后改變隱藏向量維數(shù)D。隱藏向量維數(shù)D的參數(shù)優(yōu)化調(diào)整結(jié)果如圖6所示。

圖6 隱藏向量維數(shù)D的參數(shù)優(yōu)化調(diào)整結(jié)果

從圖6可以看出，隨著隱藏向量維數(shù)的增加，性能呈總體上升趨勢。圖6(a)中用戶冷啟動的MSE值隨隱藏向量維數(shù)的增加數(shù)值平穩(wěn)降低，性能呈上升趨勢；項目冷啟動的MSE值隨隱藏向量維數(shù)的增加先降低，在40維后降低，40維后又上升。圖6(b)中用戶冷啟動的RMSE值隨隱藏向量維數(shù)的增加數(shù)值大幅度降低，在40維后數(shù)值迅速增加；項目冷啟動的RMSE值隨隱藏向量維數(shù)的增加數(shù)值大幅度降低，在40維后數(shù)值緩慢增加。圖6(c)中用戶冷啟動的MAE值隨隱藏向量維數(shù)的增加數(shù)值大幅度降低，在40維后數(shù)值緩慢增加；項目冷啟動的MAE值隨隱藏向量維數(shù)的增加數(shù)值大幅度降低，在40維后數(shù)值緩慢增加。綜合兩個冷啟動的比較，隱藏向量維數(shù)為40時，IGNN模型的性能最好。這表明較大的維度可以捕獲用戶、項目及其各自信息的更多隱藏因素，從而產(chǎn)生了節(jié)點更好的表示能力。

在優(yōu)化候選集閾值p的過程中，實驗從候選集的閾值 {1,5,10,15,20} 中進行挑選。實驗首先將隱藏向量維數(shù)D設(shè)置為40，然后改變候選集的閾值p。候選集閾值p在構(gòu)造用戶間信息圖和項目間信息圖過程中的參數(shù)優(yōu)化調(diào)整結(jié)果如圖7所示。

圖7 候選集閾值p的參數(shù)優(yōu)化調(diào)整結(jié)果

從圖7中可以看出，在大多數(shù)情況下，p取值為5時，在候選范圍內(nèi)取得最優(yōu)結(jié)果。圖7(a)中用戶冷啟動的MSE值隨候選集閾值的增加數(shù)值先增加再下降，以此規(guī)律反復(fù)；項目冷啟動的MSE值隨候選集閾值的增加先降低后持續(xù)增加。圖7(b)中用戶冷啟動的RMSE值隨候選集閾值的增加數(shù)值先增加，在第15個后開始下降；項目冷啟動的RMSE值隨候選集閾值的增加先下降后持續(xù)增加。圖7(c)中用戶冷啟動的MAE值隨候選集閾值的增加數(shù)值先降低，在第5個后開始增加；項目冷啟動的MAE值隨候選集閾值的增加持續(xù)增加。當從候選集采樣時，被選擇概率與候選集大小無關(guān)，因此排名靠前的樣本始終具有較高的被選擇概率。因此，p=5時被選為最優(yōu)設(shè)定。

3.5 實驗結(jié)果與分析

在用戶冷啟動過程中，訓(xùn)練集來自于JData_user文件中80%的用戶以及JData_Action文件中80%的行為數(shù)據(jù)，測試集來自于JData_user文件剩余20%的用戶。在項目冷啟動過程中，訓(xùn)練集來自于JData_Product文件中80%的項目以及JData_Action文件中80%的行為數(shù)據(jù)，測試集來自于JData_Product文件剩余20%的項目。評價指標采用均方誤差(MSE)、均方根誤差(RMSE)和平均絕對誤差(MAE)，實驗結(jié)果如圖8所示。從圖8中可以看出，隨著迭代次數(shù)的增加，IGNN模型的MSE值、RMSE值和MAE值總體趨于降低的趨勢；在迭代40輪前，IGNN模型的3個評價指標數(shù)值變化明顯，從40輪后，評價指標趨于平緩和穩(wěn)定。

圖8 評價指標MSE、RMSE和MAE隨訓(xùn)練次數(shù)的變化

從圖8(a)中可以看出，用戶冷啟動在前40輪迭代MSE值呈明顯下降趨勢，從40輪迭代后逐漸趨于穩(wěn)定，最優(yōu)MSE值為0.9612，橫軸為訓(xùn)練次數(shù)，范圍為[0,60]，縱軸為MSE值，范圍為[0.900 754,1.250 817]，可以看出MSE值下降了27.9%；項目冷啟動在前40輪迭代MSE值呈下降趨勢，從40輪迭代后有較小幅度波動，最優(yōu)MSE值為0.9067，橫軸為訓(xùn)練次數(shù)，范圍為[0,60]，縱軸為MSE值，范圍為[0.956 769,1.082 582]，可以看出MSE值下降了11.6%。用戶冷啟動和項目冷啟動在第24輪迭代時兩個MAE值相等，在這之后，用戶冷啟動處于下降狀態(tài)，項目冷啟動則開始處于波動狀態(tài)。

從圖8(b)中可以看出，用戶冷啟動一直趨于降低趨勢，最優(yōu)RMSE值為1.0472，橫軸為訓(xùn)練次數(shù)，范圍為[0,60]，縱軸為RMSE值，范圍為[1.034 216,1.279 592]，可以看出RMSE值下降了19.2%；項目冷啟動在前40輪迭代RMSE值呈下降趨勢，從40輪迭代后有較小幅度波動，最優(yōu)RMSE值為1.0294，橫軸為訓(xùn)練次數(shù)，范圍為[0,60]，縱軸為RMSE值，范圍為[1.017 509,1.081 228]，可以看出RMSE值下降了5.9%。

從圖8(c)中可以看出，用戶冷啟動在前40輪迭代MAE值呈明顯下降趨勢，從40輪迭代后有較小幅度波動，最優(yōu)MAE值為0.8636，橫軸為訓(xùn)練次數(shù)，范圍為[0,60]，縱軸為MAE值，范圍為[0.840 633,1.044 911]，可以看出MAE值下降了19.5%；項目冷啟動在前20輪迭代MAE值呈下降趨勢，從20輪迭代后有較小幅度波動，最優(yōu)MAE值為0.8201，橫軸為訓(xùn)練次數(shù)，范圍為[0,60]，縱軸為MAE值，范圍為[0.803 610,0.868 817]，可以看出MAE值下降了7.5%。

本文實驗選擇6種常用于解決冷啟動的方法，分別為STAR-GCN、MetaHIN、DropoutNet、LLAE、HERS和MetaEmb，與本文提出的模型IGNN作比較。圖9和圖10分別表現(xiàn)了用戶冷啟動模型、項目冷啟動模型的實驗結(jié)果對比。

圖9 用戶冷啟動模型實驗結(jié)果對比

圖10 項目冷啟動模型實驗結(jié)果對比

從圖9中可以看出，在7個用戶冷啟動基線中，本文提出的IGNN模型性能最佳。IGNN的MSE值、RMSE值和MAE值對比于其它6個基線的最優(yōu)值分別降低了4.05%、2.02%和2.47%。STAR-GCN在用戶和項目的二部圖上使用了圖卷積網(wǎng)絡(luò)，可以將信息聚合到節(jié)點嵌入中，MSE值和RMSE值表現(xiàn)性能次佳。在MAE值指標下，MetaEmb性能相對STAR-GCN較好，因為其通過元學(xué)習(xí)嵌入生成器，可以適應(yīng)冷啟動場景。LLAE的表現(xiàn)非常差，因為其目標是使用戶的整個評分適合所有項目，并且有根據(jù)用戶屬性重構(gòu)的向量，而評分預(yù)測是優(yōu)化每個用戶和項目對的評分。

從圖10中可以看出，在7個項目冷啟動基線中，本文提出的IGNN模型性能最佳。IGNN的MSE值、RMSE值和MAE值對比于其它6個基線的最優(yōu)值分別降低了0.47%、1.80%和2.46%。MetaEmb通過基于梯度的元學(xué)習(xí)方法訓(xùn)練嵌入生成器，模型性能次佳。MetaHIN性能一般，因為它需要一套支持集以適應(yīng)先驗知識。DropoutNet效果并不好，因為DropoutNet需要內(nèi)容信息來近似矩陣分解的結(jié)果，并且其性能取決于預(yù)訓(xùn)練的偏好嵌入。HERS性能表現(xiàn)和DropoutNet相似。LLAE的表現(xiàn)最差，因為其目標是使用戶的整個評分適合所有項目，并且有根據(jù)項目屬性重構(gòu)的向量，而評分預(yù)測是優(yōu)化每個用戶和項目對的評分。

綜上所述，在最優(yōu)基準改進1%具有統(tǒng)計學(xué)意義，用戶冷啟動模型提升效果較為明顯，項目冷啟動提升效果一般，但優(yōu)于目前基線方法。通過將屬性圖應(yīng)用于用戶冷啟動和項目冷啟動推薦場景，結(jié)果驗證了本文提出的IGNN體系結(jié)構(gòu)的性能優(yōu)越性。

4 結(jié)束語

互聯(lián)網(wǎng)金融產(chǎn)業(yè)對國民經(jīng)濟產(chǎn)生巨大影響，產(chǎn)生巨大經(jīng)濟效益并有巨大社會影響?；ヂ?lián)網(wǎng)金融在快速發(fā)展過程中，強烈依賴于推薦系統(tǒng)。推薦系統(tǒng)為互聯(lián)網(wǎng)金融注入了強有力的新鮮血液和留存了用戶使用率。在推薦系統(tǒng)的實現(xiàn)中，解決冷啟動問題對提升企業(yè)的經(jīng)濟效益，保留平臺的用戶留存率有著直接的影響效果。本文嘗試將深度學(xué)習(xí)技術(shù)應(yīng)用于京東電商平臺商品推薦的研究中，提出了基于圖神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的信息圖神經(jīng)網(wǎng)絡(luò)。該模型利用改進的變分圖自編碼器重構(gòu)偏好嵌入解決了偏好缺失問題，而且通過門控注意力結(jié)構(gòu)提高模型容量，解決細粒度鄰居聚合的問題。在MSE、RMSE和MAE評價指標下，與多種冷啟動模型相比較，本文提出的IGNN模型在用戶冷啟動至少改進了2%左右，在項目冷啟動至少改進了1%左右，有著更好的性能表現(xiàn)。