李曉峰 王妍瑋 王建華
1(黑龍江外國語學院信息工程系 黑龍江 哈爾濱 150025)2(普渡大學機械工程系 印第安納 西拉法葉 IN47906)3(哈爾濱師范大學計算機科學與信息工程學院 黑龍江 哈爾濱 150025)
隨著社區網絡的發展,需要對社區網絡中的多維信任數據進行合理化的推薦設計。對多維信任數據的協同推薦是建立在對多維信任數據的特征提取和屬性挖掘技術基礎上[1-2],對多維信任數據的項性屬性進行挖掘和分布式組網設計,結合社區發現算法,實現對多維信任數據的協同推薦,提高對社區網絡用戶特征的發現和識別能力,因此研究多維信任數據的協同推薦方法,在網絡信任模型的構建和用戶偏好特征挖掘中具有很好的應用價值[3-4]。
目前,相關研究人員已經提出一些多維信任數據的推薦方法。文獻[5]提出一種基于圖和改進K近鄰模型的高效協同過濾推薦算法,構建基于圖的數據評分模型,運用該模型對用戶進行相似度計算,根據計算結果結合圖的最短路徑算法對等待評分的內容進行準確定位,以此來實現數據推薦。實驗結果表明,該算法能夠獲得較高的用戶信任度,但是數據推薦均衡性較差。文獻[6]提出一種基于位置社交網絡的上下文感知的興趣點推薦算法,建立潛在狄利克雷分配模型,運用該模型對與用戶興趣點相關的文本信息進行提取,采用自適應帶寬核評估方法對提取到的信息進行分類,最后運用概率矩陣分解模型將用戶的興趣和分類信息進行融合,分析融合結果實現對用戶的感興趣點的推薦。實驗結果表明,該算法具有較好的推薦效果,但是存在用戶信任度不高的問題。文獻[7]提出一種結合用戶興趣度聚類的協同過濾推薦算法,采集用戶對關鍵詞的評分頻率,根據采集結果分析用戶對關鍵詞的偏好程度,構建用戶偏好矩陣。通過偏好矩陣結合Logistic函數計算用戶對各項目的興趣度,最終根據興趣度對數據進行有針對性的推薦。實驗結果表明,該算法具有較高的推薦效率,但是數據推薦的置信度不高。
針對傳統方法存在的數據推薦均衡性較差、用戶信任度不高以及推薦結果置信度不高的問題,本文提出一種改進的基于全卷積神經網絡的多維信任數據協同推薦算法。構建多維信任數據的存儲和服務結構模型,采用協同濾波方法訓練隱含層和輸出層的連接權值,此步驟需要保留重要隱含層中用戶的關鍵信息,以此來保障用戶信息安全,提高用戶信任度。最后進行卷積神經網絡協同濾波和分類識別,進行分類識別有利于提高數據推薦的均衡性。
在社區網絡中,為了實現對多維信任數據協同推薦,需要構建多維信任數據的服務結構模型。結合拓撲結構設計進行多維信任數據協同推薦和模糊挖掘,根據多維信任數據中社區的分布式屬性特征進行關聯規則分布設計。以網絡社區高維數據作為先驗知識,結合先驗特征分布式挖掘方法進行社區屬性特征推薦。假設多維信任數據的社區屬性混合推薦拓撲圖的邊是有向的,結合云存儲服務模塊進行主程序調度,在移動客戶端進行數據輸出的特征分析和大數據融合聚類處理,建立多維信任數據的數據傳輸和協同過濾模型。得到多維信任數據的存儲和服務結構模型如圖1所示。

圖1 多維信任數據的存儲和服務結構模型
根據圖1可知,因為拓撲圖的邊具有有向性特征,所以數據在存儲過程中會經過不同的路徑,因此存在(a)和(b)兩種數據流傳輸模式。結合圖1所示的模型,建立小樣本多元類別數據模型,構建一個元回歸分析模型表達社區網絡多維信任數據的信息流,表示為:
x(u)=x(ut0+nΔt)=h[u·z(t0+nΔt)]+ωn
(1)
式中:x(u)表示多維信任數據信息流,u表示多維信任數據,t0表示初始時刻,Δt表示時間間隔,n為時間間隔數量,x(·)表示多維信任數據信息流在不同時刻的傳輸函數,h(·)為多維信任數據分布式的時間序列,z(·)表示一個具有線性高斯隱變量的函數,ωn為多維信任數據的觀測或測量誤差。接下來需要對多維信任數據的分布式存儲結構進行重組,社區網絡多維信任數據的分布結構模型描述式為:
(2)
式中:Xp(u)表示社區網絡多維信任數據的分布結構模型,j表示數據分布參量,p為分布式多維信任數據存儲結構的階數,α為數據集中包含的觀察數據窗口寬度。
構建多維信任數據分布的組合核函數模型,將推薦的多維信任數據按照深度核函數進行關聯結構重組,構建社區網絡的關聯規則知識庫[8],給出社區網絡多維信任數據結構的特征標識函數bn,采用描述性的信息組合分布式重構方法進行社區網絡多維信任數據的認知模型構建,得到一個線性組合模型為:
(3)
式中:an表示多維信任數據所有類別變量的線性規劃特征分布,N為數據變量總量,K為數據變量數量的取值。采用深度高斯過程分析方法進行社區網絡多維信任數據的模糊聚類處理,根據模糊聚類結果分析數據的存儲結構模型,實現社區網絡多維信任數據的分布估計和協同濾波[9]。
根據第1節中構建的多維信任數據的存儲和服務結構模型,提取多維信任數據的關聯規則特征量。設有m個多維信任數據的分布節點A1,A2,…,Am,觀察數據中的第d個類別輸出表示為a1,a2,…,an,利用變分自編碼的方法對隱層多維信任數據進行全局尋優[10],在核函數噪聲參數的影響下,得到多維信任數據特征分類加權系數為:
(4)
式中:J表示核函數,η表示噪聲參數。
采用概率圖模型學習算法[11],得到多維信任數據關聯規則挖掘的自適應學習系數為:
(5)
式中:α1、α2表示不同數量觀察數據窗口寬度,Densityi表示數據關聯規則挖掘中的頻繁項集,APi和APint表示不同的社區網絡多維信任數據屬性集,滿足如下條件:
(6)
通過自由變分的參數擬合方法,得到多維信任數據的系統推薦量化集為(m,n)∈E,采用模糊卷積神經網絡簡化層級內的相關性[12],構造多維信任數據協同推薦的關聯規則挖掘問題,用下式進行表達:
(7)
(8)
式中:i和j表示根據單層高斯過程得到當前多維信任數據分布節點數,最大數量為n,min(f)表示最小化關聯函數,s(i,j)表示關聯規則節點挖掘值。在單層稀疏高斯過程回歸模型中,輸出負載為L1,L2,…,Ln,多維信任數據協同推薦的類間擾動估計值為V,在線性規劃模型中對多維信任數據進行模型核函數特征分解,求得模型核函數的近似熵特征量[13],結合匹配相關檢測方法進行多維信任數據的負載均衡調度,實現關聯規則特征提取結果,表示為:
(9)
式中:NI、NR和NS分別表示多維信任數據的頻繁項分布集、狀態分布集和時間分布集。根據上述分析,提取多維信任數據的關聯規則特征量,將提取的特征數據輸入到卷積神經網絡中進行自適應學習,進行協同推薦算法設計。
在上述構建多維信任數據的存儲和服務結構模型以及提取多維信任數據的關聯規則特征量的基礎上,提出基于全卷積神經網絡的多維信任數據協同推薦算法。全卷積神經網絡由多個神經元節點組成,其組成結構具有線性特征,即神經層之間屬于層與層相連的關系,并且每一個神經層都能與相鄰的神經元節點之間進行連接。其具有參數規模較低的特點,依據卷積神經網絡的特點,對多維信任數據進行協同推薦處理,能夠得到更加準確的結果,并且處理結果更具有多元化的特征。具體協同推薦過程如下:
通過構建卷積神經網絡來進行多維信任數據特征量的分類識別[14],卷積神經網絡模型如圖2所示。

圖2 全卷積神經網絡結構模型
圖2中,net表示網絡輸入層,ui表示不同的卷積層,xi表示不同池化層,ωi表示全連接層。假設輸入層有2n個隱藏節點,對于n組社區網絡多維信任數據的關聯規則特征量(ki1,ki2,…,ki,m-1),i=1,2,…,n,采用全卷積神經網絡分類進行社區網絡多維信任數據關聯特征值的自適應訓練,訓練式為:
(10)
式中:nets1(k)數據關聯特征值自適應訓練函數,rs(k)表示數據關聯特征函數。
對隱含層到輸出層連接權值進行參數學習,根據數值屬性得到比例神經元的加權邊為:
usi(k)=netsi(k)
(11)
引入Lasso稀疏學習方法,得到全卷積神經網絡隱含層到輸出層連接權值為:
(12)
對隱含層節點進行自適應篩選和修正,得到全卷積神經網絡更新規則為:
e(k)=xsi(k)|φa-φad|
(13)
式中:e(k)表示更新規則函數;φa表示隱含層原始節點;φad表示自適應篩選和修正后的隱含層節點。
對輸入神經元連接第j個隱藏層節點的學習稀疏度,采用偏差方差折中方法和隱含層節點抽取機制進行全卷積神經網絡的自適應加權學習[15],保留重要的隱含層中的關鍵信息,得到協同推薦模型表示為:
(14)

(15)
以高斯函數作為徑向基函數,采用隱含層節點抽取機制進行全卷積神經網絡的自適應加權學習,保留重要的隱含層中的關鍵信息,提高數據推薦的效率。
采用全卷積神經網絡學習方法進行多維信任數據的特征分類和協同推薦時保留了重要隱含層中的關鍵信息,為求解隱含層到輸出層連接權值X(x1,x2,…,xn),對隱含層節點進行自適應搜索,在全卷積神經網絡的信任模型中,得到全卷積神經網絡協同推薦的更新規則為:
(16)

綜上分析,采用協同濾波方法訓練隱含層和輸出層的連接權值,實現卷積神經網絡協同濾波和分類識別,得到協同推薦算法描述為:

輸出:多維信任數據協同推薦的結果α。
初始化多維信任數據協同推薦參數[17],從t=1開始進行多維信任數據協同推薦的全卷積神經網絡的自適應尋優:
(1) 對輸出層連接權值進行稀疏表示,得到特征點e(t)=y-Dα(t)。
(2) 構建全卷積神經網絡分類器,得到徑向基函數的加權值:
(17)
式中:ωθ表示全卷積神經網絡分類器,μ表示加權系數,δ表示網絡節點分布誤差系數。


(6) 如果不滿足收斂條件,令t=t+1。轉步驟(1),直到滿足全局收斂。
(7) 結束。
綜上分析,實現對社區網絡中多維信任數據的協同推薦。
為了驗證本文算法在實現多維信任數據協同推薦中的應用性能,進行仿真實驗,實驗采用MATLAB平臺進行算法的開發設計,采用網絡爬蟲抓取方法進行社區網絡中多維信任數據的原始數據采樣,隱含層到輸出層的連接權值設定為0.23,神經網絡的輸入層節點數為12,隱含層節點數為5,輸出層為3,卷積神經網絡的迭代次數為300,相關參數設定為ρ1=ρ2=0.41,δ=0.8,Q=40,c1=120,c2=350,cr=26,μ1=μ2=0.131。實驗數據來自開源的美國Minnesot大學GroupLens項目組提供的Movielens數據集(https://grouplens.org/datasets/movielens/),該數據集為公開的標準數據集,非常適用于數據推薦測試。在進行實驗之前,對數據集進行等分,分成4個相等的部分,每部分600個用戶,包含600個任務數據,總計2 400個數據,然后從中隨機選2份作為測試數據集,剩余的2份作為訓練數據集,對全卷積神經網絡模型進行訓練,產生數據推薦。
由第2節可知,傳統算法缺少數據特征分析環節,而本文算法在構建多維信任數據的存儲和服務結構模型的基礎上,對多維信任數據的關聯規則特征量進行了提取,得出了多維信任數據的頻繁項NI、NR和NS,從而增強了數據推薦的自適應性。為驗證本文算法的有效性,選取以下實驗指標進行分析:均衡性,置信度,用戶信任度。
以均衡性為實驗指標,并以上述數據集為測試對象,針對每次客戶端的數據推薦請求任務進行關聯規則挖掘和全卷積神經網絡學習,多維信任數據協同推薦中,使用特征量化因子表示特征分布情況,特征量化因子輸出數值越均勻、越接近,說明算法的均衡性越好,將本文算法與文獻[5]、文獻[6]算法進行對比,結果如圖3所示。

圖3 不同算法均衡性對比
分析圖3可知,采用文獻[5]和文獻[6]算法對多維信任數據進行協同推薦時,在不同時間下關聯規則特征分布結果不均,文獻[5]算法的特征量化因子變化范圍最大,為0.05~0.47,文獻[6]算法的變化范圍為0.12~0.41,說明對比算法的均衡性較差;而采用本文算法進行多維信任數據協同推薦時,關聯規則特征分布結果雖然存在差異性,但是整體上來講,較為均衡,本文算法的關聯規則特征分布結果優于文獻[5-6]算法,說明本文算法的輸出均衡性較好,降低推薦網絡模型的復雜性,能夠實現多維信任數據的協同推薦。
為了進一步驗證所提基于全卷積神經網絡的多維信任數據協同推薦算法的應用性能,對不同算法的數據推薦置信度進行測試,此處置信度是指特定數據對特定推薦結果真實性相信的程度,置信度用數值表示,數值越低,表示置信度越高,反之,置信度越低。置信度的計算公式如下:
(18)
式中:M表示置信區間總量,M′表示含真實推薦數據的置信區間數量。不同算法的具體對比結果如圖4所示。

圖4 不同算法的置信度對比
分析圖4可知,從整體上來看,不論是傳統算法還是本文算法的置信度受任務數的影響較小,并沒有隨任務數的增加而產生較大的波動。說明幾種算法的置信度都具有穩定性。但是從置信度數值上來看,文獻[5]算法、文獻[6]算法以及文獻[7]算法的數值較高,說明在進行多維信任數據協同推薦時,以上算法的置信度較低,而本文算法的置信度保持在0.3左右,是幾種算法中最低的,置信度較高,用戶的信任度就高,說明本文算法具有實際應用性。
對多維信任數據進行協同推薦的最終目的是解決用戶問題、滿足用戶需求,因此以用戶信任度為實驗指標對傳統算法與本文算法進行對比分析,用戶信任度反映的是網絡用戶對協同推薦結果的一種信任程度,計算公式如下:
(19)
式中:R1和R2分別表示網絡用戶和推薦結果的興趣區域數量,R12表示兩者共同的興趣區域數量。
用戶信任度用信任值進行表示,信任值越高,用戶信任度越高。將本文算法與文獻[6]和文獻[7]算法進行對比,分析結果如圖5所示。

圖5 不同算法的用戶信任度對比結果
分析圖5可知,本文算法的用戶信任值始終保持在7.5以上,相比較而言,文獻[6]算法和文獻[7]算法的用戶信任值低于本文算法,在4.5以下,并且數值不穩定,說明本文算法能夠滿足用戶對數據推薦的需求,用戶的信任度較高。
綜上所述,采用本文算法進行多維信任數據協同推薦時,均衡性較好,說明采用該算法進行多維信任數據協同推薦的稀疏學習性能較好,同時,該算法的置信度較高,能夠獲得用戶的信任度,從而實現對多維信任數據的有效推薦。
為提高對社區網絡的用戶特征的發現和識別能力,本文提出一種改進的基于全卷積神經網絡的多維信任數據協同推薦算法。為提高用戶的信任度,采用協同濾波方法訓練隱含層和輸出層的連接權值,并保留重要隱含層中用戶的關鍵信息。為提高數據推薦的均衡性,采用卷積神經網絡協同濾波進行數據分類識別。分析實驗結果可知,與傳統算法相比,本文算法進行數據協同推薦的均衡度更好,提高推薦準確性和信任度水平,解決傳統算法存在的數據推薦均衡性較差、用戶信任度較低的問題。由于社區網絡在不斷發展,因此未來將繼續對該算法進行改進,進一步提高多維信任數據協同推薦的均衡性,以此來更好地適應社區網絡應用的需要。