

摘要:跨系統協同過濾推薦算法與信息管理系統間存在緊密的關系。為了應對不良商家利用托攻擊帶來的挑戰,并提高推薦的準確性,本文設計了一種跨系統協同過濾推薦算法,其結合安全多方計算理論與隨機擾亂技術,可有效保證用戶隱私不泄露給協同系統,并在此基礎上,可以精確地計算用戶間的相似度,降低預測誤差。通過試驗驗證,該算法能夠有效防止不良商家的托攻擊行為,并顯著提高推薦系統的準確性。
關鍵詞:協同過濾算法;安全計算模型;隱私保護
中圖分類號:TP309""""""""" 文獻標志碼:A
隨著信息技術的發展和普及,信息管理系統在各個領域中得到廣泛應用,信息管理系統中的隱私保護與信息安全成為了亟待解決的重要問題。跨系統協同過濾推薦算法是一種用于推薦系統的算法,通過整合多個獨立的推薦系統,共同提供個性化的推薦結果。傳統的協同過濾算法主要利用單一系統內的用戶-項目評分矩陣來進行推薦操作,跨系統協同過濾推薦算法則擴展了這個概念,將多個系統中的用戶和項目數據進行聯合分析和推薦。信息管理系統提供數據源和數據共享機制,為跨系統協同過濾推薦算法提供支持和基礎。
1傳統的協同過濾算法的問題
傳統的協同過濾算法在實際應用中存在以下問題。1)數據稀疏性:協同過濾算法利用用戶-項目評分矩陣來進行推薦,但是大部分用戶只對少數項目進行評分,這導致算法難以準確地預測用戶對未評分項目的興趣。2)冷啟動問題:當新用戶加入系統或推出新項目時,因為缺乏足夠的評分數據進行準確推薦,所以協同過濾算法無法準確預測他們的興趣。3)算法偏好:傳統的協同過濾算法主要基于用戶間的相似度或項目間的相似度來進行推薦。這種方法容易使推薦結果出現算法偏好,即推薦給用戶的項目往往與他們喜歡的項目相似,缺乏多樣性。4)靈活性差:傳統的協同過濾算法通常只考慮用戶-項目間的關系,忽略了其他因素的影響,例如時間、地點、社交關系等。這限制了算法在個性化推薦方面的靈活性和準確性。5)數據隱私問題:協同過濾算法需要收集和分析用戶的個人數據,涉及用戶隱私。如果不妥善保護,就可能引發數據泄露和濫用的風險。
2跨系統的隱私保持協同過濾算法
2.1提出問題
跨系統協同過濾是指在不同系統間共享個性化推薦服務,對系統間進行協作。在這種情況下,不同系統可以通過共享用戶評分和模型來提高推薦的準確性和個性化程度。假設存在n個系統:S1,S2,…,Sn,則系統i的用戶評分矩陣如公式(1)所示。
(1)
式中:(Ri)n,n為系統i中的用戶對第n個項目的評分。
鎖定了目標用戶后,利用協同過濾推薦技術,使不同系統間能夠攜手合作。通過各個系統間的協作,結合各個系統中所有用戶的評分數據,預測用戶對某個特定項目的評分。
隨機擾亂技術是一種保護用戶隱私的方法,它通過對原始數據進行隨機化噪聲處理,來保護用戶評分信息。在協同過濾推薦系統中,當需要計算用戶相似度時,可以使用隨機擾亂技術來保證評分信息不會泄露給其他協作系統。利用隨機擾亂技術,當跨系統推薦時,協同過濾推薦系統能夠保障用戶隱私的安全。同時,這種方法也可以降低數據共享帶來的用戶隱私泄露風險,提高用戶對推薦系統的信任度。
設想有兩個均值均為0的向量,分別標記為A=(a1,a2,…,an)和B=(b1,b2,…,bn)。通過對向量A和B應用向量∈=(∈1,∈2,…,∈n)和向量δ=(δ1,δ2,…,δn)的隨機擾動,可以得到新的向量A'=A+∈,B'=B+δ。在這個過程中,向量∈和δ的隨機化數據是遵循高斯分布或均勻分布的,其數值為[-m,m]。根據這種形式,基于A'·B'可以有效地估算所需A·B的數值。如公式(2)所示。
(2)
因為向量A和δ均值均為0并且相互獨立,因此能夠得
出ai≈0。同理,能夠得出bi≈0以及由
此可以得出公式(3)。
在隨機擾亂處理前,標準化處理是一項重要的步驟,它有助于縮小推薦算法的誤差。通過運用z-score標準化方法,可基于算術均值和標準差消除不同特征間量綱差異,完成原始數據轉化,從而提高算法的穩定性和準確性。其計算過程如公式(4)所示。
(4)
式中:Rui為用戶u對項目i的原始評分;Ru、σu、Iu分別為用戶u的評分均值、標準差以及項目集合。標準差的計算過程如公式(5)所示。
2/Iu(5)
當采用隨機擾亂技術時,需要注意的是擾亂過度可能會影響推薦算法的精確度。可以通過改進相似度度量標準來提高推薦的準確性。保護用戶隱私的同時,也能提高推薦系統的準確性和用戶滿意度。
2.2安全計算模型
本文提出了一種基于安全多方計算的理論模型,這為跨系統的協同過濾提供了安全保障。在該模型中,用多個公共的第三方來保障原始數據的安全傳遞,從而避免了數據泄露給中間節點的風險。通過使用輕量
級分組密碼系統LBlock和RSA加密算法,本文的安全計算模型能夠有效地保護數據的機密性和完整性。LBlock有高效的數據加密和解密功能,用RSA保護密鑰的安全性。這樣即使在跨系統協同過濾過程中有潛在的安全風險和攻擊威脅,也能夠保障數據的安全傳輸。同時,引入混淆傳輸的概念,防止第三方惡意串通。通過混淆傳輸,使第三方無法獲知真實的數據內容,提高數據的安全性和隱私保護。安全計算模型如圖1所示。
該安全計算模型使用RSA密碼系統生成公鑰和私鑰,利用LBlock密碼系統生成密鑰,并通過加密和解密操作安全傳輸數據。同時,使用茫然傳輸協議保護數據免受第三方的惡意串通。具體步驟如下[1]。所有系統都會創建一對RSA公鑰PK和私鑰SK。將公鑰分享給其他系統,而將私鑰則安全地傳遞給n個第三方機構。2)所有系統使用LBlock密碼系統生成n個獨立的密鑰Ki。3)各系統會使用之前分享的RSA公鑰對每個密鑰進行加密,生成對應的密文K'i。將這些密文傳送到LBlock密鑰庫中。4)第三方機構i從密鑰庫中檢索到對應的密文K'i后,利用先前接收的RSA私鑰進行解密操作,進而還原原始的密鑰Ki。5)當需要發送數據時,所有系統會使用與其對應的密鑰Ki,通過LBlock算法對數據進行加密,生成加密后的密文ci。6)基于茫然傳輸協議可將完成加密的密文ci安全無誤地輸送至中間節點。7)中間節點將在n個第三方機構所提供的密文組中挑選一組數據ci,且以安全的方式將其轉交給目標系統。8)目標系統會使用與密文ci對應的密鑰Ki,通過LBlock解密算法還原原始的數據mi。
通過這樣的流程,可以保障數據的傳輸和存儲過程都是安全的,同時保護了用戶的隱私,并提高了系統的整體安全性。
2.3模型優化
2.4隱私保護推薦算法
可以將基于安全計算模型和隨機擾動的跨系統協同過濾推薦算法描述為一種隱私保護的推薦算法。它通過安全計算模型和隨機擾動技術,保證用戶的個人信息在推薦過程中不會泄露。這種算法允許不同系統間進行協同過濾推薦,無須共享用戶的真實數據。同時,通過引入隨機擾動,推薦結果會有一定程度的變化,使攻擊者無法準確了解用戶的真實偏好。保護用戶隱私的同時,提供個性化且準確的推薦結果。
以系統Alice和Bob為例,評分數據會對其進行z-score標準化處理,并得到數據rui。同時引入隨機噪聲進行擾動。這樣即使在協同過濾推薦系統中,存在潛在的安全風險和攻擊威脅,也能夠保護用戶的隱私和數據的安全性。同時,由于評分數據通常較小,因此加性加入噪聲的方法能夠有效地增強數據的隱私保護效果。為增強隱私保護效果,對處理后的數據rui添加隨機擾動。具體做法:將rui加上一個隨機數γui,得到擾動后的數據r'ui=rui+γui。這里的γui可以是服從高斯分布或均勻分布在一定范圍內的隨機數。
通過這樣的處理,評分數據標準化,在每個系統中添加隨機擾動,以保護用戶的隱私協同過濾推薦計算中,使用處理后的評分數據r'ui來進行相似度計算、預測等操作,從而生成最終的推薦結果。
根據輸入的描述,基于RSA密碼系統和LBlock密碼系統的跨系統協同過濾推薦算法的過程如下。1)Alice和Bob共同生成一對密鑰,包括公鑰PK和私鑰SK,將公鑰PK安全地發送給第三方。2)利用LBlock密碼系統,Alice和Bob分別創建了n個密鑰,KAi和KBi,并在LBlock密鑰庫中存放這些密鑰加密后的密文。3)第三方機構提取密鑰庫中完成加密的密鑰密文,通過私鑰SK對其逐一進行解密操作,從而獲取KAi、KBi。第三方使用KAi對數據RA、rA進行加密,生成R'A、r'A;同樣,使用KBi對數據RB、rB進行加密,生成R'B、r'B。4)第三方將加密后的數據密文組(c1、c2、...、cn)傳輸至中間節點。中間節點在密文組中挑選對應數據ci,同時向Alice、Bob分別傳輸R'A和r'A、R'B和r'B。5)Alice與Bob接收到密文后各自運用相應密鑰KAi、KBi進行解密,從而分別獲取其原始數據RA、rA和RB、rB。6)Alice與Bob分別將其組合后的數據XA+RA與YB+RB發送給對方。7)Bob進一步處理數據,將X'YB+rB和|IB|發送給Alice。8)Alice利用接收到的數據計算差值X'YB+rB-Y'RA+rA,得到XA與YB的乘積。9)Alice基于XAYB和|IB|,通過相似度近似估計目標-Bob用戶的相似度。10)Alice采用預測評分公式來計算特定項目的預測評分Pui。
通過以上步驟,基于RSA密碼系統和LBlock密碼系統的跨系統協同過濾推薦算法可對目標用戶進行個性化推薦。
3試驗及分析
3.1安全性能試驗
為了研究不同密鑰長度對RSA算法執行效率的影響,選擇512位、1024位和2048位3種長度進行測試,并詳細記錄了密鑰生成、加密及解密所需的時間。測試結果表明,隨著RSA密鑰長度增加,生成密鑰所需的計算時間顯著增長,而加密與解密操作所需的計算時間雖然也有所增加,但增長相對平緩。在RSA密鑰生成過程中,需要生成兩個大素數,并計算其乘積作為公鑰模數。隨著密鑰長度增加,找到足夠大的素數變得更加困難,因此密鑰生成時間呈指數級增長。而在RSA加密和解密過程中,涉及對大數進行模冪運算。模冪運算的時間復雜度為指數級,由于使用了快速模冪算法等優化技術,因此加密和解密時間呈線性增長趨勢。為保障RSA算法安全,應選擇足夠大的素數作為密鑰,這樣可以大大降低攻擊者通過公鑰推導出私鑰的可能性。
3.2相似性度量比較
為比較跨系統協同過濾和單系統協同過濾的精度,本文進行對比試驗。首先,為對比跨系統協作過濾與單系統協作過濾器的精度,本文進行比較試驗。從數量相對稀少的資料表隨機選擇一百個用戶打分向量作為系統A,從數量相對密集的資料表隨機選擇一百個用戶打分向量作為系統B。因為有關系統A的信息極其稀少,所以系統A給系統B發送協同運算要求,接受到反饋后,兩系統按PPCFSCM方法進行協同運算。對系統A、系統B以及系統A和系統B間的跨系統協作算法進行均方絕對誤差(MAE)比較試驗。研究結果表明,隨著數據集的稀疏性增強,協同過濾的推薦精度呈現下降趨勢。在跨系統協作計算中,數據經過加密和茫然傳輸等安全措施保護,第三方只能獲取加密后的數據,無法獲知真實的數據內容。因此,通過跨系統協作計算和基于安全計算模型的數據保護措施,可以在用戶數據稀疏的情況下提高協同過濾推薦算法的精度,保障用戶隱私的安全性。
4結語
本文對信息管理系統的隱私保護與信息安全問題進行深入研究。通過運用安全多方計算理論、輕量級分組密碼算法和RSA密碼系統等技術,提出了安全計算模型,該安全計算模型和算法可保護用戶隱私,提高推薦算法的準確性和安全性,為信息管理系統的隱私保護和信息安全問題提供了有效的解決方案。因此,信息管理系統的隱私保護與信息安全問題的研究具有重要意義。
參考文獻
[1]劉國麗,李昂,李艷萍,等. 跨系統協同過濾推薦算法的隱私保護技術研究[J]. 計算機應用研究,2017,34(9):4.
[2]張明磊,韓明,王震洲. 基于安全多方計算的系統間隱私保持推薦算法[J]. 河北工業大學學報,2012(4):5.