融入用戶反饋的網絡知識社區好友推薦模型構建研究

2024-05-25 00:00:00楊瑞仙楚晨金燕等

現代情報 2024年5期

關鍵詞：網絡知識社區；好友推薦；用戶相似度；核心度；用戶反饋；虛擬社區；個性化推薦；推薦模型

ＤＯＩ：１０．３９６９／ｊ．ｉｓｓｎ．１００８－０８２１．２０２４．０５．００７

〔中圖分類號〕Ｇ２０１〔文獻標識碼〕Ａ〔文章編號〕１００８－０８２１（２０２４）０５－０００１－０２

網絡知識社區作為ＳＮＳ的一種形式，在知識交流中扮演著重要的角色。這是以知識分享、交流為目的的網絡社交平臺。用戶之間基于共同的興趣、知識獲取的需求、知識共享的行為而聚集成各種社群，并通過一定的機制來維系社區秩序［１］，如科學網博客、經管之家、ＲｅｓｅａｒｃｈＧａｔｅ等。然而，隨著信息量急速增長，人們也進入了信息過載的時代，系統如何有效地幫助用戶挖掘潛在的好友，使用戶能夠從浩如煙海的信息中找到感興趣的好友，成為社交網絡系統建設中一項非常重要的業務需求和個性化服務［２］，也是當前網絡知識社區研究的熱點話題。當前常見的好友推薦方法是以用戶屬性為基礎，通過相似度計算來進行好友推薦。然而大部分系統在給用戶進行推薦后并未及時收集用戶的反饋結果，導致推薦系統無法根據用戶的喜好修正推薦列表，從而影響了個性化推薦效果。針對這個問題，艾磊等［３］建立基于有限狀態機的用戶交互模型，生成用戶的個性化需求和偏好，以會話式的交互方式進行推薦。段薇等［４］通過用戶信息行為獲取用戶個性化的信息需求，結合協同過濾算法構建高校移動圖書館的個性化推薦模型來提供推薦服務。

本研究同時考慮到真實的網絡知識社區中用戶交互行為具有稀疏性，容易導致用戶的興趣建模不準確問題，忽略用戶行為受敏感信息的影響而導致的決策結果不公平［５］等問題引入用戶反饋模型。用戶反饋可以帶來一些潛在的好處，比如它提供了對好友推薦模型的直接洞察，使得好友推薦模型更準確地反映用戶偏好；還能使得達到某一準確度所需的訓練數據減少；它可以帶來更靈活的用戶推薦模型，尤其在用戶偏好不穩定的領域非常有用［６］。通過正負反饋機制，根據用戶每一次的正負反饋結果，動態調整好友推薦列表，逐步提高用戶對推薦列表的滿意度。因此，本文以網絡知識社區的典型代表—科學網博客為例，通過爬蟲獲取樣本數據，從用戶相似度計算和反饋兩個視角出發，構建好友推薦模型，使用數據分析軟件Ｐｙｔｈｏｎ，結合人工實驗進行好友推薦，以期為用戶提供高效地、個性化地推薦。

１相關研究

１.１好友推薦方面

好友推薦可以分為單一好友推薦和混合好友推薦［７］。單一好友推薦又分為基于內容和基于社交關系的好友推薦。混合好友推薦可以分為并行式、切換式、迭代式推薦。好友推薦基本過程是以用戶節點信息為基礎，提取用戶特征信息，計算用戶相似度，取Ｔｏｐ－ｋ用戶進行推薦。

國內外學者多從用戶的屬性特征構造用戶畫像的角度，來進行相似度計算。在好友推薦中，度量兩個用戶之間的相似性被稱為用戶相似度計算［８］。最初的用戶相似度計算來源于協同過濾算法，該算法被廣泛應用于個性化的推薦系統。典型的協同過濾推薦算法是基于用戶的協同過濾算法展開的，其基本原理是利用評分數據形成用戶鄰居，根據評分相似的最近鄰居的評分數向目標用戶進行推薦［９］。但是隨著用戶和項目數的增多，協同過濾技術存在數據稀疏性和推薦質量差的缺點。為了解決這些問題，國內外學者進行了大量的研究，例如，榮輝桂等［６］定義了社交網站用戶屬性以及相似度構成與計算方法，提出一種改進的協同過濾算法。在此基礎上，嚴冬梅等［９］通過計算用戶對項目的興趣度來對用戶進行分組，并采用貝葉斯算法與相似度度量方法相結合計算出用戶的最近鄰集合。這種方法構造了有效的用戶鄰居集合，有利于解決用戶數據的稀疏性問題。

此外，一些研究者結合用戶的社交網絡對好友推薦算法進行優化和改進。如徐志明等［１０］主要討論了微博的用戶關系分析技術，并將用戶關系強度定義為用戶之間的相似度。符饒［１１］則基于節點分析，首先從用戶的所在地理位置出發，考慮簽到的時間以及簽到的地理位置，然后進一步通過計算用戶之間的相似度來決定向目標用戶推薦潛在的好友。周磊［１２］綜合考慮節點分析和網絡分析兩個方面，區分了明星用戶與冷門用戶對用戶的不同影響，根據用戶的社交信息特點，對用戶相似度計算方法進行研究并提出了改進。

１.２用戶反饋方面

推薦反饋的概念最早出現于推薦系統當中，如何將推薦結果友好地呈現給用戶和獲得用戶反饋意見都是迫切需要人們研究的問題［１３］。在推薦系統中，反饋可大致分為顯式反饋和隱式反饋。顯式反饋是指用戶可以在推薦系統中對物品的喜愛程度進行打分，這種打分既可以以分數的形式進行給出，也可以用文字來直接表達出用戶的感受。隱式反饋最直觀地體現在用戶的瀏覽行為當中。在相關研究中，ＮｉｃｈｏｌｓＤＭ［１４］對隱式反饋的潛在應用進行了研究，并將用戶的瀏覽行為分成了查閱、保持和引用３類。許昕［１５］在構建用戶興趣模型初期，設計了一種基于用戶瀏覽內容和瀏覽行為的隱式自反饋用戶興趣模型。考慮到用戶的興趣會隨時間變化，高永兵等［１６］提出了一種新的自適應推薦方法，其主要思想就是通過隱式收集用戶的反饋記錄，再使用反饋處理機制分析用戶的行為，挖掘用戶的需求。在很多場景下，顯式反饋數據十分稀疏，而隱式反饋數據相對豐富，并且避免了用戶的操作負擔，較為容易獲取，許多研究人員逐漸意識到隱式反饋數據的價值，將目光轉移到了基于隱式反饋的推薦方法上。

此外，根據用戶反饋的結果可以將反饋分為正反饋和負反饋兩個方面。正反饋是指用戶對推薦結果的積極反饋，例如用戶點擊、購買、評論等行為。在推薦系統中，正反饋是推薦算法的重要評價指標之一，用于衡量推薦算法的準確性和有效性。負反饋是指用戶對推薦結果的消極反饋，例如用戶忽略、刪除、標記為垃圾等行為。在推薦系統中，負反饋也是一個重要的評價指標。通過分析用戶的正負反饋行為，推薦系統可以不斷優化推薦結果，減少用戶的不滿和誤導，提高用戶的滿意度和體驗感。李以正［１７］分別根據系統中的“后控詞表” 和“檢索規則庫” 來向用戶提供初級反饋和高級反饋，以改進情報檢索系統。傅鶴崗等［１８］利用用戶最新的評價信息來自動更新推薦模型，能夠實時反映用戶的興趣變化，提高推薦的準確度。尹云飛等［１９］提出基于歷史推薦信息的正負反饋優化調整策略，揭示了在線社交網絡中好友關系刻畫的心理學認知問題和推薦的動態變化問題，很好地將用戶反饋與好友推薦結合在一起。但傳統的推薦反饋只考慮用戶的正反饋信息，即用戶—項目的點擊數據［２０］。而用戶的負反饋信息往往被忽略了，如推薦給用戶的項目，用戶并沒有點擊就是一種負反饋。通過將負反饋信任融入基于用戶興趣的推薦方法中，能夠提高社交網絡中好友推薦的質量［２１］。

１.３研究述評

綜上所述，早期研究中的好友推薦主要采用協同過濾算法，但隨著技術水平的發展，信息過載問題日益凸顯，協同過濾等算法的數據項目稀疏以及冷啟動問題表現得越來越明顯，不能充分滿足用戶的推薦需求。此外，核心用戶能夠幫助用戶快速了解社區，盡管學者在進行好友推薦時也考慮到了核心用戶的重要性，但很少有研究考慮同時推薦社區中相似度較高的用戶和本社區的核心用戶。用戶反饋方面，目前學者們有關個性化研究的視角已經從單向的用戶推薦轉向用戶動態行為的反饋，但現有的推薦算法容易造成用戶信息繭房的問題，且忽視了用戶自身的反饋信息。本研究依據科學網博客所構建的好友推薦模型，結合用戶相似度和用戶反饋，以提高用戶推薦的準確性。

２模型構建

隨著時間的遷移，網絡知識社區中累積了大量的用戶基本信息和社交、博文數據。顧佳云等［２２］將虛擬社區中的學者信息分為基本信息、博文信息、社交信息，并以此建立用戶興趣相似度的計算模型。高良誠［２３］融合用戶關系—興趣—位置，綜合考慮用戶社交關系、興趣愛好、地理位置等用戶信息，對相似度進行加權計算，作為推薦算法的依據。基于以上模型，本文結合科學網博客用戶的多屬性特征，以及社區核心用戶的度量指標，構建了好友推薦模型。首先，通過爬蟲工具爬取網絡知識社區的樣本數據，結合用戶的多屬性特征、社區核心用戶的度量方式，建立相似度評價指標體系；其次，通過計算各級指標權重，利用相似度計算得到用戶對之間的綜合相似度，同時得到用戶核心度排名；最后，結合人工實驗引入用戶反饋機制，針對每次推薦的結果進行動態調整，為用戶進行最優推薦。具體模型如圖１所示。

２.１用戶相似度計算

２.１.１相似度計算指標

科學網博客申請審核嚴格，用戶信息豐富，并且博文很大程度上能夠反映學者的學習興趣與專業方向。對于給定的一個用戶ｕ，其用戶的基本屬性信息包含３種一級指標（背景信息、社交關系、博文信息），因此用戶之間的綜合相似度計算可分解為３種屬性信息的表示。即Ｐｒｏｆｉｌｅ（ｕ）＝｛Ｂａｃｋｇｒｏｕｎｄ（ｕ），Ｒｅｌａｔｉｏｎ（ｕ），Ｔｗｅｅｔ（ｕ）｝，具體說明如下：１）Ｂａｃｋｇｒｏｕｎｄ（ｕ）：表示ｕ的背景信息，包含４個二級指標（用戶組、研究領域、知識背景、地域），均為短文本信息，可表示為字符串。

２）Ｒｅｌａｔｉｏｎ（ｕ）：表示用戶的社交關系信息，用共同好友屬性來表示，本文分別將用戶好友集進行整合，形成用戶好友列表集。

３）Ｔｗｅｅｔ（ｕ）：表示用戶ｕ發布的全部博客所拼接成的長文本，主要處理過程包括文本預處理、權重計算、相似度計算。

因此，通過對科學網博客用戶信息指標進行篩選，將用戶背景信息、社交信息、博文信息作為計算用戶相似度的一級指標，同時根據社區的節點特征對用戶背景信息進一步細分，形成二級指標體系，具體指標劃分和其含義如表１所示。

２.１.２背景相似度計算

在科學網博客中，用戶的背景信息是由用戶組、研究領域、知識背景、地域４個指標進行表示的。

用戶組表示用戶在社區中的積分等級，綜合反映用戶注冊時間長短以及發表博文的積極性；研究領域代表博主目前研究的主要問題，由學科所在的學科大類、二級學科、研究方向三級組成，共同反映用戶的學科方向；知識背景即教育背景，反映了用戶教育經歷，可以用于推薦具有相同教育經歷的好友，提高計算準確度；地域是用戶的所在區域，精確到省市區，區域相同用戶更利于雙方產生知識交流。本文使用Ｐｙｔｈｏｎ的Ｊｉｅｂａ庫對指標內容進行分詞處理。對用戶背景信息使用Ｊｉｅｂａ分詞中的精確模式函數Ｊｉｅｂａ.ｌｃｕｔ，該函數能夠將句子最精確地分詞，適合于文本分析。定義如式（１）所示：

當集合Ａ、Ｂ都為空時，Ｊ（Ａ，Ｂ）定義為１。在涉及到用戶相似度計算過程中，均采用Ｊａｃｃａｒｄ算法進行用戶之間的相似度計算。ＪａｃｃａｒｄＩｎｄｅｘ，又稱為Ｊａｃｃａｒｄ相似系數（ＪａｃｃａｒｄＳｉｍｉｌａｒｉｔｙ），用于比較有限樣本集之間的相似性和差異性，Ｊａｃｃａｒｄ系數值越大，樣本相似度越高。其計算方法如式（２）所示：

２.１.６用戶核心度計算

從相關理論概念中可以看出，網絡社區的核心用戶也被稱為高影響力用戶或關鍵用戶等。這些用戶往往擁有活躍性、權威性、影響力等方面的特征［２７］，對用戶的觀點和行為方面具有重要的影響作用。社會影響力理論認為，社會網絡中的一些節點具有更高的影響力和知名度，他們的言行舉止可以對其他節點產生更大的影響力。在好友推薦中，推薦核心用戶就是基于社會影響力的一種策略。因此，通過向用戶推薦核心用戶，推薦系統可以增加用戶之間的社交互動和參與度，從而提高用戶的滿意度和忠誠度。此外，從長尾理論［２８］角度討論核心用戶推薦也是非常有意義的。

本文從社區最近鄰思想出發，在分析處于長尾分布不同位置用戶作用的基礎之上，結合網絡知識社區核心用戶的屬性信息，建立了核心用戶指標體系，如圖３所示。在項目評審中，一些研究［２９－３０］從科學計量學角度將專家科研能力納入專家遴選標準，重點考察專家研究方向、學術水平、科研經驗、知名度等信息。因此，本文也從科學計量角度去計算核心用戶的推薦指數［３１］（ＲｅｃｏｍｍｅｎｄａｔｉｏｎＩｎｄｅｘ，ＲＩ）。在本文中，推薦指數主要從學者本身的積極性以及用戶的權威性來考慮，將推薦指數認為是由用戶的積極性（ｓ）、用戶的權威性（ｎ）、加權的線性組合而成即可表示為式（８）。其中λ 表示用戶積極性的權值，通過熵權法可以確定其具體值。在后續反饋調節過程中，涉及調用式（８）則λ 保持不變。

ＲＩ＝λｓ＋（１－λ）ｎ（８）

該節核心用戶的指標權重采用熵權法進行確定。熵權法是一種以信息熵為權重標準，計算各指標權重的方法。根據信息論的基本原理，信息是系統有序程度的度量，因此稱熵的度量值為信息熵［３２］。可利用熵權法確定各指標的權重，以減少主觀因素對指標權重的影響，使評價結果更為客觀。

２.２用戶反饋機制

隨著用戶推薦算法的不斷發展，好友推薦算法也產生了一系列的負面作用，其中“信息繭房” 成為一個越來越突出的問題。目前的推薦算法普遍將用戶所需信息等價為用戶喜歡的內容進行推送，長此以往人們便會被同質性信息包圍［３３］。學界對個性化推薦與信息繭房的關系一直存在爭議。一方面，以個性化推薦為代表的信息篩選技術可能會產生過濾氣泡［３４］，為用戶的信息偏食制造條件，加劇信息繭房；另一方面，信息偏食本質上是由于個體的選擇性心理造成的，推薦算法反而有利于用戶接觸到更多樣化的信息，減輕信息繭房的負面效應［３５］。用戶反饋考慮到了用戶的接受程度，能夠拓寬用戶的交友選擇，使得用戶了解更廣泛的知識，減輕了信息繭房的影響。在好友推薦系統中，假設用戶Ａ為待推薦用戶，若用戶Ａ的待推薦好友形成了如上所述的好友列表，將用戶Ｂ推薦給用戶Ａ。若用戶Ａ接受用戶Ｂ，則繼續給Ａ推薦與Ｂ相似的用戶，此為正反饋推薦。正反饋調節會將與用戶Ｂ相似較高的用戶推薦給Ａ，從而提高成為好友的可能性。若用戶Ａ不接受用戶Ｂ，則與用戶Ｂ相似的用戶不再推薦給Ａ，此為負反饋推薦。結合用戶的初始推薦列表進行正負反饋調節。鑒于反饋調節需要進行多次，因此需要引入相似度調節公式以此來修改相似度值，從而調節推薦列表，用戶正反饋后的相似度公式如式（１４）所示：

其中， λ 表示正負反饋調節因子，根據實際用戶相似度矩陣值可設置為λ ＝００１。通過反饋得到的相似度對用戶相似度矩陣和核心列表用戶進行調節，使得在進行二次推薦時能夠根據用戶的喜好來推薦用戶。為便于處理迭代的相似度值，因此需要對相似度進行歸一化處理，本文引入Ｓｏｆｔｍａｘ函數，又稱為歸一化函數。Ｓｏｆｔｍａｘ函數是邏輯函數的一種推廣，它能將一個含任意實數的Ｋ維向量“壓縮” 到另外一個Ｋ維實向量σ（ｚ）中，使得每一個元素的范圍在（０，１）之間，并且所有元素的和為１。Ｓｏｆｔｍａｘ函數實際上是有限項離散概率分布的梯度對數歸一化。因此，Ｓｏｆｔｍａｘ函數在包括多項邏輯回歸、多項線性判別分析、樸素貝葉斯分類器和人工神經網絡等的多種基于概率的多分類問題方法中都有著廣泛應用。特別的，在多項邏輯回歸和線性判別分析中，函數的輸入是從Ｋ個不同的線性函數得到的結果。而樣本向量ｘ屬于第ｊ個分類的概率如式（１６）所示：

３實證研究與模型檢驗

３.１數據收集與預處理

不同于其他通用社交網站，科學網博客由于服務用戶群體細分程度較高，因此整體用戶體量適中，交互也相對更加頻繁；同時，科學網博客擁有詳細的個人主頁，用戶基本信息填寫完整性較高；在用戶社交關系和交互行為數據的記錄方面，科學網擁有“請求—通過” 方式的雙向好友系統，用戶在平臺上的所有交互行為，包括發文、評論、回復、留言等數據也會被平臺完整地記錄，從而采集到的樣本數據的數量和質量都比較高；此外，科學網博客對出于研究目的獲取樣本數據的限制也較少。以上數據體量適中、數據規范完整、用戶生成內容質量高、數據可得性好等特點，使得科學網博客適合作為本文實證研究的對象。因此，本文選擇“科學網博客” 作為數據來源，通過Ｐｙｔｈｏｎ程序開發的網絡爬蟲爬取科學網博客中２０１３年１月６日—２０２２年１２月２８日所有的８大板塊的已注冊的用戶信息，涵蓋了科學網博客的所有的動態用戶。共獲得了１２１１７３條數據，其中包括９７３２９條用戶博客信息以及２３８４４條用戶基本信息。數據集清洗了博文數量或好友數量為０以及隱私設置不可見的用戶，選取了１０４１２個用戶同時根據博主ＩＤ對博文進行合并，得到了用戶對應６９８５４條博客信息。其中，用戶的基本屬性信息包括用戶的ＵＩＤ、用戶名、用戶的知識背景、研究領域、博客訪問量、好友數和好友列表、博文數以及博文數據集、居住地、用戶組、威望值、積分、金幣值。部分經處理后的用戶的背景、好友列表信息如表２所示，同時使用ＴＦ－ＩＤＦ方法對用戶的博文信息進行處理即得到表３。

３.２用戶相似度計算

３.２.１用戶相似度矩陣

本文采用層次分析法計算用戶指標權重，該方法是２０世紀７０年代，美國運籌學家ＳａａｔｙＴＬ正式提出的一種系統化的、層次化的、結合定性與定量的層次權重決策分析方法。以用戶背景、用戶社交關系、用戶博文的一級指標和二級指標為依據，可以得到二級指標的權重以及一級指標對應的值，具體結果如表４所示。其中，一級指標中用戶的背景信息為０.６１６，對應的二級指標權重分別是０.１５４、０.２７７、０.１２３、０.０６２。用戶的研究領域比重最高，科學網博客在收集用戶背景信息時要著重關注用戶的研究背景。此外，用戶的社交關系權重為０.２６７，博文信息所占比重為０.１１７。可以看出用戶背景信息所占比重較大，因此在科學網博客推薦系統中要著重考慮用戶背景信息的重要性。根據表２～表４對用戶的綜合相似度進行計算，得到了用戶的相似度矩陣表，其中部分數據如表５所示。

３.２.２用戶核心度

根據３.２節采用熵權法計算核心用戶核心度指標，權重系數和信息熵計算結果如表６所示。

根據表６可知，在核心用戶指標權重中，用戶的威望值對核心用戶評價影響最大，所占權重為０. ２９２，用戶博客訪問量次之，所占權重為０.１６２。而用戶的回帖數和用戶的在線時長分別是０.１４４、０.１３９，用戶粉絲量次之，用戶的活躍度和金幣值分別是０.０７４和０.０７１。可以看出用戶的威望值權重最大，說明威望值對核心用戶指標影響最大，因此，后續在考慮科學網博客用戶推薦時可以著重考慮用戶的威望值和用戶的博客訪問量的影響。通過式（８）可以計算出每個核心用戶的推薦指數，進一步可以得到核心用戶列表。社區Ｔｏｐ－ｋ用戶如表７所示，從表７中可以看出，用戶排名越靠前，表明該用戶在社區核心度越高，其中用戶ＵＩＤ為４１５的用戶核心度最高，其次分別為用戶ＵＩＤ為３９７３１、４１１７４等的用戶。通過在該網站進行查證，表中用戶的排名與各自領域內的聲譽一致，表明本研究的核心用戶計算是有效的。

３.３模型檢驗

為進一步驗證本文提出的用戶相似度計算模型在好友推薦方面的有效性，選取１０００名用戶進行測試，采用Ｔｏｐ－ｋ常用的推薦評價指標準確率（Ｐｒｅｃｉｓｉｏｎ）、召回率（Ｒｅｃａｌｌ）以及綜合準確率和召回率的調和平均值Ｆ１－ｍｅａｓｕｒｅ來評價好友推薦結果。如式（１８）～式（２０）所示：

實驗對經典的基于內容的好友推薦模型、基于用戶相似度和基于用戶核心度以及本文提出的綜合相似度和核心度模型，來檢驗４種推薦模型的推薦效果。設置好友推薦數量在ｋ＝５、１０、１５、２０、２５，５種情況下來比較，考慮到部分社區用戶的好友數量較少，所以在評定時將好友閾值設為１５，對高于閾值的用戶進行評價。其推薦算法準確率、召回率和調和平均值Ｆ１－ｍｅａｓｕｒｅ比較結果如圖４～圖６所示。

由圖４～圖６可知，通過消融實驗，與傳統的基于內容相比，其他３種模型的準確率、召回率和Ｆ１－ｍｅａｓｕｒｅ都高于傳統的基于內容的好友推薦。此外，本研究提出的融合相似度和核心度模型，明顯優于其他３種推薦模型，前者同時考慮了用戶的多維屬性以及社區的核心用戶，更加符合現實生活中用戶的需求。這就說明了本文所提出的用戶相似度和核心用戶計算模型具有很好的推薦效果。

為了進一步驗證反饋機制的有效性，采用人工實驗的方法來測評推薦和反饋模型。為保證實驗的科學性，從“圖書與情報” 學科領域找到了５位專家、碩士生，從“信息科學” 領域找到了３位碩士生，以及“生命科學” “工程材料” “化學科學” “地球科學” 領域的５位碩士生共計１３位測試者對推薦和反饋模型結果進行評價。測評過程如下： ①根據測試者的信息，通過Ｐｙｔｈｏｎ計算出推薦用戶ＵＩＤ。在初始推薦列表中，采用由核心列表和相似度矩陣生成推薦列表； ②獲取到測試者的用戶推薦列表后，測試者根據推薦用戶ＵＩＤ仔細查看研究獲取的用戶信息，并讓測試者進行評價，即是否有意向添加此用戶為好友。在本研究中，將有意愿添加推薦好友用數字１表示，數字０則表示測試者無意愿添加推薦用戶。根據實驗者實際需求，將初始推薦好友數目設置為ｎ＝５。在測試者實驗過程中，要求測試人員必須逐一查看推薦ＵＩＤ對應的用戶的具體信息，并及時記錄測試者的評價結果。經過初始推薦，得到了１３份測評和２４次反饋，如表８所示。

根據用戶評價結果可以看出，以測試者１為例，在測評中推薦的核心用戶１７９２０１２、６９４７４是測試者１所在學科領域的較有影響力的用戶，對博主具有較高的推薦價值。而３３７９８３２、３４８２２、３４７８１１０在測試者１的推薦列表中由相似度矩陣生成，與測試者１有極高的相似度，易于雙方產生知識交流。這說明了本文提出的相似度計算模型推薦的用戶具有很高的相關性，其他測試者也符合測試者１特征。

在用戶的初始混合好友推薦中，有４位測試者對自己好友推薦列表都有意愿添加好友，同時也獲得了其他９位測試者的數據。針對其他９位測試者繼續進行正負反饋調節，以確保其獲得推薦的好友能獲得用戶的全部滿意，并得出具體的反饋次數。

根據第一次反饋結果，只有測試者３和測試者１０對反饋的結果并不完全滿意。而其他７位測試者在經過一次反饋后，均對經過正負反饋調節的好友達到了滿意。這說明在經過一次反饋時，正負反饋根據用戶的評價選取了更合適的好友推薦列表。隨后，繼續對剩下的用戶進行相同的調節，其數據如表１０所示。

在經過二次反饋之后，測評者對于推薦的好友有更強烈的意愿添加為好友。測試者３和測試者１０對經過二次反饋的好友列表達到了滿意。經研究發現，本文所提出的好友推薦模型在經過兩次反饋后，能夠使得用戶達到較高的滿意度，因此應將反饋次數設置在兩次從而達到較好的效果。

４總結

本研究提出一種新型好友推薦模型，從用戶相似度計算和反饋的角度出發，基于Ｐｙｔｈｏｎ處理用戶相似度和用戶核心度，并結合反饋機制為用戶進行好友推薦。本文首先從科學網博客學術社區爬取用戶數據，使用ＴＦ－ＩＤＦ提取用戶博文關鍵詞。同時使用層次分析法確定用戶相似度計算指標權重，結合用戶的背景信息、好友列表信息和博文信息形成用戶相似度矩陣。通過熵權法計算核心用戶指標權重，根據用戶的權威性和積極性及其相應的二級指標，得到了核心用戶列表。融合相似度矩陣和核心列表，得到了用戶的Ｔｏｐ－ｋ推薦列表。最后，本文引入了用戶反饋機制，能夠根據用戶對推薦列表的正負反饋，動態調整用戶待推薦列表，有效提高了用戶推薦的質量。但是論文仍存在以下不足： ①實驗雖然采取ＴＦ－ＩＤＦ方法進行關鍵詞的提取，但缺少對博主情感詞語的描述； ②本文只是提出了一種反饋的思路，即實驗時僅對少量的用戶進行人工測試，未來可采取機器學習等方法進一步深入研究； ③人工實驗并未反映用戶對用戶的滿意程度。

（責任編輯：郭沫含）