張國防 徐建民



關(guān)鍵詞: 社交網(wǎng)絡(luò); 信息傳播; 積極交互作用; 節(jié)點影響力
DOI:10.3969 / j.issn.1008-0821.2023.05.009
〔中圖分類號〕G206 〔文獻標識碼〕A 〔文章編號〕1008-0821 (2023) 05-0090-14
2022年政府工作報告中關(guān)于加強和創(chuàng)新互聯(lián)網(wǎng)內(nèi)容建設(shè), 深化網(wǎng)絡(luò)生態(tài)治理的相關(guān)內(nèi)容, 充分表明弘揚正能量、處置違法、抑制虛假和惡意等不良信息的必要性和迫切性。開放、易用、時效性強的社交網(wǎng)絡(luò)在為用戶提供信息、共享便利的同時, 也滋生并傳播了大量虛假信息, 在政治、經(jīng)濟、心理學等方面給個人甚至整個社會帶來深遠的負面影響,且不益于網(wǎng)絡(luò)信息內(nèi)容的生態(tài)治理[1] 。因此, 如何識別社交網(wǎng)絡(luò)中的高影響力節(jié)點, 從而抑制虛假信息的傳播, 已成為網(wǎng)絡(luò)信息生態(tài)治理中需要解決的一個重要問題。且隨著社交網(wǎng)絡(luò)在人們獲取信息、共享便利過程中發(fā)揮的優(yōu)勢越來越大, 研究社交網(wǎng)絡(luò)信息傳播機制, 挖掘網(wǎng)絡(luò)中的高影響力節(jié)點, 對管控網(wǎng)絡(luò)信息傳播、深化網(wǎng)絡(luò)信息生態(tài)治理有重要意義。
在度量網(wǎng)絡(luò)用戶節(jié)點影響力并進行排序時, 研究者們通常將現(xiàn)實的社交網(wǎng)絡(luò)抽象為無向圖或有向圖, 網(wǎng)絡(luò)用戶對應(yīng)圖中的節(jié)點, 而用戶間的各種關(guān)系借助圖中相應(yīng)節(jié)點間的連邊加以表示, 進而基于網(wǎng)絡(luò)的拓撲結(jié)構(gòu), 對用戶節(jié)點的影響力進行分析研究。而在現(xiàn)實社交網(wǎng)絡(luò)中的節(jié)點通常為具有社會屬性的人, 所以在影響或激活節(jié)點的過程中, 其多個入鄰居之間通常情況下不是相互獨立的。一種模式是入鄰居之間相互促進, 積極合作, 共同影響目標節(jié)點, 稱之為積極交互作用; 另一種模式則相反,入鄰居間矛盾重重, 相互制約, 在影響目標節(jié)點時呈現(xiàn)出消極交互作用。本文將節(jié)點之間進行積極或消極合作所表現(xiàn)出來的影響效應(yīng)視為節(jié)點間的交互作用。如節(jié)點C 有A 和B 兩個入鄰居節(jié)點, 對C的影響權(quán)重(或者理解為關(guān)系強度)分別為0.5 和0.3, 如圖1(a)所示。從網(wǎng)絡(luò)拓撲結(jié)構(gòu)來看, 節(jié)點A 和B 之間存在著某種耦合關(guān)系。另外, 從用戶群體心理角度出發(fā), 同時考慮到在實際的社交網(wǎng)絡(luò)中A 和B 之間可能存有連邊的情況, A 和B 兩者可能具有交互關(guān)系, 或者是相互促進的積極合作關(guān)系,或者是相互制約的消極合作關(guān)系。也就是說A 和B被激活或被影響后, C節(jié)點被激活應(yīng)該是A 單向影響、B 單向影響、A與B交互合作影響3種模式綜合作用的結(jié)果。圖1(c)表示A 和B 之間具有積極交互作用, 圖1(d)表示A 和B 之間具有消極交互作用, 而圖1(b)表示A 和B 之間是相互獨立的。
在進行多屬性決策時通常會考慮屬性間的交互作用, 因為各屬性之間通常存在關(guān)聯(lián), 而這種關(guān)聯(lián)對決策的影響不可以忽略, 且交互模式也是制定最終決策需要考慮的重要因素之一[2-3] 。近年來, 從多屬性決策視角進行網(wǎng)絡(luò)節(jié)點影響力排序的相關(guān)研究相繼展開[4-5] , 因此, 正如在解決多屬性決策問題時不可以忽略屬性間的交互作用對決策的影響,在進行社交網(wǎng)絡(luò)節(jié)點影響力的排序時也不能不考慮節(jié)點入鄰居間的交互作用對該節(jié)點影響力以及活躍性的影響。
綜上, 網(wǎng)絡(luò)節(jié)點間的交互性以及交互作用模式(積極或消極)在有向加權(quán)社交網(wǎng)絡(luò)中起著重要作用, 因此, 要想擴大信息在網(wǎng)絡(luò)中的傳播范圍, 或?qū)W(wǎng)絡(luò)節(jié)點影響力進行排序, 需要考慮到相應(yīng)節(jié)點間的交互作用。本文在深入分析節(jié)點間交互模式對社交網(wǎng)絡(luò)信息傳播具有重要影響的基礎(chǔ)上, 面向有向加權(quán)網(wǎng)絡(luò)充分挖掘積極交互作用并加以利用, 提出一種新的網(wǎng)絡(luò)節(jié)點影響力排序方法, 從擴大信息傳播范圍的角度驗證了方法的有效性。
1相關(guān)研究
目前對網(wǎng)絡(luò)節(jié)點影響力進行排序的相關(guān)研究主要基于局部屬性、社團關(guān)系、全局屬性和隨機游走4 個視角來展開。
1.1基于局部屬性的節(jié)點影響力排序
基于局部屬性的網(wǎng)絡(luò)節(jié)點影響力排序研究以度中心性(Degree Centrality) 分析最為常見[6] , 該方法以節(jié)點的鄰居數(shù)量為主要考量指標, 反映相應(yīng)節(jié)點的直接影響程度, 但其局限性在于未考慮用戶在網(wǎng)絡(luò)中的位置[7] 。Chen D B 等[8] 綜合節(jié)點及其鄰居的度信息, 通過局部中心性(Local Centrality)指標度量節(jié)點的局部影響力, 之后考慮到節(jié)點鄰居間的拓撲結(jié)構(gòu)的重要性, 提出了融合度和聚類系數(shù)的節(jié)點影響力排序方法, 發(fā)現(xiàn)即使在兩節(jié)點的度相同情況下, 相應(yīng)節(jié)點的影響力關(guān)于聚類系數(shù)遞減[9] 。包括后續(xù)圍繞度中心性和聚類系數(shù)等網(wǎng)絡(luò)結(jié)構(gòu)特征進行的影響力分析研究著眼于網(wǎng)絡(luò)的局部屬性以及用戶節(jié)點的內(nèi)部屬性, 然而節(jié)點的傳播能力易受其所在社區(qū)的規(guī)模及社區(qū)內(nèi)節(jié)點間緊密度的影響[10] 。因此, 從社區(qū)關(guān)系角度出發(fā), 展開網(wǎng)絡(luò)用戶節(jié)點影響力度量及排序的研究引起了相關(guān)學者的注意。
1.2基于社團關(guān)系的節(jié)點影響力排序
此類研究主要依據(jù)弱連接經(jīng)典理論, 聚焦于網(wǎng)絡(luò)用戶及其鄰居所在社區(qū)的拓撲結(jié)構(gòu)特征, 探討用戶節(jié)點的信息傳播能力。如Zhao Z Y 等[11] 采用社區(qū)發(fā)現(xiàn)方法將社交網(wǎng)絡(luò)進行適當劃分, 結(jié)合已有影響力排序指標, 考慮節(jié)點所連接的社區(qū)數(shù)量, 提出量化節(jié)點影響力的Vc指標。此外, 基于結(jié)構(gòu)洞理論, Su X P 等[12] 深入分析了網(wǎng)絡(luò)用戶節(jié)點所在社區(qū)的中心性以及“橋接” 不同社區(qū)的連通性, 提出了N-Burt 網(wǎng)絡(luò)用戶節(jié)點影響力排序模型; Han Z M等[13] 利用結(jié)構(gòu)洞節(jié)點在連接不同社區(qū)、加速信息擴散方面的優(yōu)勢, 融合多種度量指標, 提出基于ListNet 的節(jié)點影響力排序方法, 取得了較好的效果。基于社區(qū)關(guān)系的節(jié)點影響力排序方法著重考慮了網(wǎng)絡(luò)用戶節(jié)點的鄰居以及社區(qū)性, 能夠充分揭示個體和群體間的影響程度, 但排序結(jié)果易受社區(qū)發(fā)現(xiàn)算法影響, 因此, 若社交網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu)不明顯, 則排序結(jié)果不理想。
1.3基于全局屬性的節(jié)點影響力排序
相對于局部屬性或社區(qū)關(guān)系視角下的節(jié)點影響力排序方法, 基于全局屬性的排序方法著重考慮用戶節(jié)點在網(wǎng)絡(luò)中的全局信息, 能夠充分揭示節(jié)點的拓撲特征, 但因時間復(fù)雜度較高而只適用于規(guī)模不大的社交網(wǎng)絡(luò)。其中較為常用的除了傳統(tǒng)的介數(shù)中心性、緊密度中心性、特征向量中心性和Katz 中心性外, 基于K-shell 分解的節(jié)點影響力排序方法近年來受到關(guān)注[14] 。如Liu Y 等[15] 利用K-核分解挖掘并深入分析真實社交網(wǎng)絡(luò)中的核心結(jié)構(gòu), 剖析網(wǎng)絡(luò)中“偽核心” 的存在原因, 度量局部小團體的信息量, 提出基于網(wǎng)絡(luò)連接熵的節(jié)點影響力排序方法。另外, Lü L 等[16] 考慮到H 指數(shù)作為學者或期刊影響力的重要評價指標, 也是從節(jié)點的全局屬性角度量化其影響力, 將其引入社交網(wǎng)絡(luò)用于節(jié)點影響力排序, 在證明了H 指數(shù)與K 核數(shù)之間關(guān)聯(lián)性基礎(chǔ)上, 指出了H 指數(shù)在社交網(wǎng)絡(luò)節(jié)點影響力排序方面的優(yōu)勢。
1.4基于隨機游走的節(jié)點影響力排序
上述3 類節(jié)點影響力排序方法是一種確定性排序方法, 而基于隨機游走的排序方法則是以概率統(tǒng)計為理論基礎(chǔ), 圍繞網(wǎng)絡(luò)拓撲結(jié)構(gòu)展開節(jié)點影響力排序的不確定性方法, 其中典型方法包括PageR?ank、HITS、LeaderRank 以及基于此3 類算法的改進方法[14] 。如闞長江等[17] 深入分析網(wǎng)絡(luò)中互惠邊對信息傳播速度和規(guī)模的影響, 結(jié)合PageRank 和LeaderRank 的優(yōu)缺點, 提出了基于節(jié)點互惠邊的隨機游走算法, 對微博網(wǎng)絡(luò)中節(jié)點的影響力進行排序,在關(guān)鍵節(jié)點識別方面優(yōu)于PageRank 和LeaderRank算法; 顧潔等[18] 考慮到社交網(wǎng)絡(luò)中普遍存在正負兩面的鏈接性, 將PageRank 算法推廣到符號社交網(wǎng)絡(luò), 從正負兩個角度對節(jié)點影響力進行排序, 結(jié)果符合符號網(wǎng)絡(luò)中正負關(guān)系的特性; 董偉等[19] 結(jié)合SVM 算法, 基于用戶交互和評論情感信息, 對Pag?eRank 算法進行改進, 提出用于在線健康社區(qū)用戶影響力的排序方法; Zhang P 等[20] 通過引入調(diào)劑用戶節(jié)點間鏈接邊權(quán)重和相應(yīng)節(jié)點度的參變量, 將PageRank 算法推廣到有向加權(quán)社交網(wǎng)絡(luò)環(huán)境中, 提出了一種高效的迭代算法以適應(yīng)大規(guī)模網(wǎng)絡(luò); Li Q等[21] 考慮到LeaderRank 算法收斂速度快、有較強的抗攻擊性、對噪聲數(shù)據(jù)的低敏感性和最具影響力節(jié)點精準識別能力, 基于網(wǎng)絡(luò)節(jié)點的入度對背景節(jié)點的出度進行加權(quán), 進而改進LeaderRank 算法, 提出優(yōu)于LeaderRank 算法的節(jié)點影響力排序方法。
上述方法主要基于網(wǎng)絡(luò)的拓撲結(jié)構(gòu)對節(jié)點影響力進行排序, 未考慮節(jié)點之間的交互作用對其鄰居活躍性的影響, 這里節(jié)點間交互作用可以簡單認為是在激活其鄰居節(jié)點、傳遞影響力、擴大信息傳播范圍過程中, 節(jié)點之間進行積極或消極合作所表現(xiàn)出來的影響效應(yīng)。本文在現(xiàn)有研究的基礎(chǔ)上, 基于網(wǎng)絡(luò)節(jié)點間交互模式對社交網(wǎng)絡(luò)信息傳播規(guī)模的影響, 提出一種充分利用用戶節(jié)點間積極交互作用的網(wǎng)絡(luò)信息傳播模型, 探討積極交互模式在網(wǎng)絡(luò)信息傳播中的作用; 考慮節(jié)點間積極交互可以影響其鄰居節(jié)點的活躍性, 提出一種最大化節(jié)點間積極交互作用的隨機游走算法, 用于識別社交網(wǎng)絡(luò)中的高影響力節(jié)點。
2考慮積極交互作用的網(wǎng)絡(luò)信息傳播機制研究
圖3從新增被激活總數(shù)角度可視化不同信息傳播模型下信息的傳播規(guī)模, 而圖4 則從單位時間新增被激活節(jié)點數(shù)視角揭示不同信息傳播模型下信息的傳播速度, 繼而可以看出信息傳播的周期性。從兩圖可以看出, 在所構(gòu)建的不同網(wǎng)絡(luò)中, 基于積極交互作用最大化的信息傳播模型表現(xiàn)出較大的信息傳播規(guī)模, 究其原因主要是充分挖掘了網(wǎng)絡(luò)用戶節(jié)點入鄰居之間的積極交互作用, 增大了節(jié)點的激活函數(shù)值。這與理論證明的結(jié)果相吻合, 即基于積極交互作用最大化的信息傳播模型下成功激活網(wǎng)絡(luò)節(jié)點的概率大于或等于線性閾值信息傳播模型和獨立級聯(lián)信息傳播模型下成功激活節(jié)點的概率, 且在線性閾值信息傳播模型和獨立級聯(lián)信息傳播模型下最終被激活的節(jié)點個數(shù)為基于積極交互作用最大化的信息傳播模型下最終被激活的節(jié)點個數(shù)的下界。這樣的結(jié)果也表明, 節(jié)點間的積極交互在社交網(wǎng)絡(luò)信息傳播中發(fā)揮著重要的作用, 在信息傳播中充分挖掘并利用節(jié)點間的積極交互作用, 將有利于信息的更廣傳播。即使信息本身的吸引力較弱, 如果能很好地發(fā)揮節(jié)點間的積極交互作用, 也可以擴大信息在網(wǎng)絡(luò)中的傳播規(guī)模。因而, 在利用免疫信息對網(wǎng)絡(luò)虛假信息進行傳播抑制時, 若希望免疫信息得到廣泛的傳播, 除了信息本身的價值外, 在組織免疫信息時也需使免疫信息盡量引起節(jié)點間的積極交互, 充分考慮節(jié)點間的積極交互作用。而在實際的社交網(wǎng)絡(luò)中, 由于共同興趣或其他的同質(zhì)性特征,影響同一節(jié)點多個節(jié)點(即使是虛擬用戶節(jié)點)之間也存在交互現(xiàn)象, 因此, 相比獨立級聯(lián)和線性閾值信息傳播模型, 基于最大化積極交互作用的信息傳播模型更能真實地反映網(wǎng)絡(luò)信息傳播機制。
4.3新排序算法有效性分析
為了說明新的節(jié)點影響力排序算法在識別高影響力節(jié)點方面的有效性, 本文針對有向加權(quán)網(wǎng)絡(luò),將InteractivityRank 算法與加權(quán)入度中心性算法[20] 、加權(quán)PageRank 算法和加權(quán)LeaderRank 算法進行比較。顯然, 若節(jié)點在某種算法下的排序值越大, 則其影響力越大, 排序越靠前。因此, 節(jié)點排序值與其實際的影響力傳播規(guī)模正相關(guān)性越強, 算法的有效性越好??紤]到邊緣節(jié)點可能會影響算法排序的有效性, 實驗的研究對象限定為加權(quán)入度值排序靠前的n 個節(jié)點。本文就網(wǎng)絡(luò)1 ~ 4, 通過Kendallstau 方法計算了InteractivityRank 算法與加權(quán)入度中心性算法、加權(quán)PageRank 算法和加權(quán)LeaderRank算法排序結(jié)果的相關(guān)性, 分別簡記為IR-WK、IRWPR和IR-WLR, 如表4所示。
表4 中數(shù)據(jù)顯示, InteractivityRank 算法的排序結(jié)果均與加權(quán)PageRank 算法和加權(quán)LeaderRank 算法的排序結(jié)果具有較強的相關(guān)性, 且與加權(quán)Lead?erRank 算法的排序結(jié)果表現(xiàn)出最高的相關(guān)性, 超過0 95; 相比而言, 與加權(quán)入度中心性算法排序結(jié)果的相關(guān)性較弱, 只達到中等程度。基于此可以得出, 如果加權(quán)PageRank 算法和加權(quán)LeaderRank算法有效, 那么InteractivityRank 算法也是有效的。在識別高影響力節(jié)點方面, 已有相關(guān)研究表明(加權(quán)PageRank 算法和加權(quán)LeaderRank 算法文獻)加權(quán)PageRank 算法和加權(quán)LeaderRank 算法具有較高的效率。
為了進一步比較InteractivityRank 算法、加權(quán)PageRank 算法和加權(quán)LeaderRank 算法的優(yōu)劣, 運行這3 個算法, 分別選?。?個算法中排序值最大的前n(本文n =60)個節(jié)點進行比較, 去除同時存在的節(jié)點, 將剩余的節(jié)點作為種子節(jié)點, 基于交互作用最大化的信息傳播模型, 獲得各種子節(jié)點的傳播規(guī)模, 并依據(jù)其平均值來衡量各算法優(yōu)劣。顯然,由排序算法挖掘到的種子節(jié)點的平均傳播規(guī)模越大, 該種子節(jié)點的實際影響力就越大。針對LMN、TMN、CMN 和FMN 4 種網(wǎng)絡(luò), 由InteractivityRank算法、加權(quán)LeaderRank 算法和加權(quán)PageRank 算法分別獲得10 個節(jié)點, 且均不存在對方排序靠前的60 個節(jié)點中, 在進行兩兩比較時, 分別以這10 個節(jié)點為信息傳播的種子節(jié)點, 使用本文提出的基于交互作用最大化的信息傳播模型重復(fù)模擬信息傳播過程20 次, 獲得離散時間點t(t = 0,1,2,…,n)時每次各種子節(jié)點的傳播規(guī)模, 取平均值作為評價算法優(yōu)劣的標準。在n =60 的情況下, 各算法的比較結(jié)果如圖5 所示(圖中橫坐標種子個數(shù)為不存在于對方排序靠前的60 個節(jié)點中的節(jié)點數(shù))。
從圖5 可以看出, 在4 種信息傳播網(wǎng)絡(luò)中, 與加權(quán)PageRank 算法和加權(quán)LeaderRank 算法相比,由InteractivityRank 算法所獲取的高影響力節(jié)點均表現(xiàn)出較大的傳播規(guī)模, 實現(xiàn)較好的信息傳播結(jié)果。這也說明, 針對加權(quán)PageRank 算法和加權(quán)LeaderRank 算法難以識別但實際具有較高影響力的節(jié)點, InteractivityRank 算法更易賦予較大的排序值, 進而將其作為候選節(jié)點被識別出來。
在算法時間復(fù)雜度方面, 由于InteractivityRank算法在修改節(jié)點隨機轉(zhuǎn)移概率時, 需要求解一個優(yōu)化問題, 其求解復(fù)雜度與相應(yīng)節(jié)點的入鄰居數(shù)量正相關(guān), 因此, 與加權(quán)PageRank 算法和加權(quán)Leader?Rank 算法相比, InteractivityRank 算法的時間復(fù)雜度稍高, 而高出的幅度由求解網(wǎng)絡(luò)節(jié)點所對應(yīng)優(yōu)化問題的變量個數(shù)決定。因此, 本文所提的Interac?tivityRank 節(jié)點影響力排序方法更適合網(wǎng)絡(luò)鏈接稀疏, 或者鏈接復(fù)雜而不過分追求運行時間的情況。
5結(jié)論
本文從網(wǎng)絡(luò)節(jié)點間交互作用的角度對社交網(wǎng)絡(luò)信息傳播機制和節(jié)點影響力排序問題進行深入研究, 分析了網(wǎng)絡(luò)節(jié)點間的交互模式, 挖掘并充分利用節(jié)點間的積極交互作用, 提出了一種新的信息傳播模型(基于積極交互作用最大化的信息傳播模型)。在不考慮節(jié)點間的交互作用時, 即節(jié)點間相互獨立的情況下, 新的信息傳播模型可退化為線性閾值信息傳播模型??紤]到在社交網(wǎng)絡(luò)中用戶節(jié)點間的交互作用形成的群體影響力對其鄰居節(jié)點活躍性的影響, 提出了一種新的識別高影響力節(jié)點的隨機游走方法(InteractivityRank 節(jié)點影響力排序算法)。首先, 基于網(wǎng)絡(luò)節(jié)點的交互作用, 分析了網(wǎng)絡(luò)信息傳播模式, 通過新的信息傳播模型探討了積極交互作用在網(wǎng)絡(luò)信息傳播過程中的作用。結(jié)果表明, 節(jié)點間的積極交互作用對其鄰居的群體影響效應(yīng)以及信息傳播規(guī)模均有較大影響, 提高用戶節(jié)點間的積極交互在信息傳播中的作用可以使信息傳播范圍更廣。根據(jù)以上的分析結(jié)果, 在通過發(fā)布免疫信息抑制網(wǎng)絡(luò)虛假信息時, 即使免疫信息本身的吸引力較低, 但是提高用戶節(jié)點之間的積極交互能力同樣可以使信息的傳播范圍更廣。InteractivityRank算法正是以上述結(jié)論為切入點, 在充分考慮用戶節(jié)點間的積極交互作用并加以利用的基礎(chǔ)上所提出的。研究結(jié)果表明, InteractivityRank 算法與原有的加權(quán)PageRank 算法和加權(quán)LeaderRank 算法在排序上具有較高的相似性, 但是InteractivityRank 算法所識別到的高影響力節(jié)點可以促進網(wǎng)絡(luò)信息的傳播規(guī)模。