陳葉斐,張學軍,黃衛東
(南京郵電大學,江蘇 南京 210023)
基于干擾相似度的多話題演化模型
陳葉斐,張學軍,黃衛東
(南京郵電大學,江蘇 南京 210023)
當前演化模型研究中,主要是單一話題在網絡中的傳播,較少考慮多話題之間的相互影響因素。在SIR模型的基礎上提出了基于干擾相似度的多話題演化模型,該模型中的干擾是通過話題相似度對傳播概率的影響來表征的。仿真結果表明,在臨界值以內,正負兩種趨向的話題相似度分別對話題演化的進程起到加強或阻礙作用,作用程度隨著被干擾節點的度而變化,分別表現為正向相似度下的演化一致性和負向相似度下的演化分離性。超過臨界值時,加強或阻礙作用均趨于飽和。
話題演化;多話題;SIR模型;干擾相似度
近年來,以互聯網為代表的信息技術發展迅猛,互聯網在全球范圍內得到迅速普及。網絡的發展與普及造成信息的激增,網絡個體可以更加便捷地獲取信息,并通過網絡進行溝通交流。不同于報刊和廣播等傳統媒體,互聯網表現出開放性、匿名性、交互性和跨時空性等特點,正逐漸取代傳統媒體成為民眾發表言論的主要渠道。
社會事件通過網絡媒體的報道形成各類話題,網絡用戶通過參與話題的討論和轉發,與網絡中的其他個體交換觀點,影響各類話題的演化趨勢。事件、話題和觀點在網絡中產生碰撞,一些討論話題經過時間的發展和網絡用戶的廣泛討論、擴散,逐漸形成網絡輿論。因此,話題的存在是輿論形成的前提條件,話題的演化趨勢在一定程度上能夠反映未來的輿論動向。
近年來,研究人員針對話題演化或輿論傳播構建了多種模型,并提出不同的分析方法。基于LDA(latent dirichlet allocation)的話題演化模型和基于復雜網絡的輿論(謠言)模型是常用的兩種演化模型,盡管研究對象不盡相同,但考慮到話題、輿論或謠言在網絡演化中的共性,關于輿論或謠言的理論模型也可以被借鑒到話題演化的相關研究中。
LDA模型是最早由Blei D M[1]提出的話題模型,在話題演化領域得到了廣泛的研究。LDA是包含文檔、話題、關鍵詞的 3層貝葉斯概率模型,認為一篇文檔中的每個詞以一定概率選擇了某個話題,該話題又以一定概率選擇某個關鍵詞。LDA模型對文本中的多個話題情況進行了有效分析,但沒有考慮文本信息的時間屬性。在LDA模型的基礎上,研究人員引入時間信息進行擴展,單斌等[2]總結了基于LDA的擴展模型,根據時間信息的引入方式將擴展模型分為 3類:時間信息結合型、先時間離散型和后時間離散型。
復雜網絡結構模型主要有 3類[3]:隨機網絡模型、小世界模型和無標度網絡模型。基于復雜網絡的輿論(謠言)演化研究多基于傳染病模型,主要有SI(susceptible-infective)模型、SIS(susceptible-infective-susceptible)模型、SIR( susceptible-infective-removal) 模 型 、 SIRS(susceptible-infective-removal-susceptible)模型、SEIR(susceptible-exposed-infective-removal)模型和 SEIRS(susceptible-exposed-infective-removal -susceptible)模型[4-7],其中以SIR模型的應用較為廣泛。目前的一種思路是基于SIR模型的節點狀態劃分,在不同的網絡結構上改進SIR模型。Zanette D H[8]采用SIR模型探究在小世界網絡中的輿論傳播情況,發現輿論只能傳遞到小于 80%的人群。Moreno Y等[9]引入平均場方程,先后在均勻網絡和非均勻網絡上研究了輿論傳播的特點。Zhou J等[10]基于SIR模型,改進了描述節點狀態密度變化的演化方程,構建了一般網絡輿論傳播模型,得到了輿論在隨機網絡上最容易傳播的結論。另一種思路是增加網絡中的節點狀態劃分,基于SIRS、SEIR、SEIRS等模型進行演化研究。張偉[11]在傳統的SEIR模型的基礎上,改進了演化方程和演化規則,發現改進后的模型能更好地反映輿論的演化過程。
在上述演化模型研究中,重點關注的是單一話題在網絡中的傳播,較少考慮多話題之間的相互影響因素[12-15]。本文運用復雜系統的相關理論研究網絡多話題演化的特征,通過網絡節點、節點狀態、節點間關聯關系 3個基本要素,基于 SIR模型,考慮在多個話題的傳播過程中,某一話題的演化會受到其他話題的干擾。本文通過定義不同話題間的干擾相似度,構建了基于干擾相似度的多話題演化模型,并從干擾相似度及被干擾節點的度兩方面對話題演化的影響進行了仿真研究。
SIR模型是最經典的傳染病模型,其描述疾病傳播的動力學微分方程組為:

其中,α表示S態個體被感染為I態個體的概率,β表示I態個體獲得免疫轉變為S態個體的概率。
疾病的傳播強調個體的自我免疫,個體在傳播疾病的過程中獲得某種免疫,不再參與傳播,這在微分方程組中表現為感染者密度的減少和免疫者密度的增加是由于感染者以一定概率免疫(βi( t))。而在輿論或謠言的傳播中,傳播節點通過與免疫者或傳播者的接觸,受免疫者的影響或免疫者和傳播者的共同影響,以一定概率不再傳播輿論或謠言,可以認為這是一種“接觸免疫”。表現在微分方程中是將βi( t)用βi( t) r( t)或替代。傳播對象的性質決定了演化特性。與疾病的傳播不同,話題的演化以網絡為媒介,以網絡節點為中轉,話題在個體的交流中逐漸失去傳播價值,即話題的免疫性與免疫概率、個體狀態以及個體狀態對應的比例都是相關的,所以話題停止傳播可以視為接觸免疫而不是個體的自我免疫。
當SIR模型用于話題演化的研究中時,S、I、R這3種節點狀態分別被重新定義為:S態指個體了解某個話題但沒有傳播,處于觀望狀態;I態指個體通過對該話題的討論交流,進行話題傳播,處于傳播狀態;R態指個體對該話題失去興趣或被新話題吸引,不再傳播該話題或轉向新話題,處于免疫狀態。
在話題演化的過程中,觀望者以一定概率轉變為傳播者,傳播者在遇到相同的傳播者后失去傳播興趣,或被免疫者說服轉變到免疫態。對應的演化方程為:

其中, s( t)、 i( t)、r(t)分別表示在話題演化的過程中,t時刻網絡中觀望者S、傳播者I、免疫者R的節點密度; PI、 PR分別代表觀望態轉到傳播態的傳播概率、傳播態轉到免疫態的免疫概率,這兩個概率都是時間的函數。式(1)滿足守恒條件,即假設在話題演化的過程中,參與話題傳播的總節點數不變。
在多個話題的傳播過程中,某個話題的演化會受到其他話題的干擾。如果一個節點收到了某個話題的信息,并發現周圍節點都在傳播相似且趨向一致的話題,那么就會增強該節點傳播該話題的動力;相反,如果周圍節點傳播的話題雖然相似,但趨向完全相反,該節點就會對目前接收的話題產生質疑,就不太愿意去傳播這個話題。因此,話題間的相似度會在一定程度上影響話題傳播的概率。本文的多話題干擾模型如圖1所示,以2個S態個體和3個I態個體為例。多個話題通過S1個體與I2個體間的虛線連邊涌入網絡中,干擾 S1節點對當前話題的傳播。由于網絡節點在傳播某個話題時,通常會考慮周邊的傳播情況,因此這種干擾在一定程度上決定了 S1節點能否轉到傳播態,或者以多大的概率轉變到傳播態,即影響了話題演化過程中的傳播概率。由于干擾話題通過 S節點與其他節點的連邊涌入,那么該 S節點的度越大,越容易受到外界的干擾,因此傳播概率也與節點的度相關。
定義話題演化的傳播概率為:

其中,ave表示所有干擾話題相似度的代數平均值,k為被干擾S節點的度。

圖1 多話題干擾模型
若在圖1中干擾的是I節點,那么免疫概率 PR也可以用式(3)的類似形式描述。實際仿真時只考慮對S節點的干擾,將免疫概率視為常數。
為了表征不同相似度的話題干擾下的當前網絡傳播話題的演化效果,定義下述參數作為衡量指標。
? 話題的生命周期T:指觀望態、傳播態和免疫態的節點密度 s( t)、 i( t)、 r( t)均達到穩定所需時間。
? 有效傳播率:用免疫者密度的穩態值 r( T)來表征。
? 話題的瞬時規模:用傳播者的瞬時密度 i( t)來表示。
? 系統的穩定性:指話題演化達到穩定時的免疫者密度與觀望者密度之比
? 傳播峰值:指話題的瞬時規模取得的最大值i( t)max。
? 峰值時刻:指話題的瞬時規模取得最大值對應的時間Tp。
將上述基于干擾相似度的多話題演化模型用于小世界網絡,網絡模型采用WS小世界模型,該模型在規則網絡的基礎上通過斷邊重連生成。小世界網絡的度分布差異較小,可近似認為是節點度分布均勻的網絡。
生成節點數為20、平均度為8的小世界網絡。假設在話題演化的初期,網絡中只有 1個節點處于傳播態,其余均為觀望者,不存在免疫者,即初值為初始傳播概率PI(0)=0.3,免疫概率固定為PI=0.1。
4.1 干擾相似度對話題演化的影響
任選一節點作為被干擾的S節點,度大小的平均值為8,若干擾話題的平均相似度ave分別為0.2、-0.2,得到對應的話題演化曲線,并與固定概率下的話題演化進行比較,如圖2所示。
由圖2可以看出,與固定概率下的話題演化曲線相比,正向相似(ave=0.2)的干擾話題加快了當前話題的演化進程,而負向相似(ave=-0.2)的干擾話題對網絡當前話題的演化起阻礙作用。根據圖2中的參數進行定量計算,得到上述定義的各衡量指標值,見表1。
從表1可知,正向相似的話題干擾下,當前話題的傳播快、范圍廣、效率高、系統穩定好。因此,這種干擾適合于網絡話題的短期輿論造勢,話題能夠快速上升為廣泛的輿論。相比之下,負向相似的話題干擾不利于話題的演化,但如果負向相似度足夠大,就能夠阻止當前話題的傳播,這為網絡辟謠提供了參考。改變相似度大小,其他仿真條件不變,得到話題瞬時規模曲線如圖3所示。
圖3表明,上述的加強或阻礙作用均對應不同的相似度臨界值。由圖3(a)可得正向相似度臨界值為0.3左右,由圖3(b)可得負向相似度臨界值為-0.6左右。一旦超過臨界值,相似話題對當前話題傳播的加速或阻礙作用均趨于飽和。值得注意的是,當負向相似度超過臨界值后,阻礙作用過大,僅有的1個傳播者也逐漸被說服成為免疫者,即當前話題無法繼續傳播。

圖2 不同條件下的話題演化曲線比較

表1 不同條件下的衡量指標

圖3 話題瞬時規模隨相似度的變化
4.2 被干擾節點的度對話題演化的影響
固定相似度,改變被干擾節點的度。相似度的選取考慮到第4.1節中得到的臨界值,保證引入話題的相似度大小能夠對話題演化起到明顯的加強或阻礙作用。初始個體密度、初始傳播概率和免疫概率不變,得到話題瞬時規模隨被干擾節點的度的變化曲線如圖4和圖5所示。
在圖4中,當被干擾S節點的度變化時,話題瞬時規模曲線的重合度很高,在同一相似度下,話題的傳播峰值相差不大,且幾乎在同一時刻取得峰值。這說明在不同正向相似的話題干擾下,被干擾節點的度對話題瞬時規模的影響并不明顯,話題演化表現出一致性,被干擾節點的度越大,話題瞬時規模略有增加。話題的平均值越接近臨界值0.3,曲線的重合度越高,此時被干擾節點的度幾乎不起作用。

圖4 話題瞬時規模隨被干擾節點的度的變化(正向)
上述實驗結果表明,在小世界網絡這類節點度近似均勻的網絡中,如果采用正向相似的話題去干擾網絡當前話題的演化進程,可以忽略節點的度的差異性,只考慮話題的相似度影響,最終的話題演化效果相差不大。

圖5 話題瞬時規模隨被干擾節點的度的變化(負向)
將圖5與圖4相比可以發現,當干擾話題的平均相似度為負時,被干擾節點的度對話題演化的影響較為顯著,表現出演化分離性。在圖5(a)中,當ave=-0.2時,話題瞬時規模曲線的總體趨勢還是相同的,隨著被干擾節點的度增大,傳播峰值減小,峰值時間延長,話題演化的分離程度較小。在圖5(b)中,當ave=-0.4時,話題演化的程度變大,當被干擾節點的度k<10時,話題演化的趨勢仍維持在受到阻礙、過程減緩的情況,與圖5(a)中的趨勢相似; k=10時,話題已經不再傳播,僅有的一個傳播者轉變成免疫者。在圖5(c)中,僅在k=6時保持圖5(a)中的傳播趨勢,被干擾節點的度大于6時,話題就停止了傳播。
出現演化分離性的一個可能原因在于:當干擾話題的相似度為負時,節點處于停止傳播前的過渡狀態,傳播某個話題的動力逐漸減小。當話題的平均負向干擾相似度較小,即使選擇與外界連邊較多、容易受干擾影響的節點,只要不超過臨界值,話題演化的整體趨勢不會受太大影響;相反,如果話題的平均負向干擾相似度較大,即使選擇的節點只比之前選擇的多一條連邊,來自這一條連邊的話題干擾也可能超過臨界值,迫使話題停止傳播。因此,在采用負向相似的話題去干擾當前話題的演化進程時,被干擾節點的度的影響不可忽略。
在本文的模型中,考慮了多話題間的影響因素,探究了外來話題的相似度對話題演化過程的干擾,為多話題模型的構建提供了一種研究方法。本文建模時只考慮了外來話題的相似度對當前話題的傳播概率的影響,對于免疫概率沒有作研究,實際仿真時將它視為常數。實際上,如果在話題演化初期,外來話題涌入干擾的是 I態節點,那么免疫概率也可以參考傳播概率的定義計算式作相應修改,可以考慮在免疫概率受話題干擾相似度下進行話題演化研究,或者在傳播概率和免疫概率二者均受到話題干擾相似度下,研究話題演化過程。本文針對正向相似的話題干擾的實驗結果,可應用于實現話題快速而廣泛的傳播,用與話題正向相似的干擾話題去影響其演化進程,營造積極的輿論環境;反之,如果話題的負向相似度足夠大,可以阻止當前話題的傳播,可用于對網絡中謠言或錯誤話題信息的控制,進而阻止謠言的進一步擴散。
[1] BLEI D M, LAFFERTY J D. Dynamic topic model[C]//The 23rd International Conference on Machine Learning, September 10-13, 2006, Pittsburgh, PA, USA. [S.l.:s.n.], 2006: 113-120.
[2] 單斌, 李芳. 基于LDA話題演化研究方法綜述[J]. 中文信息學報, 2010, 24(6): 43-50. SHAN B, LI F. A survey of topic evolution based on LDA[J]. Journal of Chinese Information Processing, 2010, 24(6): 43-50.
[3] 劉衍珩, 李飛鵬, 孫鑫, 等. 基于信息傳播的社交網絡拓撲模型[J]. 通信學報, 2013, 34(4): 1-9. LIU Y H, LI F P, SUN X, et al. Social network model based on the transmission of information [J]. Journal on Communications, 2013, 34(4): 1-9.
[4] MENG X Z, ZHAO S N, FENG T, et al. Dynamics of a novel nonlinear stochastic SIS epidemic model with double epidemic hypothesis[J]. Journal of Mathematical Analysis & Applications, 2016, 433(1): 227-242.
[5] 朱憲瑩, 劉箴, 金煒, 等. 基于特征融合的層次結構微博情感分類[J]. 電信科學, 2016, 32(7):106-114. ZHU X Y, LIU Z, JIN W, et al. Hierarchical micro-blog sentiment classification based on feature fusion[J]. Telecommunications Science, 2016, 32(7): 106-114.
[6] 鐘杰, 陳興蜀, 王文賢, 等. 面向微博話題傳播的重要節點測量研究[J]. 計算機應用研究, 2016, 33(8): 2290-2293. ZHONG J, CHEN X S, WANG W X, et al. Measurement study of topology structure and crucial nodes for spread of weibo topics[J]. Application Research of Computers, 2016, 33(8): 2290-2293.
[7] 琚春華, 鮑福光, 戴俊彥.一種融入公眾情感投入分析的微博話題發現與細分方法[J]. 電信科學, 2016, 32(7): 97-105. JU C H, BAO F G, DAI J Y. Discovery and segmentation method in micro-log topics based on public emotional engagement analysis[J]. Telecommunications Science, 2016, 32(7): 97-105.
[8] ZANETTE D H. Dynamics of rumor propagation on small-world networks[J]. Physics, 2001, 65(1): 110-126.
[9] MORENO Y, NEKOVEE M, VESPIGNANI A. Efficiency and reliability of epidemic data dissemination in complex networks[J]. Physical Review E Statistical Nonlinear & Soft Matter Physics, 2004, 69(50): 1-4.
[10] ZHOU J, LIU Z H, LI B W. Influence of network structure on rumor propagation[J]. Physics Letters A, 2007, 368(6): 458-463.
[11] 張偉. 基于復雜社會網絡的網絡輿情演化模型研究[D]. 哈爾濱: 哈爾濱工業大學, 2014. ZHANG W. Models of the network public opinion dynamics oncomplex social networks[D]. Harbin: Harbin Institute of Technology, 2014.
[12] 孫立遠, 管曉宏. 在線社會網絡多話題傳播競爭特性的測量[J].清華大學學報(自然科學版), 2015, 55(11): 1157-1162. SUN L Y, GUAN X H. Measurements of the competitive characteristics of multi-topic propagation in online social networks[J]. Journal Tsinghua University(Sci &Technol) , 2015, 55(11): 1157-1162.
[13] 黃衛東, 林萍, 董怡, 等. 基于話題特征詞的網絡輿情參與者情感演化分析[J]. 情報雜志, 2015(11): 117-122, 144. HUANG W D, LIN P, DONG Y, et al. Analysis on the feature words based evolution of netizens sentiments in network public topics[J]. Journal of Intelligence, 2015(11): 117-122, 144.
[14] WANG H, DENG L, XIE F, et al. A new rumor propagation model on SNS structure[C]//IEEE International Conference on Granular Computing, Aug 11-13, 2012, Hangzhou, China. New Jersey: IEEE Press, 2012: 499-503.
[15] 王輝, 韓江洪, 鄧林, 等. 基于移動社交網絡的謠言傳播動力學研究[J]. 物理學報, 2013, 62(11): 98-109.WANG H, HAN J H, DENG L, et al. Dynamics of rumor spreading in mobile social networks[J]. Acta Phys Sin, 2013, 62(11): 98-109.
Multiple topics evolution model based on similarity of interference
CHEN Yefei, ZHANG Xuejun, HUANG Weidong
Nanjing University of Posts and Telecommunications, Nanjing 210023, China
The current researches of evolution model mainly focus on the spread of the individual topics, rarely considering the influential factors between multiple topics. A new topic evolution model was proposed by considering the interference among topics based on SIR model, which characterized by the influence of the similarity of the topic on the probability of propagation. The experimental results show that within the critical value, the similarity degree of positive and negative trends enhance or hinder the process of topic evolution, and the degree of action varies with the degree of interference nodes, which is expressed as evolutionary consistency under positive similarity and the evolutionary separability under negative similarity. When the critical value is exceeded, the effect of strengthening or hindering tends to saturation.
topic evolution, multiple topics, susceptible-infective-removal model, similarity of interference
s: The National Natural Science Foundation of China(No. 71671093), Philosophy and Social Science Foundation of Education Department of Jiangsu Province(No. 2015SJB018), Humanities and Social Science Foundation of NUPT(No.NYS214028)
TP393
:A
10.11959/j.issn.1000-0801.2017204

陳葉斐(1973-),女,南京郵電大學助理研究員,主要研究方向為網絡輿情預警。

張學軍(1969-),男,博士,南京郵電大學教授,主要研究方向為智能信息處理、復雜網絡與系統和認知網絡頻譜感知等。

黃衛東(1968-),男,博士,南京郵電大學教授,主要研究方向為應急管理、數字化預案和網絡輿情分析。
2017-04-01;
:2017-06-28
國家自然科學基金資助項目(No.71671093);江蘇省高校哲學社會科學基金資助項目(No.2015SJB018);南京郵電大學人文社會科學基金資助項目(No.NYS214028)