馬永軍 柴夢瑤
1(天津科技大學(xué)人工智能學(xué)院 天津 300457)
2(天津科技大學(xué)食品安全管理與戰(zhàn)略研究中心 天津 300222)
Social network
中國互聯(lián)網(wǎng)信息中心于2019年8月30日發(fā)布的第44次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》顯示,截止到2019年6月,中國網(wǎng)民規(guī)模達到了8.54億,普及率也已上升至61.2%,相較2018年底提升了1.6百分點,全年新增加的網(wǎng)民達到2 598萬人次[1]。伴隨著互聯(lián)網(wǎng)的開放性、虛擬性及隨意性等特征,網(wǎng)民越來越愿意在各類社交網(wǎng)絡(luò)上發(fā)表言論,展現(xiàn)個人觀點。這些新興社交網(wǎng)絡(luò)已逐步成為輿情發(fā)酵和演化的主要平臺,并逐漸影響著大眾輿情的走勢。例如,2018年在微博上熱議的長春長生假疫苗事件,不僅引起人們的恐慌也嚴(yán)重影響了正常的社會秩序。因此,對社交網(wǎng)絡(luò)的輿情演化進行必要的研究顯得越來越重要,通過相應(yīng)的研究可以為輿情的管理和控制提供一些有力的指導(dǎo)。
目前網(wǎng)絡(luò)輿情演化的研究熱點之一是對觀點動力學(xué)模型的研究,其中國內(nèi)外學(xué)者提出的觀點動力學(xué)模型大致可分為離散和連續(xù)兩類。前者在模擬仿真用戶的觀點時使用的是有限的離散數(shù)值,其中比較有具有代表性的是文獻[2]模型、Voter模型和MR(Majority Rule)模型等;后者考慮到個體的觀點存在一個漸進的演變過程,使用連續(xù)值表示個體觀點,影響力較大的有文獻[3]模型和HK模型[4]。兩者都建立在有限信任的基礎(chǔ)上,考慮到現(xiàn)實情況中一種常見的心理現(xiàn)象“選擇性接觸”,即認(rèn)為兩個用戶進行觀點交互的前提是他們兩者之間的觀點差值的絕對值在一定交互閾值內(nèi),反映了“道不同不相為謀”的社會現(xiàn)象。與文獻[3]模型相比之下,HK模型更多地考慮了周圍用戶對單個用戶的影響而不是單單地只受到一個用戶的影響就改變其觀點值,進而促進整個群體觀點的演化,因而HK模型能更好地模擬開放性較強的社交網(wǎng)絡(luò)中輿情的演化過程。自HK模型被提出之后,其引起了輿論界學(xué)者的關(guān)注并對其進行改進和研究。李青等[5]基于BA網(wǎng)絡(luò)綜合考慮了用戶本身及用戶對他人的信任關(guān)系兩個因素進而對HK模型進行了相應(yīng)的擴展,分析了模型中信任閾值對觀點演化的影響,并考慮了網(wǎng)絡(luò)中節(jié)點度這一影響因素,發(fā)現(xiàn)度最大節(jié)點受其他節(jié)點影響較小,度最小節(jié)點受其他節(jié)點影響較大。陳桂茸等[6]基于個體間的影響力對有限信任集合進行改進,假設(shè)用戶在更新觀點時僅考慮參考集合中與自身觀點距離小于某個閾值的個體觀點,同時引入自我堅持度。宋艷雙等[7]研究了不同復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)對觀點收斂速度的影響,同時提出聯(lián)系數(shù)量和人際相似性來度量不同個體間相互影響。張亞楠等[8]通過擴展用戶的交互集合來改進HK模型,并且引入了個體間親密度、人際相似性和交互強度等概念,同時在聚類系數(shù)為0.165 9的社交網(wǎng)絡(luò)運行了其改進的輿情演化模型。何建佳等[9]考慮個體之間的親和度,對個體觀點之間的影響權(quán)重進行重新定義,分析了觀點堅持度、個體親和度和意見領(lǐng)袖支持者比例三個因素對網(wǎng)絡(luò)輿論演化的影響。
上述對HK模型的研究大多集中在改進交互集合、重新定義個體間影響權(quán)重和基于不同復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)進行建模分析。在重新定義個體間影響權(quán)重的研究中,認(rèn)為與某一個體有關(guān)聯(lián)的其他節(jié)點對該個體的影響權(quán)重之和為1,并采用隨機賦值的方式。本文在傳統(tǒng)HK模型的基礎(chǔ)上,提出一種基于個體相對權(quán)威性的輿情演化模型,建立個體間的相對權(quán)威函數(shù)來對HK模型進行改進,同時構(gòu)建網(wǎng)絡(luò)平均聚類系數(shù)和平均路徑長度以更加貼近真實社交網(wǎng)絡(luò)性質(zhì)的網(wǎng)絡(luò)結(jié)構(gòu)作為輿情演化的載體,并分析了基于用戶相對權(quán)威性的改進后的HK模型在社交網(wǎng)絡(luò)中演化過程的特性。
復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)常被作為研究輿論動力學(xué)模型的載體,而不同網(wǎng)絡(luò)結(jié)構(gòu)對輿論演化速度有重要影響[7]。因此,對輿論演化進行模擬分析的基礎(chǔ)是用算法構(gòu)建一個更加接近現(xiàn)實網(wǎng)絡(luò)性質(zhì)的網(wǎng)絡(luò)拓撲結(jié)構(gòu)。文獻[10-11]表明,新浪微博、Twitter和Facebook等大型社交網(wǎng)絡(luò)普遍具有無標(biāo)度網(wǎng)絡(luò)特性和小世界網(wǎng)絡(luò)特性,即網(wǎng)絡(luò)中節(jié)點度“富者更富”、較高聚類系數(shù)和較小平均路徑長度。以新浪微博為例,杜洪濤等[11]以從新浪微博社區(qū)獲取的數(shù)據(jù)集合為樣本,研究了微博社區(qū)網(wǎng)絡(luò)的統(tǒng)計特征,發(fā)現(xiàn)所有節(jié)點彼此間的距離大部分都集中在[2,4]之間,且網(wǎng)絡(luò)的聚類系數(shù)為0.601。由斯坦福大學(xué)公開的數(shù)據(jù)集可以得到,Twitter網(wǎng)絡(luò)的平均聚類系數(shù)為0.565 3,平均路徑長度為4.5;Facebook網(wǎng)絡(luò)的平均聚類系數(shù)為0.605 5,平均路徑長度為4.7。
為滿足以上特性,本文基于Barabasi等[13]提出的BA無標(biāo)度網(wǎng)絡(luò)模型和Holme等[12]提出的三角連接策略構(gòu)建聚類系數(shù)可調(diào)的網(wǎng)絡(luò)拓撲結(jié)構(gòu),考慮每個用戶新加入網(wǎng)絡(luò)時關(guān)注的個體數(shù)不同,對三角連接過程進行改進,提出一種異質(zhì)三角連接算法。構(gòu)造算法步驟如下:
(1) 初始化:初始網(wǎng)絡(luò)包括1個節(jié)點。
(2) 增長策略:每隔一個步長根據(jù)優(yōu)先連接策略向網(wǎng)絡(luò)中添加一個攜帶m條邊的新節(jié)點。
(3) 優(yōu)先連接策略:新節(jié)點在加入已有的網(wǎng)絡(luò)結(jié)構(gòu)時選擇與網(wǎng)絡(luò)中已存在節(jié)點i相連接的概率為Πi,它與節(jié)點i的度k(i)有關(guān),滿足的關(guān)系式為:
(1)
(4) 異質(zhì)三角連接策略:新節(jié)點根據(jù)優(yōu)先連接策略與網(wǎng)絡(luò)中已存在節(jié)點i相連之后,以概率Pt與節(jié)點i的鄰居節(jié)點相連接,且連接的概率滿足優(yōu)先連接策略;當(dāng)在1-Pt概率內(nèi)或者沒有可連接的鄰居節(jié)點時,不進行連接,并循環(huán)m-1次。
相比于原來的算法在每加入一個新節(jié)點時,一定會加入m條邊,改進后的網(wǎng)絡(luò)模型受三角連接率Pt影響的同時也受到已有網(wǎng)絡(luò)結(jié)構(gòu)的影響,每加入一個新節(jié)點時加入的邊數(shù)都不相同,能夠反映個體的異質(zhì)性,并且最多加入m條邊。
HK模型是基于有限信任域的文獻[2]模型進行改進的一種經(jīng)典連續(xù)觀點交互(連續(xù)意見動力學(xué))模型,該模型假設(shè)用戶在進行觀點更新時,只考慮部分用戶對自身的影響,這部分用戶的觀點與自身觀點值的差的絕對值在一定范圍內(nèi),這個差值即為信任閾值,一般用ε表示。
在經(jīng)典HK模型中,考慮群體是由N個個體組成的,用離散時間T={0,1,2,…}模擬觀點交互的重復(fù)過程。個體i在t時刻都有一個觀點屬性值Oi(i=1,2,…,N),取值范圍在[0,1]之間。每個個體在t+1時刻的觀點為其有限信任集合中所有個體觀點的平均值,更新規(guī)則為:
(2)

有研究表明,在輿論演化的過程中,大多數(shù)人針對某個話題的最終態(tài)度傾向會更容易受到周圍人際關(guān)系的影響[14]。為定量地表示這種影響值,在經(jīng)典HK模型的基礎(chǔ)上,考慮個體的相對權(quán)威性,假設(shè)網(wǎng)絡(luò)中節(jié)點的鄰居越多,則其在網(wǎng)絡(luò)中的相對權(quán)威性越大,對其鄰居的相對影響力也越大。根據(jù)節(jié)點在網(wǎng)絡(luò)拓撲結(jié)構(gòu)中的位置,即節(jié)點的相對權(quán)威性,定義四類觀點交互路徑,以圖1所示案例來模擬網(wǎng)絡(luò)拓撲結(jié)構(gòu):權(quán)威節(jié)點到普通節(jié)點,如11→14(P1類);普通節(jié)點到權(quán)威節(jié)點,如14→11(P2類);權(quán)威節(jié)點到權(quán)威節(jié)點,如4?11(P3類);普通節(jié)點到普通節(jié)點,如7?6(P4類)。

圖1 網(wǎng)絡(luò)拓撲示例
1) 相對權(quán)威函數(shù)A(i,j)。如上所述,在觀點交互過程中,不同權(quán)威性的鄰居節(jié)點對節(jié)點更新觀點的影響力各不相同。網(wǎng)絡(luò)中每個節(jié)點由一個唯一的數(shù)字進行編號,首先定義網(wǎng)絡(luò)節(jié)點i對節(jié)點j的相對影響力為:
(3)

其次,結(jié)合式(2)定義節(jié)點i對節(jié)點j的相對權(quán)威函數(shù)A(i,j):
(4)
根據(jù)節(jié)點i和節(jié)點j的相對權(quán)威性,A(i,j)一般不等于A(j,i)。顯然,相對權(quán)威函數(shù)A(i,j)的作用是在進行觀點交互的過程中,將連接i和j邊的權(quán)重根據(jù)雙方的相對地位重新做了調(diào)整。


圖2 不同路徑的相對權(quán)威函數(shù)
步驟1對N個個體的初始觀點在區(qū)間[0,1]內(nèi)進行隨機賦值。
步驟2根據(jù)有限信任算法在節(jié)點i的鄰居中選擇與i的觀點差距處于有信任閾值ε內(nèi)的個體集合,即:
IΓ(i)(i,O(t))={1≤j≤k(i)||Oi(t)-Oj(t)|≤ε}
步驟3根據(jù)式(2)和式(3)計算有限信任集合IΓ(i)(i,O(t))中每個個體對節(jié)點i的相對權(quán)威函數(shù)A(j,i)。
步驟4計算節(jié)點i下一時刻的觀點值,將A(j,i)作為節(jié)點i更新觀點時節(jié)點j相對于節(jié)點i的權(quán)重,則節(jié)點i的新觀點值為:
(5)
步驟5在規(guī)定時間內(nèi)重復(fù)迭代步驟2-步驟4。
本文模型采用Netlogo(版本號6.0.4)實現(xiàn),構(gòu)建社交網(wǎng)絡(luò)并對改進后的HK模型進行編程仿真。
對異質(zhì)三角鏈接算法進行了相應(yīng)的仿真實驗。通過多組實驗對比分析可得,本文算法構(gòu)建的網(wǎng)絡(luò)拓撲結(jié)構(gòu)的平均聚類系數(shù)和平均路徑長度的變化趨勢不受網(wǎng)絡(luò)節(jié)點數(shù)的影響,因此在接下來的實驗中,選取網(wǎng)絡(luò)節(jié)點數(shù)取500時的情況進行分析。根據(jù)BA網(wǎng)絡(luò)中“增長”和“優(yōu)先連接”算法生成10個節(jié)點作為初始網(wǎng)絡(luò),根據(jù)異質(zhì)三角連接算法生成網(wǎng)絡(luò)總結(jié)點數(shù)N=500的網(wǎng)絡(luò)拓撲結(jié)構(gòu),具體步驟如下:
步驟1網(wǎng)絡(luò)中初始生成一個節(jié)點。
步驟2根據(jù)“優(yōu)先連接策略”新加入一個節(jié)點,并循環(huán)9次,即在進行異質(zhì)三角連接前網(wǎng)絡(luò)中存在10個節(jié)點。
步驟3根據(jù)“增長策略”和“三角異質(zhì)連接策略”加入490個節(jié)點,使得生成具有500個節(jié)點的網(wǎng)絡(luò)拓撲結(jié)構(gòu)。
當(dāng)N=500、m=3時,對比異質(zhì)三角連接算法NTF和Holme等[12]提出的三角連接策略TF中平均聚類系數(shù)隨著Pt的變化情況,如圖3所示。在相同的條件下NTF中平均聚類系數(shù)明顯提高,能以更快速度接近實際情況。

圖3 TF和NTF中聚類系數(shù)隨三角連接率Pt的變化情況
通過調(diào)節(jié)三角連接率Pt和新增邊數(shù)m的大小,觀察網(wǎng)絡(luò)拓撲結(jié)構(gòu)的平均聚類系數(shù)Cluster、平均路徑長度Apath的變化情況,結(jié)果分別如圖4、圖5所示。為避免隨機性的影響,每次實驗重復(fù)50次,并將50次結(jié)果的平均值作為分析依據(jù)。

圖4 平均聚類系數(shù)隨Pt和m的變化情況

圖5 平均路徑長度隨Pt和m的變化情況
網(wǎng)絡(luò)的聚類系數(shù)反映了一個節(jié)點的鄰居節(jié)點之間也是鄰居的概率大小,在社交網(wǎng)絡(luò)中的具體體現(xiàn)為一位用戶的好友之間也是好友的概率。路徑長度反映了任意一位用戶和網(wǎng)絡(luò)中其他用戶之間取得聯(lián)系需要通過的用戶個數(shù)。如圖4所示,網(wǎng)絡(luò)的平均聚類系數(shù)在新增邊m為9時最快達到0.6,滿足實際社交網(wǎng)絡(luò)的拓撲性質(zhì);且隨著m增大,平均聚類系數(shù)達到0.6的速度也越來越快。如圖5所示,網(wǎng)絡(luò)的平均路徑長度隨著新增邊m和三角連接概率Pt增大而明顯減小,能滿足輿情演化需要的社交網(wǎng)絡(luò)結(jié)構(gòu)的性質(zhì)。根據(jù)實驗結(jié)果和以往研究,本文以下仿真實驗中選擇平均聚類系數(shù)Cluster∈[0.55,0.60],平均路徑長度Apath∈[2,5]的網(wǎng)絡(luò)結(jié)構(gòu)作為輿論演化模型的基礎(chǔ),以更好地模擬真實的社會網(wǎng)絡(luò)環(huán)境。
在進行觀點交互時,有限信任閾值越大,個體對他人觀點的接受度越強,也更愿意參考周圍個體對輿情事件的看法,則該個體從其鄰居節(jié)點中選擇的有限信任集合越大,多個個體以相同的規(guī)則在下一時刻改變觀點,可以促進網(wǎng)絡(luò)中觀點的融合。為考察新模型的有效性,在不同有限信任閾值下對新模型進行仿真實驗,分析個體觀點隨時間的變化情況。圖6所示為有限信任閾值ε分別取值0.1、0.3和0.5時的仿真結(jié)果。隨著有限信任閾值的增大,輿情演化后形成的觀點數(shù)量逐漸變少,當(dāng)有限信任閾值為0.5時,演化后的觀點基本一致,這與HK模型的研究結(jié)論相同。同時也說明相對權(quán)威函數(shù)可以有效衡量周圍人際關(guān)系對個體進行觀點更新時的影響力。

(a) ε=0.1
在社交網(wǎng)絡(luò)中具有較大節(jié)點度的用戶會以更快的信息傳播速度和更廣的信息傳播規(guī)模將其所參與的輿情事件傳遞給其他用戶并能及時獲得網(wǎng)絡(luò)中其他用戶了解的輿情信息;而節(jié)點度較小的個體獲得信息的渠道相對較少,與周圍個體進行信息交流的頻率也相對減少,甚至對于一些相對孤立的個體,他們了解輿情信息的來源更少,也很少與周圍個體進行交互。因此,具有不同節(jié)點度的個體之間交流輿情信息的頻率有很大的差別。
為了比較具有不同平均節(jié)點度的社交網(wǎng)絡(luò)對輿情演化的影響,對2.2節(jié)中提出的輿情演化模型進行仿真實驗,設(shè)定有限信任閾值ε=1,觀察在不同平均節(jié)點度的網(wǎng)絡(luò)結(jié)構(gòu)基礎(chǔ)上模型運行中輿情演化的情況,如圖7所示。

(a) 平均節(jié)點度=6.230
可以看出,當(dāng)網(wǎng)絡(luò)平均節(jié)點度為6.230時,觀點聚合的速度最慢,在相同時間內(nèi)觀點最終個數(shù)最多;網(wǎng)絡(luò)平均節(jié)點度為7.050時,個體的觀點聚合較快,觀點最終個數(shù)較少;當(dāng)網(wǎng)絡(luò)平均節(jié)點度為7.725時,觀點聚合最快,觀點基本一致。說明平均節(jié)點度的不斷增加更有利于觀點的統(tǒng)一,即在輿情演化過程中個體之間交流的渠道越多輿論更容易趨于一致。另外,觀點的聚合速度也隨著平均節(jié)點度的增減而逐步加快。因此該算法可在輿情演化時間長度的判定上提供依據(jù),即在實際中若某一輿情事件剛開始在粉絲數(shù)少的個體之間傳播,則其傳播時間會較長;若輿情事件在剛開始主要由粉絲數(shù)多的媒體進行報道,則其傳播時間較短,用戶意見更容易趨于一致。所以,在網(wǎng)絡(luò)輿情的管控中,可以讓擁有較多粉絲數(shù)的用戶,即節(jié)點度大的個體,對真實的輿情事件進行報導(dǎo),從而引導(dǎo)輿情的演化,使之以更快的速度趨于一致。
本文在有限信任HK模型的基礎(chǔ)上,用相對權(quán)威函數(shù)定量描述個體之間的影響力,提出一種基于個體相對權(quán)威性的改進HK模型,并構(gòu)建平均聚類系數(shù)、平均路徑長度更符合真實社交網(wǎng)絡(luò)性質(zhì)的網(wǎng)絡(luò)結(jié)構(gòu)作為輿情演化的載體,運用仿真軟件Netlogo進行編程和仿真,驗證改進后的HK模型的真實可行性,并分析平均節(jié)點度對輿情演化的影響。仿真結(jié)果表明,在異質(zhì)三角連接算法中,可通過調(diào)節(jié)新增邊m和三角連接概率Pt來調(diào)節(jié)平均聚類系數(shù)和平均路徑長度的大小,以更好地貼近真實社交網(wǎng)絡(luò)的性質(zhì);基于個體相對權(quán)威性改進HK算法提出的相對權(quán)威函數(shù)可以有效衡量周圍人際關(guān)系對個體的影響力;隨著有限信任閾值的增加,輿情演化后的觀點個數(shù)逐漸減少并能使網(wǎng)絡(luò)中的觀點更快地由多元化趨于一致,這與HK模型的結(jié)論一致;輿情演化的速度同時也受網(wǎng)絡(luò)平均節(jié)點度大小的影響,平均節(jié)點度越大則觀點的聚合速度越快。因此,控制社交網(wǎng)絡(luò)輿情時可以通過引導(dǎo)粉絲數(shù)多的用戶改變成正向意見,繼而去影響其他用戶,使得輿論盡快達成一致。但本文僅僅考慮到個體之間的相對權(quán)威性,未來研究將考慮個體更多的異質(zhì)性,更全面地研究影響輿情演化的各種因素。