田伯凱 岳躍振
摘 要:電子信息技術的發展與互聯網的普及,促進了信息的快速傳播。虛擬網絡輿論相對于傳統媒介而言,更廣泛地提高輿論社交普遍性、快速性、監督性的最大值。然而,在網絡輿論日益凸顯其監督的正面性的同時,一些異化現象假借正面性來行使其負面效能。鑒于在線社交網絡具備許多的復雜網絡特性,而用戶的線下社交網絡與虛擬世界社交網絡表現出高度相關性。線上行為的可記錄、易計算等特性使得對虛假網絡輿論的傳播預測成為可能。文章在總結復雜網絡結構的特征指標和傳統傳染病傳播模型的基礎上,綜述了近年來用戶的在線社交網絡和信息傳播規律的相關研究,指出了社交網絡研究面臨的挑戰,然后分析了謠言抑制算法在當前社交網絡中的可能應用模式,最后展望了該領域需要解決的關鍵問題以及可能的應用前景。
關鍵詞:復雜網絡;網絡結構;社交網絡;信息傳播;傳染病模型
DOI:10.16640/j.cnki.37-1222/t.2017.23.225
1 引言
近年來,旨在架起信息技術與社會科學之間的橋梁的社會計算研究領域開始得到廣泛的關注,特別是社交網絡(如Facebook,Twitter,新浪微博和微信等)的盛行,給人們的社會交往方式帶來了新的變革,社交網絡擁有改變人類進行交流、通信和合作方式的巨大潛力,甚至能夠影響到我們對自身和社會的認識。一方面,社交網絡逐漸滲透到人們生活的方方面面,人們借助社交網絡平臺聯絡朋友,發表觀點,討論公共話題等,社交網絡成為了現實社會的延伸。另一方面,隨著社交網絡的不斷完善以及對人們生活滲透作用的增大,當量變引起質變的時候,社交網絡也可以看作是對現實社會關系網絡的重建。這種重建的社交模式既平行于現實社會,又與現實社會緊密相連,由于在社交網絡中個體的行為和狀態更容易被記錄、獲取和分析,有利于發現網絡中各用戶之間的作用機制及信息傳播機理,因此對社交網絡的結構特性的分析研究成為了社會計算領域的重要研究內容。
但隨著越來越多的人喜歡在社交平臺上交流互動,同時也熱衷于從社交平臺中獲取信息并進行轉發評論。而這些信息中,一些未經求證的謠言泛濫成災,因此而造成的惡意事件也逐漸增多,影響和干擾著人們正常的生活秩序。謠言在社交網絡中的肆意傳播,嚴重影響到社會穩定、經濟發展,有效地控制社交網絡中信息的傳播具有重要意義。
把復雜網絡理論與謠言控制的迫切需要相結合,關鍵的技術是根據社交網絡的數據對用戶群體的關鍵節點既輿論領袖進行分析和預測,同時把節點信息廣泛應用到社會計算的其他領域,這對于網絡謠言的控制有著巨大的價值。
本文第2節介紹識別社交網絡中輿論領袖的標準與方法,并論述社交網絡分析的理論基礎;第3節分析謠言傳播模型,以及綜合分析其與傳統傳染病模型的異同;第4節從數據獲取,社交網絡建模和傳播模型幾方面綜述近幾年對社交網絡謠言抑制所做的研究;第5節對謠言抑制算法在社交網絡中的可能應用進行了討論;第6節對整篇綜述內容進行了總結,并對未來的研究和應用進行了展望。
2 輿論領袖節點的識別
獲取合適的數據并建立相應的復雜網絡模型,是實現社交網絡輿論領袖節點識別的首要前提。本節重點介紹實證數據的獲取與分析,復雜網絡的建模標準,以及通過親密度判斷輿論領袖節點的方法。
2.1 數據的獲取與處理
截止2016年6月,新浪微博的月活躍用戶量為2.82億,其數據適合用于研究社交網絡。在數據獲取的過程中,采取“滾雪球”的方法[1],將同一行業或相關行業的的人群建立用戶組。根據每個節點“關注”與“被關注”的情況,建立二值矩陣P,矩陣“行”代表關注者,“列”代表被關注者。Pij=1表示i用戶關注了j用戶,反之則為未關注。根據節點間互相關注的情況,文獻[1]將現有有向網絡分解為入度網絡,出度網絡和無向網絡。
2.2 數據分析
分析一個節點的重要性不能只考慮其參與網絡的總水平而不考慮與其相連的的鄰居節點所具有的重要性對其影響的數量。基于此考慮,引入了度中心性,緊密度中心性,K-Shell,介數中心性,特征向量中心性5個參數。這5 種指標通常均應用于衡量節點在網絡中的重要程度。但這幾種參數各有長處和不足
介數中心性與度中心性以及緊密度中心性相比能夠更準確地識別出關鍵節點,并且適用于更廣泛的網絡應用場景。K-shell方法需要對網絡中的所有節點進行一遍一遍的脫殼處理,過程慢且識別出的節點是粗粒度的,相比介數中心性準確度較低。介數中心性在識別鄰接矩陣不對稱的網絡模型時,較特征向量中心性更具有優勢。由于在社交網絡中用戶之間的關系具有有向性,所以基于介數中心性識別輿論領袖節點更為合理。
2.3 基于節點親密度的謠言抑制方法
在社交網絡中信息傳播的過程中,用戶節點通常會受到朋友節點的影響。Bakshy[2]以及Onnela [3]通過實驗證實了這種說法,并得出信息通過用戶節點間的鏈路進行傳播的結論,即熟人傳播,因此社交網絡展現了“口碑效應”的影響。具體分析時在社交網絡中引入了親密度的概念,并衡量不相鄰節點之間的影響力大小,利用在介數中心性算法的基礎上實現輿論領袖節點的識別,并通過對網絡中與鄰居節點均具有較高的親密度的節點進行謠言的控制,都會達到較好的效果。
分析節點間的親密度可以從3個方面入手:(1)交互頻率;(2)交互類型;(3)節點間跳數。
在結合節點之間的交互頻率、好友類型和跳數時延三方面綜合量化之后,得到最終的節點之間親密度評估方法。因為在計算網絡拓撲中最短路徑時,鏈路上的權值越小表示路徑越短,所以將節點間的親密度量化結果也表示為值越小則親密度越高。根據介數中心性的大小識別輿論領袖節點,增加了對網絡圖加邊和更新權值的過程,這個過程的時間復雜度是隨著節點的增多線性增加的,對每個節點及其鄰居節點進行一遍計算。所以整個基于親密度的輿論領袖節點識別算法的時間復雜度是在Brande算法的基礎上加上更新過程的時間復雜度。endprint
3 謠言傳播模型
3.1 SIR 模型
在經典的SIR 傳染病模型中,將節點狀態分為易感染狀態(susceptible)、感染狀態和治愈狀態(recovered)。社交網絡中除傳染源之外的節點初始狀態均為易感染狀態。當處于易感染狀態的節點接觸到感染節點后以一定的概率變為感染狀態。當處于感染狀態的節點在接觸到易感染狀態的節點時,又會以一定的概率將其感染。但當處于感染狀態的節點以一定的概率被治愈后,將處于治愈狀態,并具有免疫能力,不會再被感染。主要的節點狀態轉化過程如圖2 所示。
該傳播模型在傳染病傳播過程中得到廣泛應用。適用于當個體感染到病毒后都有成為病原體的機會,并且成為病原體的個體康復后則具有永久免疫能力的情況。
3.2 傳染病模型改進
通過向社交網絡中的輿論領袖節點注入真相從而控制社交網絡中謠言的傳播。因此在這一部分將社交網絡中節點傳播的狀態進一步細化,其中包含了當節點接收到真相后的各種狀態:
(1)易感染狀態;(2)感染狀態;(3) 治愈狀態;(4)免疫狀態(defended)。
通過上述對抑制謠言過程中節點狀態的分類,總結社交網絡中節點狀態變化過程,如圖3所示。上述過程在SIR 模型的基礎上增加了免疫狀態,更形象地描述了社交網絡中的節點直接相信真相的過程。
3.3 分析結論
基于上述的傳染病改進模型,結合親密度的概念可知社交網絡中處于免疫狀態的節點與其鄰居節點之間的親密度越大,則處于免疫狀態的節點傳播的真相信息更容易被其鄰居節點接受,從而使真相能夠在整個網絡中迅速傳播,進而達到快速控制謠言的目的。
4 社交網絡中的謠言抑制
早期研究人員對社交網絡的研究局限于單一節點參與網絡的總水平,而忽視了其相鄰節點的重要性對其影響的數量。同時因為缺乏體現社交網絡中節點影響力的量化標準,使得對社交網絡的認識存在局限性。
鑒于復雜網絡理論中已有的度中心性,緊密度中心性,K-Shell,介數中心性,特征向量中心性等參數可以反映復雜網絡中節點的重要性,那么利用這一理論對社交網絡中的輿論領袖進行預測也應該具有可行性。
已有的研究表明,目前的大部分網絡謠言的傳播規律與傳統傳染病模型有一定的相似度。通過仲天鍵等人的研究,現在我們掌握了一種與社交網絡謠言傳播規律對應的傳染病改進模型。根據此模型結合親密度的概念,可以得到控制社交網絡中謠言傳播的一般規則,既處于免疫狀態的節點傳播的真相信息更容易被其鄰居節點接受,從而使真相能夠在整個網絡中迅速傳播,進而達到快速控制謠言的目的。
5 謠言抑制在社交網絡中的應用模式
一方面,現有的人類社群大致可分為線下組織,線上組織,線下組織在線上的延伸和線上組織在線下的延伸四類。而謠言抑制是基于對社交網絡中的輿論領袖節點的識別實現的。在未來應用中,可以嘗試通過以上社群在線上的交流實現對社群中輿論領袖的識別,因而這一技術可以使有關部門在反恐、維護國家安全等方面取得新的優勢。
另一方面,因為謠言的抑制是通過對社交網絡中輿論領袖節點注入真相實現。但輿論領袖的作用并不限于在謠言傳播時宣揚真相。通過對輿論領袖節點的識別可以對一個社交網絡中的信息流通有所把握,而與輿論領袖節點合作則可以引導社交網絡中的信息流通。因此這項技術在當今的商業推廣中也可以發揮相當大的作用。
6 展望
社交網絡謠言抑制可以使得大范圍控制言論傳播成為了可能,而社交網絡人格預測使得人格信息對大規模應用和學術研究成為了可能。當前社交網絡的大部分研究都涉及到對用戶行為及屬性的分析和預測.例如,對商品的個性化推薦是預測用戶潛在的購買行為、對廣告的個性化推薦是預測用戶的點擊行為、影響力建模是評價用戶的影響力屬性、社區發現是按照某種屬性對用戶個體進行聚類等。
社交網絡的人格預測與謠言抑制均屬于社會計算領域。因此我認為在未來發展中,謠言抑制算法應該實現與用戶人格預測技術的結合。單一的謠言抑制使管理者永遠處于被動的狀態,而二者相結合將能夠通過用戶人格預測實現謠言易感人群和謠言產生人群的定位,必將大大提高謠言控制的效率。另一方面,對用戶言論類型的記錄可以進一步擴充人格預測的數據基礎。二者的結合應用將比單純的謠言抑制更有發展前景。
參考文獻:
[1]雷宏振,賈悅婷.基于復雜網絡的在線社交網絡特征與傳播動力學分析[J].統計與決策,2015(02):114-117.
[2]曹坤宇.基于親密度及影響力的微博社交興趣圈挖掘算法研究[D].天津大學,2013.
[3]仲天鍵,蘭國興.一種基于改進SIR的網絡謠言傳播模型研究[J]. 信息與電腦,2015(24).
作者簡介:田伯凱(1995-),河北人,本科在讀,研究方向:經濟管理。endprint