吳 謙,曹金璇
(中國人民公安大學,北京 102600)
隨著社交網絡的不斷發展與完善,越來越多的網民開始將微博﹑微信等社交平臺視作發布和獲取各類信息的主要渠道,而短時間內迅速聚集的各類信息也使得這些社交平臺成為輿情傳播的重要途徑之一。國內首家微博網站新浪微博在2009年創立,隨后微博便開始在我國得到爆炸式發展,其中以新浪微博的使用最為廣泛[1]。近年來,隨著信息傳播形式的大量豐富﹑移動網絡終端的迅速發展和微博自身版本的不斷提升,當下網民通過微博獲取和傳播信息的途徑更為多元化。相比于微博發展的早期,僅以文字或圖片為基礎的信息傳播方式已經逐漸演變成文字﹑圖片﹑視頻﹑超鏈接甚至網絡直播為載體的多元化信息傳播方式。由于用戶數量眾多﹑信息傳播速度快等原因,微博平臺容易迅速形成較強的輿論壓力,可能對事件的發展和結果造成不可逆轉的重要影響,甚至導致一些較為嚴重的現實后果。
1.1.1 傳染病信息傳播模型
信息傳播領域最廣為人知的理論模型是基于現實傳染病傳播的傳染病模型。借鑒傳染病模型的思想,將社交網絡中的節點劃分為不知道消息的人群(S)﹑知道并繼續傳播消息的人群(I)以及知道消息但失去傳播興趣的人群(R)。通過不同狀態間的變化,研究信息的傳播。隨著研究的深入,一種名為SEIR的社交網絡傳染病模型被提出并被廣泛認可。如圖1所示,它加入了潛伏狀態E(Exposed),用以表示受到感染的個體以一定的概率發病。

圖1 SEIR傳染病模型
1.1.2 影響力傳播模型
影響力傳播模型假設信息擴散的過程由個別節點的影響力掌控,通過對節點影響力進行評估而預測信息傳播趨勢。該模型定義節點u的影響力函數Iu(x),表示在u被影響x個時間段后其粉絲提及該信息的數量。定義函數V(t),表示t時刻系統中提及某個信息的節點數量。假設V(t)為所有已受影響的節點影響力函數之和:

其中,A(t)表示已受影響的節點集合,節點u在tu時刻被影響(tu≤t)。
該模型可描述如下:節點u﹑v﹑w在tu﹑tv及tw時刻被影響,之后各自產生一個影響力函數Iu(ttu)﹑Iv(t-tv)和Iw(t-tw)。t時刻,系統中提及某信息的量V(t)為這三個影響力函數之和。
已有的社交網絡信息傳播模型大多假設信息不受網絡外的影響,僅沿著社交網絡中的邊在節點之間傳播[2]。然而,現實世界中,社交網絡中的用戶可通過多種渠道獲取信息。這時可以用函數λext(t)來描述某用戶受外部影響獲得的信息量。若其鄰接節點已發布過相關信息,則會對該用戶產生基于鏈接的內部影響λint(t)。函數η(x)描述用戶接觸到信息而發布有關微博的概率。最終,用戶或者受到影響發布相關微博,或者不再對該信息產生反應。節點i受到的總影響為:

其中,Λi(nit)表示節點受到內部影響獲得信息的期望值,Λext(t)為節點所受外部影響獲得信息的期望值。
最終,用戶i受到影響發布有關微博的概率為:

其中,函數η(x)描述用戶接觸信息而發布有關微博的可能性。
2.1.1 理論基礎
在實際的微博網絡輿情信息傳播過程中,輿情話題的傳播過程往往受到多方面影響[3]。例如,某一個話題在經過意見領袖如微博中擁有大V稱號的博主轉發后,由于這些意見領袖的粉絲眾多,作為輿情傳播網絡的重要節點之一,就有可能加快輿情在社交網絡間的傳播速度。另外,輿情話題在微博中被評論或者轉發時,評論者或轉發者的情感傾向也會對輿情傳播造成一定影響。例如,當某一話題引起較多人產生強烈正性或負性情感共鳴時,原本對事件保持中立的網民就有可能受到這種情感傾向的影響而加入到輿情話題的傳播和討論中,從而進一步影響輿情本身在網絡中的傳播。除了以上兩點,輿情信息本身的形式也會對其在微博網絡中的傳播產生重要影響。
微博平臺中發布的信息大致分為以下幾種。
(1)短文本信息。短文本信息主要由一段簡短的文字﹑表情或符號組成,通常不足以成為輿情話題,或者缺少作為輿情信息傳播的豐富性和可靠性。這類信息主要作為個人情感因素的表達或者簡單的評論以及對某一事件的簡單描述[4]。
(2)長文本信息。自2016年以后,新浪微博開始取消對發布微博內容字數的限制,將原來140字的字數限制改為2 000字,并且經過對會員的開放試用到所有用戶取消限制,如今最新版本的微博平臺已經可以發布篇幅較長的文本信息[5]。長文本信息的內容較之短文本而言更豐富,可以較為全面和清晰地描述某一事件,但由于缺乏類似圖片﹑視頻或者其他超鏈接的支持,其輿論影響效力一般。
(3)圖片信息。微博平臺中的圖片信息主要分為單張圖片﹑多張圖片﹑長圖片以及GIF圖片幾種形式。其中,GIF圖片是將一些連續的圖片通過處理連接成一小段GIF格式的小視頻(通常僅為幾秒),然后發布在微博上的一種較為新穎的信息傳播方式[6]。和視頻不同,GIF圖片往往較為簡短,其中大多只包含與主題有關的內容信息,但這類信息格式的傳播成本低﹑傳播速度快且內容比一般圖片更加豐富。
(4)視頻信息。目前,最新微博版本中除了可以發布文字﹑圖片信息外,還可以發布視頻內容。這一更新較之以往的版本對各類輿情話題的傳播無疑起到了重要的推動作用。視頻往往最有能力還原事件真相,因此相比于前幾種信息形式,當某一輿情話題中包含一段相關視頻內容后,往往更容易引起網友的關注。另外,當一些輿情事件還處在發酵階段時,如果微博網絡上出現了類似的視頻內容,那么將很有可能影響甚至推翻之前的輿情話題,產生新一輪的輿情爆炸事件。
(5)超鏈接信息。超鏈接信息也是微博輿情信息傳播中的一種重要形式。大多數輿情話題在經過微博博主發布后通常會附上一段超鏈接,當微博用戶對話題產生興趣并點開這些鏈接時,鏈接轉向的網頁內容中就可能包含以上的任意一種或幾種信息形式,從而使用戶對話題產生興趣以及正性或負性的情感傾向,最終影響輿情話題在微博網絡中的傳播[7]。
2.1.2 模型假設
根據媒介豐富性理論及以上理論基礎,本文認為微博中輿情話題的信息形式會對輿情的傳播產生影響,并據此提出以下假設:
H1:輿情話題的信息形式會正向影響微博轉發H2:輿情話題的信息形式會正向影響微博評論以上猜想的依據是由于僅以文字形式傳播的輿情信息缺乏說服力,有可能導致受眾小﹑傳播速度慢﹑不易在微博網絡中發生話題效應,對微博用戶的吸引力較小。相比之下,同時包含圖片和文字兩種信息形式的輿情話題更容易引起微博用戶的興趣而產生關注,也更加具備一定的說服力和話題性。而當一個輿情話題信息中能夠包含詳細完整的視頻內容及其他形式的信息作為補充時,該話題的說服力和影響力較之前兩張形式更為強烈。由于視頻信息中不僅包含了聲音和圖像,還能詳細完整地還原話題事件發生的經過,因此更能使用戶產生強烈的情感傾向和對話題的參與熱情,從而影響輿情在網絡中的傳播。
2.2.1 研究變量
依據樣本數據特征,本文將微博輿情話題的信息形式細分為文字信息﹑圖片信息﹑視頻信息以及超鏈接信息四個虛擬指標。同時,考慮到輿情傳播過程中可能受到意見領袖[8]的影響,增加一項以話題微博發布者及微博轉發者的粉絲數量為基礎的解釋變量,以保證實驗的變量控制原則,消除可能帶來的影響。
被解釋變量:
Fi(Forward)轉發數:樣本中第i條微博獲得的轉發數量;
Ri(Reply)評論數:樣本中第i條微博獲得的評論數。
解釋變量:
Wi(Word)文字形式:虛擬變量,表示樣本中第i條微博中是否包含文字形式的信息內容,包含標記為“1”,不包含標記為“0”;
Pi(Picture)圖片形式:虛擬變量,表示樣本中第i條微博中是否包含圖片形式的信息內容,包含標記為“1”,不包含標記為“0”;
Vi(Video)視頻形式:虛擬變量,表示樣本中第i條微博中是否包含視頻形式的信息內容,包含標記為“1”,不包含標記為“0”;
Hi(Hyperlink)超鏈接:虛擬變量,表示樣本中第i條微博中是否包含超鏈接形式的信息內容,包含標記為“1”,不包含標記為“0”;
2.2.2 回歸假設檢驗模型構建
本文考慮將微博內容的轉發數量和對微博內容的評論數量作為參考依據,用來表示該微博輿情話題的傳播程度和傳播效果,以研究微博話題的信息形式對輿情傳播過程產生的影響[9]。所構建的原始回歸模型如下:
模型(a):

2.2.3 樣本選擇
考慮到數據來源的權威性和全面性,本文選取國內最大的微博網絡平臺——新浪微博,作為樣本數據的獲取平臺。
考慮到事件的關注熱度和社會影響,本文根據權威網站人民網在2017年上半年發布在社會藍皮書上的《2016年互聯網輿情報告》中的內容,選取位列2016年互聯網輿情熱度首位的“杭州G20峰會”作為研究案例。
根據上文給出的數據變量和采集要求,本文利用Python自編網絡爬蟲工具對微博上的相關數據進行收集[10]。首先通過在新浪微博主頁的搜索項中輸入關鍵詞“杭州G20峰會”得到相關微博信息,然后運行爬蟲程序,對2016年8月1日至2016年9月31日兩個月內的相關微博數據以及信息形式進行采集和挖掘,并根據表1中給出的判斷標準對數據進行清洗和預處理,最后將數據導出到數據庫中,得到如表2所示的初步統計結果。

表1 樣本分類

表2 樣本數據初步統計結果
3.2.1 相關分析
在輸入以上收集的數據信息后,輸出結果如表3﹑表4所示。

表3 模型(a)的相關數據分析結果

表4 模型(b)的相關數據分析結果
本文利用Pearson相關系數對各解釋變量進行檢驗。若顯著性檢驗概率值(P值)大于0.05,則表示變量間沒有顯著相關性。通過分析得到,除文字形式Wi和超鏈接形式Hi以外,其他解釋變量的P值均小于0.05,由此得出以下結論:
(1)文字信息形式作為微博輿情傳播的解釋變量和被解釋變量之間并沒有顯著相關性[11],這可能是由于收集的所有微博輿情數據信息中幾乎都包含了文字信息內容;
(2)其他四個解釋變量與被解釋變量間都具有顯著相關性[12],可以進行較為準確的回歸分析,同時粉絲數量與評論數之間的相關性最為明顯,而視頻信息形式與轉發數和評論數之間的相關性最為明顯,這也初步驗證了前文結論,即視頻信息比文字和圖片信息形式更能引起微博用戶對輿情話題的反應。
3.2.2 回歸分析
首先采用原始回歸模型對輿情話題的信息形式和樣本微博傳播的效果之間的關系進行分析,其中原始模型(a)對應轉發量數據,原始模型(b)對應評論量數據,相關系數為正表示正相關,反之為負相關[13]。從表3和表4不難看出,兩個模型容差值均大于0.1,VIF值均小于10,說明變量間不存在多元共線問題,數據的多重共線性檢驗指標符合要求[14]。
根據表3和表4所示的回歸結果,表明在微博輿情話題傳播過程中,圖片信息形式﹑視頻信息形式和節點的粉絲數量三個因素,對輿情話題微博的轉發量和評論量均有顯著正向影響[15];而超鏈接信息形式對輿情話題微博的轉發量和評論量具有顯著的負性影響。由此可以驗證上文提出的假設:即信息形式會對微博輿情的傳播產生正向影響,且視頻信息形式對輿情傳播的影響最大。此外,由于現有的微博信息幾乎全部包含文字信息,即微博內容一定含有文字,所以在這幾類信息形式中,只有文字信息對輿情的傳播幾乎沒有影響。
同時需要注意,超鏈接信息形式與微博輿情話題中的評論量呈現顯著負相關關系,原因可能是:
(1)本文研究的案例中含有超鏈接信息形式的微博多來自用戶對官方所發布微博內容的轉發,很多信息出現了重復,降低了用戶對該類博文的興趣以及轉發和評論的可能性;
(2)當微博用戶點開超鏈接查看輿情話題的詳細內容信息時,很有可能會從微博平臺跳轉至第三方網站,易造成微博用戶在查看完信息內容后往往不再愿意回到微博原文的頁面上進行評論或者轉發,而是經過超鏈接轉向的網頁進行評論和轉發。
本文在國內外專家學者的研究基礎上,以國內最受歡迎的新浪微博為輿情研究平臺,提出基于信息形式的微博輿情傳播模型,構建并驗證了以信息形式為解釋變量的原始回歸方程,最后通過數據分析驗證了模型的有效性和正確性。實驗結果表明,現有的不同信息形式特別是視頻信息會對輿情話題信息的傳播產生重要影響。相比于傳統的文字或圖片信息形式,視頻信息獨有的吸引力和表現力,更能夠抓住用戶眼球,降低用戶對輿情話題的參與成本,提高用戶對輿情話題的參與意愿,從而對輿情話題在微博網絡中的傳播產生影響。
由于受數據量﹑技術條件和研究方法的限制,本文僅選取了新浪微博作為研究平臺,且只針對“杭州G20峰會”這一輿情話題進行了有限時間范圍內的數據收集工作,有可能導致樣本不具有足夠的普遍性和說服力。后續研究中,可以通過提高樣本數據的數量﹑維度以及平臺多樣性,針對性地選取樣本數據收集的時間條件,進一步對信息形式可能產生的影響以及這些影響間的內在聯系進行更加深入的研究和分析。此外,除了信息內容的形式,輿情話題信息的其他特征也可作為今后值得關注的研究方向。
[1] 鄧夏瑋.基于社交網絡的用戶行為研究[D].北京:北京交通大學,2012.
DENG Xia-wei.Study on User Behavior based on Social Network[D].Beijing:Beijing Jiaotong University,2012.
[2] 吳增海.社交網絡模型的研究[D].合肥:中國科學技術大學,2012.
WU Zeng-hai.Study on the Model of Social Network[D].Hefei:University of Science and Technology of China,2012.
[3] 高嫻子.近年來我國社交網絡發展研究[D].廣州:暨南大學,2011.
GAO Xian-zi.Research on the Development of China’s Social Network[D].Guangzhou:Jinan University,2011.
[4] 李林容.社交網絡的特性及其發展趨勢[J].新聞界,2010(05):32-34.
LI Lin-rong.Social Network Features and Development Trend[J].Press Circles,2010(05):32-34.
[5] 張彥超.社交網絡服務中信息傳播模式與輿論演進過程研究[D].北京:北京交通大學,2012.
ZHANG Yan-chao.Research on Information Dissemination and Opinon Evolution in the Social Networking Services[D].Beijing:Beijing Jiaotong University,2012.
[6] 張彥超,劉云,張海峰等.基于在線社交網絡的信息傳播模型[J].物理學報,2011,60(05):1-7.
ZHANG Yan-chao,LIU Yun,ZHANG Hai-feng,et al.The Research of Information Dissemination Model on Online Social Network[J].Acta Phys. Sin,2011,60(05):1-7.
[7] 廖福生,江昀.微博客的信息傳播模式及其發展分析[J].寧波廣播電視大學學報,2010,8(02):4-6.
LIAO Fu-sheng,JIANG Yun.An Analysis of Microblogging Information Dissemination Model and Its Development[J].Journal of Ningbo Radio &University,2010,8(02):4-6.
[8] 王曉光.微博客用戶行為特征與關系特征實證分析——以新浪微博為例[J].圖書情報工作,2010,54(14):66-70.
WANG Xiao-guang.Empirical Analysis on Behavior Characteristics of Micro-blog Users——Take SinaMicroblog for Example[J].Library and Information Service,2010,54(14):66-70.
[9] 袁園.微博用戶轉發意愿的影響因素[D].南京:南京大學,2013:52-53.
YUAN Yuan.Research on Influence Factors of Microblog Users’Forwarding Intention[D].Nanjing:Nanjing University,2013:52-53.
[10] 陳遠,袁艷紅.微博信息傳播的正負社會效應[J].信息資源管理學報,2012(02):48-54.
CHEN Yuan,YUAN Yan-hong.The Positive and Negetive Social Effect of Microblog Information Dissemination[J].Journal of Information Research Management,2012(02):48-54.
[11] 吉祥.基于觀點挖掘的網絡輿情信息分析[J].現代情報,2010(11):46-49.
JI Xiang.Analysis of Net-Mediated Public Sentiment Information Based on the Opinion Mining Technology[J].Journal of Modern Information,2010(11):46-49.
[12] Chang Y W.Influence of Human Behavior and the Principle of Least Effort on Library and Information Science Research[J].Information Processing&Management,2016,52(04):658-669.
[13] Zhang W,Ye Y Q,Tan H L.Information Diffusion Model Based on Social Network[C].In Proceedings of MCSA 2012:145-150.
[14] Liu Z,Liu L,Li H.Determinants of Information Retweeting in Microblogging[J].Internet Research,2012,22(04):443-466.
[15] Yan Q,Yi L,Wu L.Human Dynamic Model Codriven by Interest and Social Identity in the Microblog Community[J].Physica A:Statistical Mechanics and Its Applications,2012,391(04):1540-1545.