賈紅雨 趙雪燕 邱晨子
(1.大連海事大學交通運輸管理學院,遼寧大連116026;2.交通運輸部規劃研究院,北京100000)
基于復雜網絡的微博網絡輿情圖譜分析方法研究
賈紅雨1趙雪燕1邱晨子2
(1.大連海事大學交通運輸管理學院,遼寧大連116026;2.交通運輸部規劃研究院,北京100000)
本文針對微博網絡輿情的控制和引導問題,提出一種基于復雜網絡的圖譜分析方法。本文以微博用戶間轉發和評論某一話題下用戶關系數據作為基礎研究數據,生成用戶節點網絡關系圖譜,通過對微博網絡模塊化圖譜、路徑圖譜和中心性圖譜分析,定性和定量評估出對輿情活躍度高、傳播范圍廣、傳播速度快的微博用戶節點,作為控制微博輿情的傳播、引導輿情輿論導向的關鍵用戶節點。本文以某一微博社區為樣本數據,采用復雜網絡分析工具Gephi,驗證了基于復雜網絡的圖譜分析對識別輿情控制中關鍵用戶節點的正確性和有效性。
網絡輿情;復雜網絡;圖譜分析方法;輿情控制引導
微博擁有龐大的用戶群,由于其傳播過程具有廣泛性和快捷性,如不能有效地控制和引導輿情傳播,會造成較大的負面影響,這已成為專家學者關注的熱點問題。針對微博網絡的裂變式、及時性以及圈群性等特點,借鑒復雜網絡的概念,以微博用戶間的關系代替社會關系,以用戶節點代替個人,賈紅雨[1]等建立起了微博網絡的概念,驗證了微博網絡的無標度性,而復雜網絡的圖譜分析方法在表現網絡中節點間、節點與邊以及邊與邊的復雜連接關系方面具有形象直觀,一目了然的效果,本文首次將基于復雜網絡的圖譜分析方法運用到微博網絡的分析中,應該是一次有益的嘗試。
目前,隨著復雜網絡理論的深入探究,該方法應用范圍十分廣泛,專家學者們在競爭情報、知識管理、圖書館資源配置、學科熱點、引文分析[2]、科研人員合著、網絡鏈接、博客網絡[3]等方面展開了一系列研究[4]。在微博網絡輿情方面,復雜網絡分析方法已經被應用到微博輿情復雜網絡構建,傳播機制和演變階段分析等方面,金鑫[5]等應用復雜網絡分析方法構建了微博社會網絡;康書龍[6]基于微博網絡中用戶行為及關系,應用復雜網絡分析,評估微博網絡節點影響力;熊會會[7]應用復雜網絡分析方法,對微博客的拓撲結構進行分析,提出了微博網絡信息傳播模型。
本文旨在以復雜網絡理論和微博用戶間的評論及轉發關系的用戶關系數據為基礎,構建微博網絡輿情的圖譜模型,利用復雜網絡Gephi軟件,通過模塊化圖譜、路徑圖譜和中心性圖譜分析,定性或定量地評估出微博社區中的輿情控制關鍵節點,給出控制和引導影響力強、具有領導作用的關鍵用戶節點的建議,提高正確信息的傳播效果,及時發現和阻止負面輿情的傳播,維護正常的微博社區秩序,避免引起網民的恐慌,維護社會的穩定和安全。
1.1 分析模型的建立
微博網絡輿情與其他類型的輿情傳播一樣,受傳播源頭、傳播路徑以及傳播速度等因素影響,研究微博網絡輿情的傳播,同樣從以上三個方面入手。在微博網絡中,微博網絡輿情的傳播源頭是用戶節點,傳播路徑和傳播速度決定于微博用戶節點和邊的屬性以及兩者之間的連接關系。因此本文將從微博網絡輿情的關鍵用戶節點,節點與邊和邊與邊之間的關系對微博網絡輿情的傳播進行分析研究。在復雜網絡理論方法中,表示節點及邊和該兩者兩兩之間的特征量度有節點的度與節點度分布、平均路徑長度、簇系數以及介數。
1.1.1 微博輿情關鍵節點模型參數
微博輿情可以使用度和度分布來評估用戶節點的影響力和重要程度。
復雜網絡中節點的度是指與此節點直接相連的邊的數量。在有向網絡中,入度是指從其他節點指向該節點的邊的數目,出度是指該節點指向其他節點的邊的數目[8]。微博輿情的每個用戶都是一個節點,在某一話題下,X節點的微博被其他用戶轉發或者評論的次數即是X節點的的入度;相應的,X節點在該話題下評論或者轉發其他用戶的次數是出度。節點的度稱作點度中心度(Degree Centrality),點度中心度越大的節點,其影響力越大,在整個網絡中的作用也就越大。
度分布(Degree Distribution)是指復雜網絡中節點的度的概率分布,許多統計實驗的數據表明,無標度網絡具有冪指數的度分布[9],即:

P(k)為一個隨機選擇的節點恰好具有k條邊的概率。其中γ稱為冪指數,其范圍為1≤γ≤4[10]。
網絡中的冪律顯示,節點的度值相距很大,極少數節點的度值很大,而絕大多數的節點度值很小[11]。
1.1.2 微博輿情傳播效率模型參數
微博網絡輿情的傳播效率取決于用戶節點間邊的長度,復雜網絡中衡量邊的指標可以用平均路徑長度。
復雜網絡中的路徑長度(Path Length)是節點與節點間最短路徑上邊數。網絡中節點與節點之間的距離的最大值稱為網絡的直徑,記為D,即:

平均路徑長度定義為網絡中節點i與j之間的最短路徑長度的平均值L,即:

其中,N表示網絡中節點的數量[12]。微博輿情的平均路徑長度是指網絡中所有用戶節點對的平均距離,表示微博輿情傳播的時間長短。
1.1.3 微博輿情傳播路徑模型參數
采用介數中心度和緊密中心度對微博網絡中用戶節點處于此網絡的中心地位的程度進行定量分析,找出微博網絡輿情傳播路徑上的關鍵節點或脆弱點。
(1)介數中心度
介數中心度(Betweenness Centrality)是度量一個節點出現在網絡中最短路徑上的效率。微博輿情中用戶Y相對于一個用戶對X和Z的介數中心度指的是經過用戶Y并且連接這兩個用戶的捷徑占這兩個用戶節點之間的捷徑總數之比,即用戶Y在網絡信息流動中的傳輸負載量。介數中心度可表示為:

gst,i表示用戶對s和t最短路徑經過用戶i點的路徑數,nst表示節點s和節點t之間存在所有最短路徑的路徑數[13]。
(2)緊密中心度
緊密中心度(Closeness Centrality)是刻畫微博網絡中某一節點對網絡中其他可達節點的難易程度。其值定義為該節點到達其他節點的的距離之和的倒數,是網絡的拓撲中心:

dG(v,t)表示網絡G中v節點到t節點的距離[14]。擁有高緊密中心度的用戶節點可以在較短的路徑上將信息傳遞給更多人[15]。
進行圖譜分析的前提是確定數據來源并對數據進行處理。為了避免某些特定領域話題的特殊性,不具有普遍的代表性,本文采用的數據來源于騰訊微博,利用迅雷批量下載“緬懷!喬布斯逝世一周年”這個話題下的所有數據,然后對這些數據進行數據分析,分析過程包括數據提取,解析和清洗,提取用戶評論或者轉發該話題的具體文檔內容,對內容進行解析,確定用戶是僅自己發表觀點還是對話題進行了轉發和評論,在數據清洗中,對重復的昵稱和假的孤點進行過濾剔除。
2.1 網絡圖譜模塊化分析
經過上文對微博數據進行收集、提取、解析和清洗后,轉換成可供復雜網絡分析工具Gephi識別的.csv數據表格文件,將數據導入Gephi軟件中,利用Gephi對網絡數據進行模塊化分析,將網絡所有用戶分為840個社區,得到如1圖網絡模塊化分布結構圖。

圖1網絡模塊化分布結構
圖2 是圖1的模塊化圖示與各模塊節點的度數所占比例,從圖2中可以看出,節點顏色和大小都不同,不同顏色的節點代表的社區不同;節點的大小影響社區的大小,該節點所影響的范圍也不同。為了更清晰的分析網絡結構,將網絡圖中度數較大的點按照度數從大到小排序標記為A~F,每種顏色的社區中間較大的節點代表一個中心節點,這些中心節點擁有很大的出度及少量的入度,只有極少數的社區擁有很多的關聯節點,大多數社區擁有的連接節點都很少,這一點充分體現了微博網絡用戶節點關系網絡中,少數節點間的連接關系強,大多數節點只是受影響節點,連接關系強的中心節點在網路圖譜中可以很容易被識別,并且對本社區的多數節點具有很大的影響作用。
2.2 網絡圖譜路徑分析
從生成的網絡圖中突出顯示以A節點為中心節點的社區網絡,如圖3所示。
對于以A點為中心的社區,其影響廣度在整個網絡中最強。輿情傳播速度在該社區內傳播最快。但是,由于該社區內其他節點對熱點輿情的興趣度不高,導致網絡輿情傳播深度不夠。在網絡輿情控制時,只需高度關注核心節點A的動向,就可以對該社區的輿情進行有效監控。

圖2 模塊化分層的節點度比例

圖3 節點廣度傳播圖
研究微博網絡輿情傳播既要從節點傳播廣度上分析,也要從影響深度上分析。突出顯示以B節點為中心節點的社區網絡,得到如圖4所示的節點深度傳播圖。

圖4 節點深度傳播圖
在以B點為中心的社區網絡中,其傳播深度為六層,與整個網絡的直徑相同。可以說明,該社區縱向影響程度最大。即與B為直接相鄰的節點還有其他外層節點,對其發布的網絡輿情敏感度較高。對于B作為輿情原點,在整個網絡中影響較深。
綜上所述,雖然與A點直接相鄰的節點在整個網絡中最多,即度數最大,但與度數較小的B點相比,其影響深度不高。而影響深度大的B點也沒有A點對輿情傳播影響個體多。所以在對網絡進行合理引導和控制的時候,既要考慮核心節點的影響廣度,同時也要考慮其影響深度,這樣才能完善輿情監控機制。
2.3 微博網絡介數中心性分析
通過對網絡進行介數中心性分析,得到圖5。

圖5 介數中心性分析
由圖5可以看出A、B、C、D、E、F都是在一條以O為輿情源,進行信息傳播的關鍵路徑上的重要節點。這些節點在整個網絡的關鍵路徑中出現的頻率是最多的,同時也表示這些節點對網絡中輿情的關注度也是最高的,其中D點最大,表示該點對網絡輿情興趣度最高,即出現在關鍵路徑上的次數是最多的,在整個網絡中,D點對于輿論事件的活躍度是最高的。
如在O點為核心的社區內進行輿情控制,只需對A、B、C、D、E、F這六個節點加以控制,就能及時有效的發現和控制負面輿情的傳播。同時,對于整個網絡來說,在這些點上也設立相應的監控和應變機制,將會對微博網絡輿情引導與控制起到事半功倍的效果。
2.4 微博網絡緊密中心性分析
通過對網絡的緊密中心性分析,得到圖6。
如圖6所示,顏色和大小的不同代筆該節點在網絡中的緊密度的不同。其中,A、B、C、D、E等具有較強的緊密中心度,即它們能夠以最短的距離到達網絡中能夠到達的其他節點。對于整個網絡來說,這幾個核心節點對網絡中輿情熱點的傳播速度最快。這些點分布在網絡的不同社區內,屬于各個社區的積極因子,能夠以最快的速度使輿情得到擴散。

圖6 緊密中心性分析
所以,對于網絡中緊密度較高的節點,在控制過程中可以對這些節點加以實時監控,起到檢測輿論傳播速度的作用;另一方面在引導輿論走向的過程中可以利用這些節點的感知能力將正面積極的信息發布到網絡中,使微博網絡輿情得到有效的引導。
3.1 控制手段
對與網絡輿論形成和傳播有關環節實施有效的管理。即刪除具有影響網絡傳播范圍的節點以及在網絡中起到橋梁作用的節點。
點度連接度大的節點是微博社區中的核心節點,在輿情蔓延初期,可以刪除此類節點,抑制負面輿情從他們的位置擴散。但是點度連接度大的節點的作用僅限于自己的社區,而傳播深度大的節點有大量與外部網絡聯系的節點,刪除此類節點可以及時隔斷輿情信息傳播的深度,減少信息的傳播層次。
介數中心度大的節點雖然只有很少的聯系節點,但它們處于網絡與外部連接的交接處,具有信息通道的作用,刪除這類節點后網絡就無法與外部網絡交換信息,可以阻斷輿情信息向外部蔓延。
緊密中心度大即傳播速度快的節點可以以最近的距離聯系到網絡中的每一個可能到達的節點,處于感知整個網絡輿情信息最有利的位置,刪除此類節點可以抑制輿情信息的快速傳播,爭取更多的時間控制輿情傳播。
3.2 引導手段
利用“核心成員節點”的影響力,從理性、知識性和情感等方面對參與網絡輿情的網民的認識和情感進行潛移默化的影響,將不正確或非理性的輿論引導到正確的方向。
當負面信息傳播時,可以跟隨辯駁,將正確的信息及時推送到用戶手中。另外,主動辟謠也是一種有效的手段,對于已經證實的不實消息,將其標識為“謠言”,對正在傳播謠言的用戶給予通知警告,限制其傳播。此外,建立官方平臺,主動澄清事實也是目前較為普遍的引導手段。最后,人為引出新話題和核心成員,出現多個次級話題或次級核心成員,分散話題或者核心成員的影響力,也是引導輿情傳播的有效手段。
本文從定量和定性的角度,對微博網絡用戶群進行了網絡圖譜模塊化分析,網絡圖譜路徑分析以及微博網絡中心性分析,并最終更加合理和準確地得到了所研究微博社區的輿情核心節點。在微博網絡輿情演變所處的不同時期,根據各階段輿情不同的特點,通過對核心微博用戶實施有力的控制手段和引導策略,進行綜合調控,引導輿情走向,維護微博社區秩序。
目前專家學者們對于微博網絡的研究方向還處在微博信息的靜態分析上,但是隨著網絡微博的廣泛使用,輿情話題不只是一個,微博信息也達到海量級,如何采用海量的微博數據源信息,并對其進行有效的分類、組織和存儲管理并快速、準確、全面地管理數據,是日后對微博進行監管和引導的重要前提基礎,也是今后的研究方向。
[1]Jia Hongyu,Hao jianwei,Qiu chenzi.A Model for Studying Public Opinion Hotspot Growth Regulation in Microblog Network[C].International Conference On Managenment Science&Engineering 20th Annual Conference Proceedings(Volumn I)(C),2013:173-178.
[2]宋歌,葉繼元.基于SNA的圖書情報學期刊互引網絡結構分[J].管理觀察,2014,(4):141.
[5]劉婷婷,馬海群.信息安全政策績效評價的指標體系框架構建[J].農業網絡信息,2014,(3):25-28.
[6]韓伯棠.管理運籌學(第二版)[M].北京:高等教育出版社,2005:390-397.
[7]崔清新,鄒聲文.信息安全條例已起草[N].新華每日電訊,2010-11-09,(001).
[8]工信部正在起草信息安全條例[EB/OL].http:∥www.lawlib.com/fzdt/newshtml/fzjd/20121219105106.htm,2014-12-09.
[9]中央網絡安全和信息化領導小組第一次會議召開[EB/OL]. http:∥www.gov.cn/ldhd/2014-02/27/content_2625036.htm,2014-12-09.析[J].中國國家圖書館,2009,(3):27-34.
(本文責任編輯:馬卓)
[3]趙廣利.社會網絡分析技術在博客媒體信任度中的研究與應用[D].包頭:內蒙古科技大學,2011:15.
[4]D.KNOKE,J.H.KUKLINSKI.Network Analysis[M].Beverly Hills:Sage Publications,1982.
[5]金鑫.基于復雜網絡的微博輿情傳播[J].吉林大學學報:工學版,2012,(S1):272.
[6]康書龍.基于用戶行為關系的社交網絡節點影響力評價[D].北京:北京郵電大學,2011:3.
[7]熊會會.基于復雜網絡的微博客信息傳播機制研究[D].廣州:華南理工大學,2012:4.
[8]田慶飛.基于復雜網絡理論的城市公交網絡生成與優化研究[D].吉林:吉林大學,2013:31-34.
[9]羅熹.基于新浪微博的社交網絡復雜特性研究[D].武漢:武漢理工大學,2012:22.
[10]Zhang G Q,Yang Q F,et al.Evolution of the Internet and its cores[J].New J.Phys.2008,(10):8.
[11]張貴清,復雜網絡拓撲結構對OFC模型動力學行為影響的研究[D].天津:南開大學,2009:8-9.
[12]曾小舟.基于復雜網絡理論的中國航空網絡結構實證研究與分析[D].南京:南京航空航天大學,2012:17.
[13]Huang Jinshan,Zhang Xunfeng.Advances in Artificial Intelligence(Volumn 4)——Proceedings of 2011 International Conference on 2011 2nd International Conference on Management Science and Engineering(MSE 2011)[C].成都:2011.
[14]吳柱,李斌,許騰.艦艇編隊通信網絡中心化研究[J].指揮控制與仿真,2012,(2):13-14.
[15]孫超.微博網絡信息流的影響因素研究[D].北京:清華大學,2012:19-20.
(本文責任編輯:郭沫含)
A Study of Complex-network-based Graph-analytical Approach on Microblog Net-mediated Public Sentiment
Jia Hongyu1Zhao Xueyan1Qiu Chenzi2
(1.Transportation Management College,Dalian Maritime University,Dalian 116024,China;2.Transport Planning and Research Institute,Ministry of Transport,Beijing 10000,China)
Considering how to control and guide microblog net-mediated public sentiment,a complex-network-based graph-analytical approach was proposed.Based on the analysis of relationship data generated by users that commented on and forwarded one topic of the microblog,graphs of user nodes network are built,and by analyzing the modularity graph,path graphs and centrality graphs,user nodes that are highly active on public sentiment and have wide breadth propagation,deep depth propagation and fast speed propagation are evaluated quantitatively and qualitatively.Besides,these nodes are controlled and guided effectively,which may be used to slowly spread the net-mediated public sentiment and guide the direction of the public topic. Taking some microblog community data as sample data,and using complex network software Gephi as analysis tool,the correctness and effectiveness of the a complex-network-based graph-analytical approach which was used to identify the key nodes in the process of the public sentiment control were verified.
net-mediated public sentiment;complex network;graph-analytical method;public sentiment control and guide
10.3969/j.issn.1008-0821.2015.03.012
G250.252
A
1008-0821(2015)03-0064-04
2014-07-09
賈紅雨(1965-),女,副教授,博士,研究方向:信息系統工程,管理科學與決策支持系統研究等,發表論文數篇。