趙 愛,畢碩本,王 軍,黃 銅,萬 蕾
(南京信息工程大學地理與遙感學院,江蘇 南京 210044)
基于網絡輿情的信息空間網絡結構及特征研究
趙 愛,畢碩本,王 軍,黃 銅,萬 蕾
(南京信息工程大學地理與遙感學院,江蘇 南京 210044)
本文利用社交網絡分析法和GIS可視化,在地理學視角下,對微博中“山東毒疫苗事件”信息傳播路徑進行定量分析。研究發現:①空間結構與社會經濟具有相對一致性,表現為網絡中節點的出入度與社會城市發展具有指向性,在個別中心城市間(北京、廣東、上海)有所區別;②輿論微博傳播具有地域性,不同的地域都形成中心節點城市,這些城市主導著周邊乃至全國范圍內的輿論方向;③相同時間段內的輿論信息傳播路徑數量在空間分布上呈現出不對稱性,東部地區要比中西部地區密集。
網絡結構;空間特征;社會網絡分析(SNA);網絡輿情
微博(Micro-Blog)集成了手機短信、博客與社交網站的瞬時通信優點,將用戶從原來單純的信息接收者變成了發布與接收的完全參與者,從而讓社會的個體群眾走進了“自媒體”時代?;ヂ摼W的快速發展讓人為主體的社會網絡突破了空間的限制,重構全球的物理和虛擬空間結構形式[1]。與此同時,基于微博社交形成網絡信息空間讓互聯網承擔并加速了輿情的發展。
在信息空間的分類研究上,Castelles等[2-4]提出城市應抽象成為網絡中的“信息流空間”,并強調了城市節點在塑造整個網絡空間中的價值;甄峰等[5]將空間劃分為實空間、虛空間和灰空間。信息空間的劃分強調了地理空間向網絡信息空間的變化,且肯定了網絡信息空間的真實作用。對于微型博客與信息空間對社會、經濟、地理等方面的實證研究,國外學者側重研究信息空間中群體之間的關系;國內則側重于在社會[6-7]、經濟[8-11]視角下研究個體用戶、個體城市之間的關系。陳映雪等[12-13]利用社交網用戶關系(用戶之間關注與被關注關系)信息地理空間結構進行研究,得出信息空間對稱程度與經濟社會發展具有相對一致性;經濟關聯的互聯網已經具備中等網絡規模,并指出多中心的網絡協同發展已初步形成。韓運榮等[14-17]根據對微博事件傳播的三種類型研究,分析了微博輿論的三種演化模式,即漩渦蔓延型、星系擴散型及節外生枝型,并對事件發展進行預測分析,揭示微博用戶信息傳播行為的動機。國外學者[18-21]則利用社交網絡所形成的信息空間研究政治行為、輿情狀況應該考慮到社交網絡服務的多樣化,對線上數據挖掘的同時要結合線下的參與人群所產生的影響。
總體而言,對微博研究目前還處于起步階段,研究方法還處于定性階段,研究工具單一,視角狹窄。大部分研究利用微博用戶粉絲與關注者關系構建網絡[5-13],然而用戶這種關系行為受用戶發布內容影響,具有很大的不確定性。鑒于此,本研究從地理空間的視角,將“山東毒疫苗”輿論信息在網絡中傳播的路徑關系構建網絡,拓展地理學在微博研究的內容和方向,分析信息空間網絡在傳播過程中的空間分布規律以及網絡結構,為社交網絡發展和輿論引導提供依據。
2016年3月,山東省發生一起幼兒注射疫苗死亡案例。此事經過媒體報道之后,在相近時間段內,全國又發現相似案例近百起。有關部門在輿情重壓與媒體監督下,迅速被查實了黑色疫苗產業鏈內幕。各地網民積極參與到此次公共輿論,對快速解決現實問題起到了督促與監督的作用。
本文借助此次“山東毒疫苗”引發的社會熱點話題為例,以新浪微博作為平臺、社交網絡中的實體用戶構成的網絡節點,研究節點之間關于此次公眾輿情事件傳播過程中的信息空間結構特征。以地理學的視角分析微博信息傳播路徑的數據。社交網站的用戶所在城市作為信息傳遞網絡的各個節點,用戶的轉發、發布信息方式作為節點間的聯系[22]。將各個用戶之間的信息交流理解為節點之間的出度、入度關系,從而構建基于微博的網絡信息傳遞形成的網絡空間,提取節點所在轉變為具有地理屬性的城市網絡。以期為信息化的社會公眾輿論引導、中國城市體系演變趨勢、城市信息傳播管理提供一定的科學依據。
提取參與輿論的用戶行為與屬性信息,把發布、轉發的時間、地點、輿情內容等作為研究樣本,同時選取涉及輿情范圍內的經濟等輔助研究相關數據。數據采集后,篩選標準如下:①信息空間的“節點”,即樣本中用戶真實地理位置,其落入中國國內;②只選取與該事件有關的信息;③用戶的關注用戶和粉絲年齡均在30歲以上; 2016年3月18日至4月8日期間采集數據165536組。最終,共獲得104965組輿情有效用戶關系數據(剔除標簽為海外地區、地理屬性缺省、城市標簽為“其他”、存在重復“結構洞”的節點[6])。本文選取的449個代表中國城市的輿情節點數據共96536組,占有效輿情總數的91.97%,節點城市覆蓋全國。選取的數據具有普遍性,可以代表此次網絡輿情發展情況。
社會網絡分析方法[23]是一類刻畫網絡整體的形態、特性和結構的重要分析方法。社會網絡分析具有突出的關系表達優勢,這種方案建立在如下假設之上:在互動的單位之間存在的關系非常重要,關系是網絡分析理論的基礎。本文利用用戶之間的信息互動,提取共同的城市屬性歸結到一個節點上。利用社會網絡分析法中的總體特征分析、中心性分析來對比基于信息空間的中國城市網絡中不同節點的中心性,網絡整體與區域之間的空間分布。
(1)數據有向化和標準化處理。構建網絡中有向信息流的關系矩陣,公式如下:

(1)

(2)計算網絡連接性矩陣:
(2)


(3)
(1)網絡密度是社會網絡分析常用的網絡測度,描述各個節點之間的關聯密切程度。網絡密度的定義為該網絡中各個城市節點信息交互的次數與節點連接最大量之比。由于本文數據采取用戶的發布以及轉發信息作為節點內部的交流,提取用戶所在城市作為公共節點。在計算密度時,密度為實際連接數量與城市節點間理論最大量的比值。所以本文的網絡密度為相對密度,其密度值在理論上可以大于1。計算公式為:

(4)
在網絡中,“出度”即節點向外傳播信息的次數,“入度”即節點接收信息的次數。中心度是度量構建網絡中心化程度的重要指標。基于輿情信息流向所構建的網絡中,處于中心位置的節點更容易獲得信息,對輿情發展的貢獻越大。
(2)點度中心度是衡量節點位于中心位置程度的指標。節點的點度中心度越高,其處于網絡中的地位越靠近中心。點度中心度的相對數計算公式為:

(5)
其中,Ci表示節點城市i;d(Ci,Cj)為節點連接度二值化的值,本文將Tij閾值設置為3,d(Ci,Cj)取值情況如下:
(6)
(3)介中心性是衡量節點對整個網絡資源的控制能力,它所表示的意義是:該節點在網絡中是其他節點成員中介的程度。在本文構建網絡里表示對信息的“中轉”能力。其中,Gjk(Ci)表示包含節點城市i時,兩個城市之間的短程線數量;Gjk表示城市j與k之間存在短程線的數量。介中心性元素NB(Ci)矩陣為:
(7)
本文分別從顯示地理城市的經濟要素、信息空間結構和地理城市相互關系,分析社交網絡信息傳遞空間特征以及內在的空間邏輯。
(1)網絡度與密度的地理分布不均,社交網絡中的連接性與區域的發展具有相對的一致性,整體呈現東高西低的態勢。本文選取了輿情網絡中出現頻率較高的449個縣級市、直轄市作為節點,不考慮城市節點間信息聯系穩定性的條件下,節點出度數量閾值P>1的地區數量占據地區總數的96.0%,P>50占據的地區為86.7%,大于500的地區占據26.5%,大于1000的地區占據14.5%。大部分地區的輿情節點度數量都落在1~50之間,極個別地區(例如事件發生地、經濟文化發達區域、人口密度大的區域)出現極端的輿情峰值。整個網絡密度為0.28,各個節點的度分布不均勻。整體的網絡密度分布統計情況見表 1,在全國尺度下,社交網絡的信息在東部、中東部、東南以及東北傳遞聯系行為相對頻繁。網絡化程度較低的西藏、青海、內蒙古地區與中部、東部的網絡節點出度頻次較少,而西部各個節點之間的內聚薄弱。

表1 各省市地區信息空間的網絡密度
(2)信息網絡結構分散程度在各個空間區域差異大。此次構建的整體網絡的密度各個節點之間的密度標準差為0.68,極差為2.66,密度均值為0.81,各個區域的網絡密度相差較大。
從基于信息空間的區域網絡角度來看,東部地區的各個城市對節點之間信息傳遞和交互能力最強,中部次之。東部省份、自治區中北京、廣東的網絡密度達到了2以上,是整個網絡中聯系最為密集的省份地區,與王波[13]等東部網絡研究結論一致,但在中部信息交流地區產生差異。主要由于中部地區的輿論受到東部地區輿論影響較大,相比之下,其內部信息流顯得較少;其他研究采用用戶關注與被關注數據,故無法準確表達中部真實情況下的數據流向。網絡密度大于整體0.81以上省份地區,東部地區有61.54%,中部地區有40.00%,西部地區有16.67%;主導此次輿情信息交互大部分是東部和中部地區。西部地區經濟較發達的地區如四川、陜西、重慶,這些地區的網絡密度相比于其他地區(廣西、云南、甘肅、西藏、寧夏、青海等)出現“西部高密度”的情況。這些地區的各個網絡節點信息交換頻繁,成了整個西部地區的“輿情中心”。

表2 各區域網絡密度統計
(3)距離衰減效應是地域綜合規律重要組成部分,是地理學基本規律,反映了事物或者現象的作用力隨著地理距離的增加而逐漸減小、變弱的現象。密度位居第三的是山東省,值為1.96。山東省是本文選取事件“源頭”地區,其產生的輿情“聚集”也符合了這樣的規律。考慮到各地區經濟發展水平,選取度大于1000的省份為基本節點,按其2016年第二季度人均可支配收入排序(見圖 1)。對人均GDP、信息流數目相關性檢驗,p判斷閾值取0.05,相關系數r=0.384,p=0.158,并不存在明顯相關性。節點度的數量雖總體呈現出東多西少的地域趨勢,擬合線與城市發展水平呈東向西遞減趨勢。特殊區域如政治、經濟中心以及事件發生“源頭”的局部地區,成為帶動輿情發展的“高地”,其衰減過程與經濟的地域衰減形式不同。
以省份、直轄市、特區作為單位節點,地理距離靠近的兩個節點連接性相差不大,且與外界節點聯系路徑相似。多維標度(Multidimensional Scaling,MDS)是一種將多維空間的研究對象(樣本或變量)簡化到低維空間進行定位、分析和歸類,同時又保留對象間原始關系的數據分析方法。按照各個結點間網絡連接距離與中心節點鏈接維度關系,如圖2所示。北京、上海、廣東、江蘇、安徽、山東、浙江地區所處的網絡維度相近,且節點網絡連接性最大;黑龍江、廣西、天津、河北的網絡維度相近,湖北、遼寧、江西、福建、河南網絡維度相近??梢?,在實際空間距離視角下,各地區的網絡連接性與距離東部地區的距離有一定的關系,偏遠地區如海南、云南、澳門、內蒙古、新疆、臺灣均處于獨立的最外維度的網絡節點上。
就發布量和轉發量來看,從2016年3月21日抓取數據開始,截至4月3日,北京、廣東、山東、江蘇、浙江、上海排名靠前,可見東部地區的用戶對此次公共事件的關注度較高,網絡輿情數量增長快速。
中心性是輿情網絡中傳播信息的節點的地位重要性指標,它是節點在網絡中權力的量化。當其中一個節點處于許多節點交流的路徑上時,則該節點具有控制其他兩個節點的信息傳送能力,則該節點處于重要地位。

圖1 節點所在省區經濟水平與度關系對照

圖2 整體網絡MDS關系鏈接圖
對于節點城市來說,相對介中心度越高,說明它越能在信息交流中控制其他節點,越能引導輿情方向。從分析結果看,不同的城市表現出不同的點入度和點出度(見表3),其中上海、北京分別占據出度中心和入度中心性第一的位置。上海雖然在信息傳播中做出了重要貢獻,但是并不能很好地充當信息接收者,其入度中心性沒有北京、廣州高。北京地區的中間中心度最高,相對介中心度為15.32,是整個網絡的中心。其次是上海、廣州和成都,和度中心性想比排名浮動變化不大。因此,在各個節點傳播信息中,北京、上海、廣州和成都作為控制中間節點,控制其他節點的能力最強,對整個網絡信息流的傳遞起著導向作用。

表3 城市中心性統計
事件發酵過程中,輿論話題通過節點向外傳播后得到發展,分為三個階段:潛伏期、爆發期、消退期。如圖 3所示,①潛伏期:現實社會中發生的事件能夠喚起人們的注意,形成一定的意見;②爆發期,經過傳播在一定范圍擴散開來,形成公眾意識;③消退期,在社會上產生影響,完成輿論目標,輿論次數開始下降。群體性事件中社會輿論形成的過程,基本上也經歷這樣三個階段,且在不同的階段,輿情發展的特征有很大區別。此次事件輿情發展在2016年3月17日之前處于潛伏期;3月18日至25日是爆發期,此階段輿情發展最快,公眾參與也是最多的階段;3月25日后輿論數量逐漸趨于平緩,進入了輿論消退期。

圖3 輿情發展趨勢圖
基于構建的信息網絡,對各區域形成的網絡空間按地域進行劃分。進一步分析輿情所形成的網絡體系空間特征。本文將標準出度≤3 的“弱連接”節點去掉后的節點分為4個層級。選取2016年3月17日至25日具有傳播代表信息擴散傳播的爆發期的數據,輿情過程路徑在空間上發布如圖 4所示。而中部與東部交流中,在東部內部扮演著“三分天下”重要地位的珠三角地區與中部地區聯系微弱。相比東部內部的交流(見圖 4a),上海成了中部聯系的“重心”,形成了以上海為中心向中部城市輻射現象;沈陽、北京成了北方地區的信息紐帶。東部與西部的聯系途徑大集中于北京與西部地區、成都與東部地區,(見圖 4c)原先的上海、廣州、沈陽與西部聯系微弱。(見圖 4d)中部地區內部聯系薄弱,網絡結構松散??梢姡谌珖男畔⒔涣髦?,北京處于絕對的“中心地位”,主導著全國的輿情走向。西部地區在標準出度≥3的連接性較少,此處未做出討論。
二模化網絡矩陣來源于中心性矩陣,二模網絡為我們分析“宏觀與微觀”提供了可能,并方便標識出節點派系與分組情況。信息空間中各個區域信息承載的重心不同,網絡成層聚現象不同。沿海、東部之間的信息交互緊密,參與的城市數量也比中部、西部多。將東部信息空間流按照出、入度雙向關系“二?;?見圖 5a)顯示出度節點總體上呈現出以北京、上海為核心,濟南、深圳、杭州、臨沂、青島聚集分布的現象;當北京、上海當作內部信息交互的入度結點時,其吸收能力并沒有傳播信息的能力強;作為入度節點,南京、上海、深圳、沈陽、濟南、廣州、青島對于信息的接收能力相差不大。因此在東部存在較大的出度和較小的入度差距,可以得出:東部地區網絡發揮著向外傳播的作用;這種差距主要體現在北京、上海、沈陽對中部的信息輸送。武漢、合肥、長沙、南昌、鄭州、亳州形成聚集,各個節點共同分擔中部的擴散信息。在全國尺度下,北京、上海、廣州出度明顯(見圖 5b)。

圖4 東部、中部、西部網絡聯系圖

圖5 信息空間二模網絡圖
對“山東毒疫苗”事件的輿情分析,發現微博社會空間視角下的中國等級城市有著明顯的等級關系,每個區域的信息交互過程中都有不同的中心城市。輿論網絡中的鏈接數量與城市的經濟實力、事件起源地有一定的正相關性,即存在大部分節點,城市經濟越發達,網絡鏈接度越多,相同時間段內信息交互次數也越多;存在事件發生地的鏈接度數量發生躍升,其輿情發展也比周圍地區較快。
根據節點之間鏈接度與地理分布的關系,本文發現北京、上海在全國的信息交互中不管是出度、入度還是中轉節點作用,其影響力輻射了此次事件傳播的大面積區域。同時,上海、廣州、北京分別成為東部及沿海范圍內長三角東側、珠三角地區、渤海周邊輿論集結重心,這也進一步驗證了輿論的分布、集結與城市的發展程度、經濟水平有一定的正相關。東部與中部輿情發展的信息交互中,珠三角區域影響力下降,沈陽對北方輿情的影響力加強。東部與中西部之間差距顯著,城市間出現不同的層級,與國內現有學者研究一致。
同時,本文還發現了個別城市在此次事件傳播中地域性特征明顯。廣州僅僅在東部珠三角地區影響力較大;沈陽雖然在東部地區,但是對東部輿論影響較小,對中部地區影響卻很大。北京和上海這兩個城市不管在哪個尺度上,其輿論影響都是最大,具有引導輿情發展的絕對能力。
當然,微博形成的新型社會網絡只是信息加速了輿情的發展。輿論信息交流在網絡擴散也處于互聯網初級階段,僅僅通過不同節點間單一的轉發、話題參與,大部分節點并不能如現實生活中多次頻繁交流,對現實理性的輿情影響到底有多大的比重還有待考證。但毫無疑問,網絡中的輿情發展所帶來的社會效應已經成為各個部門解決事務的參考途徑。
[1]JOHN F. The world city hypothesis[J]. Development & change,1986,17(1):69-83.
[2]CASTELLS M. The rise of the network society:volume I[J]. Cities,1996,48(2):132-134.
[3]FRIEDMANN J R.The world city hypothesis [J].Development and change,1986,17(1):59-83.
[4]巴凱斯,路紫.從地理空間到地理網絡空間的變化趨勢——兼論西方學者關于電信對地區影響的研究[J]. 地理學報,2000(01):104-111.
[5]甄峰.信息時代新空間形態研究[J]. 地理科學進展,2004(03):16-26.
[6]李響.基于社會網絡分析的長三角城市群網絡結構研究[J].城市發展研究,2011(12):80-85.
[7]唐佳,李君軼.基于微博大數據的西安國內游客日內時間分布模式研究[J].人文地理,2016(3):151-160.
[8]段淼然,陳剛,于靖,等.基于新浪微博的省域出游驅動力空間分布特征[J].地域研究與開發,2015(2):96-102.
[9]甄峰,王波,陳映雪.基于網絡社會空間的中國城市網絡特征——以新浪微博為例[J].地理學報,2012(8):1031-1043.
[10]王德忠,莊仁興.區域經濟聯系定量分析初探——以上海與蘇錫常地區經濟聯系為例[J]. 地理科學,1996(01):51-57.
[11]李響.長三角城市群經濟聯系網絡結構研究——基于社會網絡視角的分析[J].上海金融學院學報,2011(4):105-1.
[12]陳映雪,甄峰,王波,等.基于社會網絡分析的中國城市網絡信息空間結構[J].經濟地理,2013(4):56-63.
[13]王波,甄峰,席廣亮,等.基于微博用戶關系的網絡信息地理研究——以新浪微博為例[J].地理研究,2013(2):380-391.
[14]韓運榮,高順杰.微博輿論傳播模式探究[J].現代傳播:中國傳媒大學學報,2012(7):35-39.
[15]田野.基于微博平臺的事件趨勢分析及預測研究[D].武漢大學,2012.
[16]劉大均,胡靜,程紹文,等.中國旅游微博空間分布格局及影響因素——以新浪旅游微博為例[J].地理科學,2015(6):717-724.
[17]鐘杰,王海舟,王文賢.基于話題的微博信息傳播拓撲結構研究[J].信息網絡安全,2016(3):64-70.
[18]CASTELLS M. Communication,power and counter-power in the network society[J]. International journal of communication,2007,1(1).
[19]CHAN M. Social network sites and political engagement:exploring the impact of facebook connections and uses on political protest and participation[J]. Mass communication & society,2016:430-451.
[20]MELLON J,PROSSER C. Twitter and facebook are not representative of the general population:political attitudes and demographics of social media users[J]. Available at SSRN,2016.
[21]COBB N K,JACOBS M A,WILEYTO P,et al. Diffusion of an evidence-based smoking cessation intervention through facebook:a randomized controlled trial.[J]. American journal of public health,2016,106(6):1130-1135.
[22]周芳如,吳姍姍,吳晉峰,等.旅游信息微博傳播網絡結構及時空特征[J].經濟地理,2016(6):195-203.
[23]劉軍.整體網絡分析講義[M].上海:上海人民出版社,2009.
SpatialStructureandCharacteristicsofInformation-NetworkBasedonNetworkPublicOpinion
Zhao Ai,Bi Shuoben,Wang Jun,Huang Tong,Wan Lei
(School of Geography and Remote Sensing,Nanjing University of Information Science and Technology,Nanjing 210044,China)
The dissemination of internet-based information changed the previous pattern of geography,while micro-blog has formed an important platform for exchanging information. Using the method of social network analysis(SNA) and GIS visualization,this paper tries to analyze the path of information transmission in micro-blog from the perspective of geography. Eventually the results show as follows.①The spatial structure and the social economy are relatively consistent.The number of in-out degree in network is consistent with the development of the economic level,while situations of dissemination are different in certain central cities.②The space of network information has the geographical features.Those cities as center-nodes dominate the direction of public opinion in the surrounding areas,even nationwide direction.③In network,the dissemination number of public opinion is regional during the same time frame.
Network structure;Spatial characteristics;Social network analysis;Public opinion
K901
A
國家自然科學基金項目 (41271410、41071253)。
2017-01-23
趙愛(1990-),男,江蘇人,碩士研究生:研究方向:空間數據挖掘、大數據分析。
(責任編輯 沈蓉)