王小紅(陜西省委黨校 陜西 西安 710061)
基于SNA的微博輿情傳播核心節點分析研究
王小紅
(陜西省委黨校 陜西 西安710061)
負面網絡輿情對社會穩定具有危害性,因此為了引導輿情良性發展,快速找到網絡輿情傳播中的核心節點是非常重要的。文中以社會網絡分析為基礎,通過對微博信息和微博用戶網絡結構進行分析,提出一種新穎的網絡成員重要度評價算法。給出了節點粉絲影響度的概念,并對節點粉絲影響度中心度算法進行了改進。實驗分析顯示,文中算法排序精度在整體上高于SNA算法,因而對準確預測微博輿情傳播中的核心節點具有很好的參考價值。
社會網絡分析;微博;輿情;核心節點
網絡輿情(Network Public opinion)是指在互聯網上流行的對社會問題不同看法的網絡輿論,是社會輿論的一種表現形式,是通過互聯網傳播的公眾對現實生活中某些熱點、焦點問題所持有的較強影響力、傾向性的言論和觀點[1]。網絡開放、便捷、交互為網民營造了良好的交流模式,但負面輿情如洪水,嚴重影響居民生活和社會穩定。為了減少危害信息對社會穩定的影響,輿情研究、特別是對輿情傳播中核心主體的研究迫在眉睫。
網絡輿情一般發源于博客、BBS論壇、新聞跟帖、轉貼、新聞論壇、微博等。微博即時、簡潔且可通過多種途徑登陸,深得大眾喜愛。各社會團體、地方政府、企業、名人都在微博上有自己的陣地,且粉絲眾多,其輿情傳播影響力巨大。因此,對其輿情傳播主體研究具有很重要的現實意義[2]。
為了很快找到微博輿情傳播主體中的核心節點。傳統社會網絡分析方法,它根據某節點的鏈入節點數來判斷該節點的重要程度。然而粉絲數可以通過金錢買賣圈到,水軍和僵尸粉的存在使得分析得到的重要節點往往和真實情況有很大偏差。要克服這一缺陷,更加高效找出微博中的核心節點,進而找到重要網絡成員,就必須對原有算法進行改進。
社會網絡分析[3](Social Network Analysis,SNA)是20世紀30年代由英國著名人類學家布朗在對物理學適應性網絡結構進行研究時提出的。它對心理學,情報學,信息檢索,社會學等多個領域的發展研究都起著舉足輕重的作用。現實中個體與個體之間的關系強弱不一,這種關系映射在網絡中,會產生不同的影響。
社會網絡分析融合了圖論、數學、統計等多學科,已經發展成綜合性結構化方法。利用社會網絡分析法可以從多個角度對個體網絡行為分析,比如網絡位置、角色、結構參數、凝聚子群等進行分析。目前,社會網絡分析法已被多行業采納。
社會網絡主要由行動者 (Actor),關系紐帶(Relational Tie),二人組(Dyad),3人組(Triad),子群(Subgroup),群體(Group)這些元素構成[3]。行動者指社會個體,可以是一個人、一個團體、一個組織、或是一個國家,在網絡中用節點(Node)表示 ;關系紐帶指社會個體之間的關系,在網絡中用節點之間的連線表示,是多種多樣的,如血緣關系、工作關系、競爭關系等;二人組是僅由兩個節點組成,是社會網絡分析的基礎;3人組由3個節點組成;子群是社會個體之間某些相互關聯節點的子集;群體是整個社會網絡中社會個體的集合。
社會網絡分析(Social Network Analysis)是一種獨立、結構化的研究方法,主要研究社會網絡中個體及個體的關系、網絡結構、連接模式,以此來反應某個節點在整個網絡中的作用或是整個社會網絡之間的關系。
文中主要分析節點的重要度,點度中心度指某節點和其他節點直接關聯越多代表其重要度越高,其在網絡中處于核心地位的機率就越大。在無向圖中,點度中心度由節點的度決定,在有向圖中,點度中心度又被分為外向點度中心度和內向點度中心度,分別由節點的入度和出度決定[4]。
網絡的核心成員一般來自網絡中的意見領袖或者網絡大V,他們的言論風向作用明顯,極易影響網絡團體中其它成員的思想,并對言論傳播速度影響極大[5-6]。因此,可以通過意見領袖的言論,使網絡輿情向積極的方向發展,所以準確的找到網絡核心成員也變得非常重要。
3.1系統總體流程
該系統總體框架如圖1所示。

圖1 系統總體流程圖
網絡構建部分完成樣本選取,基礎圖構建(節點代表用戶,節點間的關系表示用戶之間關注與被關注),擴展圖構建(為了更精確研究基礎圖中的主體,引入其它用戶節點后構建的圖)。基礎圖和擴展圖的構建好之后,將表結構存入關系數據庫中,為數據采集部分將采集數據存入數據庫中做好準備。
數據采集部分:首先由爬蟲獲取頁面,包括新浪微博登陸及其之后的數據訪問;然后頁面分析模塊對爬取結果進行分析,提取出需要的數據并存入數據庫。
網絡核心成員的發現與研究部分:在點度中心度研究分析的基礎上,提出基于粉絲影響度的網絡成員重要度評價算法。該算法核心是對節點屬性值,粉絲影響度值以及節點重要度的判定標準,最后根據節點重要度值來判定圖中節點的重要程度,重要度越高,則越有可能為網絡中的核心成員。
3.2基于粉絲影響度的微博成員重要度評價算法
點度中心度算法用節點的入度數表示該節點在網絡中的重要程度[7]。但在微博實際使用中,節點入度數并不能真實反映此節點是否為真實的核心節點。因為雖然一個節點擁有很多粉絲,可它極有可能是花錢買來的僵尸粉,而另外一個節點可能只有一個粉絲,但這個粉絲節點是網絡大V,擁有上千、上萬個粉絲[8-10]。所以,一個影響力高的粉絲的節點,一定比擁有許多僵尸粉的節點的重要度高更多。通過分析微博特性可以看出只是用節點的入度來決定一個節點重要度的高低,很不合理,文中提出的節點的重要度,不僅僅由指向它的節點的數量來決定,而是由指向它的節點的粉絲影響度來決定,此法更適合于從微博中尋找網絡核心成員[11-12]。
3.2.1節點屬性值
1)節點絕對屬性值
節點自身的絕對屬性值是由轉發,評論和點贊3個屬性共同決定的[13]:

代表平均轉發量,數值越高表明此微博被擴散機率大,節點重要度高。

代表平均被評論量,數值越高表明此微博成為輿論焦點的幾率越大,博主地位更核心。

代表平均被點贊數,數值越大表明該微博成為正面輿論焦點的機率越大,博主地位越核心。
w1代表節點i平均被轉發量的權重,w2代表節點i平均被評論量的權重,w3代表節點i平均被點贊量的權重(w1>w2>w3)。
2)節點相對屬性值
對節點的絕對屬性值進行歸一化,得到節點相對屬性值:

其中,Attr(ni)′為節點i的相對屬性值,p為擴展圖中所有節點的個數。
3.2.2節點的粉絲影響度
通過前面研究發現,一個節點是否為核心節點,不僅由粉絲數量決定,而是由粉絲的屬性值確定。節點的粉絲影響度由自己所有粉絲節點的相對屬性值決定:

其中,Imp(ni)為節點i的粉絲影響度值,Attr(nj)′為節點i的第j個粉絲節點的相對屬性值,|fansi|為節點i的全部粉絲數。
3.2.3節點的重要度
基礎圖中,節點的重要度由關注自己的節點的粉絲影響度決定。
1)節點的絕對重要度:

其中,Sig(ni)為節點的絕對重要度,|focusi|為基礎圖中指向(關注)節點i的節點數,Imp(nj)為節點i在基礎圖中第j個關注者(粉絲)的粉絲影響度。
2)節點的相對重要度:

其中,Sig(ni)′為節點i的相對重要度,Sig(ni)為節點i的絕對重要度,Imp(nj)為節點j的粉絲影響度,j∈[1,m],m為基礎圖節點的個數。
文中實驗樣本為某大學計算機技術工碩40位同學在兩天內的新浪微博作為研究對象。分別用基于粉絲影響度的網絡成員重要度評價算法和社會網絡分析的點度中心度算法對實驗數據進行排序,結果發現:社會網絡分析算法進行的排序結果,40位員工并列到24名便結束,很不合實際情況。而本文算法排序結果比較有序,并列的名次只有4個,這種情況也更加的符合實際情況。每次選取排名前n的用戶節點進行比較,n∈(3,25)。排序精度比較結果如圖2所示。可以看出本文算法排序精度在整體上高于SNA算法。兩種算法時間排序復雜度實驗結果表明,文中方法時間消耗只有0.5 s。綜合來看,文中方法在整體排序效果上有著比較明顯的優勢,具有很高的實用價值。

圖2 兩種算法排序精度對比
網絡時代,為引導輿情良性發展,需要快速準確找到微博輿情傳播主體中的核心節點,文中算法克服了點度中心度算法缺陷,從更高的信息層面來分析節點的重要度,使分析結果更加準確且符合實際情況。實驗結果顯示,文中方法在一定程度上使節點的重要度值更加精確。目前,該方法對簡單的微博團體中核心用戶預測具有很好的實用價值,對網絡輿論良性化有一定的現實意義。
[1]網絡輿情定義[EB/OL].http://baike.baidu.com/view/2143779. htm.
[2]袁園,孫霄凌,朱慶華.微博用戶關注興趣的社會網絡分析[J].現代圖書情報技術,2012,28(2):60-75.
[3]社會網絡分析定義 [EB/OL].https://en.wikipedia.org/wiki/ Social_network_analysis.
[4]平亮,宗利永.基于社會網絡中心性分析的微博信息傳播研究——以Sina微博為例[J].圖書情報知識,2010(6):90-95.
[5]王曉光.博客社區內的互動交流結構:基于評論行為的實證研究[J].新聞與傳播研究,2010(4):45-58.
[6]袁園,孫霄凌,朱慶華.微博用戶關注興趣的社會網絡分析[J].現代圖書情報技術,2012,28(2):66-73.
[7]麥藝華.面向中文微博的社會網絡分析及應用[D].廣東:華南理工大學,2012.
[8]宋恩梅,左慧慧.新浪微博中的 “權威”與 “人氣”:以社會網絡分析為方法[J].圖書情報知識,2012(3):40-55.
[9]劉志明,劉魯.微博網絡輿情中的意見領袖識別及分析[J].系統工程,2011,29(6):6-17.
[10]夏雨禾.微博互動的結構與機制——基于對新浪微博的實證研究[J].新聞與傳播研究,2010(4):55-67.
[11]楊小朋,何躍.騰訊微博用戶的特征分析[J].情報雜志,2012(3):80-87.
[12]陸毅.微博社會網絡構造與分析技術研究[D].上海:復旦大學,2011.
[13]康書龍.基于用戶行為及關系的社交網絡節點影響力評價[D].北京:北京郵電大學,2011.
Based on SNA microblogging public opinion transmission core node analysis
WANG Xiao-hong
(Shaanxi Provincial Party School of the CPC,Xi’an 710061,China)
Negative public sentiment is harmful to social stability,so it is important to quickly find core nodes in public sentiment communication network for guiding the benign development of public sentiment.In this paper,a novel algorithm for evaluating the significance of network members is proposed by analyzing micro-blogs and the user structure residing in them based on social network analysis(SNA).The concept of fans'influence of a node is defined,and the node centrality algorithm is also improved for fans'influence.The experiments show that the algorithm proposed in this paper overall has more precise sorting than the traditional SNA algorithm,and therefore has a promising potential for predicting core members in public sentiment communication network.
SNA;micro-blog;public sentiment;central node
TN302
A
1674-6236(2016)11-0001-03
2016-01-27稿件編號:201601247
國家自然科學基金項目(61372184)
王小紅(1975—),女,陜西寶雞人,講師。研究方向:數據挖掘與知識工程。