應雨辰+紀浩+夢非



摘要:意見領袖在社交網絡中的作用越來越大,準確識別和有效利用潛在的意見領袖對于傳播信息、引導輿論、輔助政府決策等具有重要意義。從中心性、影響力、活躍度出發,構建了網絡意見領袖識別模型,提出了采用社會網絡分析、灰色關聯分析對網絡意見領袖進行測算的理論框架,并通過“章瑩穎事件”進行實證分析。實驗結果表明,該模型能較為準確地識別出網絡意見領袖。通過觀察法發現,粉絲數量是形成意見領袖的基礎,原創帖和回復帖數量是鞏固意見領袖地位的重要因素。
關鍵詞關鍵詞:網絡意見領袖;社會網絡;灰色關聯;實證
DOIDOI:10.11907/rjdk.172410
中圖分類號:TP319
文獻標識碼:A文章編號文章編號:16727800(2017)011016305
0引言
社交網絡指由社會成員之間的相互作用形成的相對穩定的社會結構,具有復雜的網絡形態和信息動態傳播機制[1]。在社交網絡中,各節點間的地位并非對等,部分節點會對其它節點產生較大影響,能干預社交網絡的議程設置,對整個輿論發展起到關鍵導向作用,這類節點被定義為“意見領袖”(Opinion Leader)[2]。隨著互聯網的發展,在線社交成為人們日常生活的必要元素,近年來興起的自媒體更是人們結交好友、共享信息、表達觀點的重要渠道,并演變為社會輿論的放大器和熱點事件發布的主要平臺。通過網絡媒介,熱點新聞事件會迅速吸引網民關注,產生大量的交互式評論,在意見領袖的影響下,各類觀點會被逐漸引導、聚合,進而形成具有傾向性的輿論。在此背景下,對網絡意見領袖進行識別是政府部門監控輿情、引導言論、制定決策的基礎和前提。
1相關研究綜述
20世紀40年代,美國傳播學先驅拉扎斯菲爾德(Lazarsfield)在《人民的選擇》中提出“兩級傳播理論”,并在該理論中定義“意見領袖”概念,認為意見領袖是在信息傳播和人際交往中少數具有影響力的活躍分子。隨后,意見領袖的作用和意義在各領域受到廣泛認可,許多學者進行了大量研究。
1.1意見領袖內涵
早期的研究工作主要集中在意見領袖的內涵、特征、作用等層面。如Burt等[3]研究政治意見領袖的內涵和作用,認為政治意見領袖是推動變革和決策的主要力量;Coulter[4]、Myers[5]及Vernette[6]等研究了意見領袖在市場營銷領域的特征和應用;文獻[79]研究了意見領袖在創新傳播中的作用。國內學者對意見領袖的研究起步較晚,如顧品浩等[10]以突發性公共事件為例,歸納了意見領袖特征,并為政府利用意見領袖、設置議程、制定引導策略提供了建議。謝新洲等[11]研究意見領袖的形成要素、存在問題和引導能力。進入21世紀,Web2.0的迅猛發展催生了大量網絡社區,在互聯網時代下,國內外學者對于意見領袖的研究主要轉移到對“網絡意見領袖”識別和篩選方面。如Matsumura等[12]基于網民間的關注與被關注關系和評論內容進行定量研究,運用數據挖掘技術構建“意見領袖影響力擴散模型”(IDM),但實際可操性不強。高俊波等[13]采用離散數學中的圖論原理,以網絡平均路徑長度作為識別網絡論壇意見領袖的依據,但僅適合最大連通圖情況,不具通用性。Yu[14]等在圖論的基礎上對網民情感進行分析,提出利用LeaderRank算法篩選意見領袖,從而提升了意見領袖識別的準確性。與Yu[14]等人提出的LeaderRank算法相類似,Weng[15]等基于Twitter上網民的關注、評論和轉發行為,利用PageRank提出的TwitterRank算法,區分意見領袖和普通大眾。但是LeaderRank算法和TwitterRank算法實現難度較大,難以解決實際問題。另外,采用社會網絡分析原理和方法挖掘和識別意見領袖應用廣泛 [1618],這種方法的優點是指標較少、可操行較強,缺點是識別準確率較低。
1.2意見領袖識別指標體系
基于社會網絡方法的靜態指標(度中心度、接近中心度、特征向量中心度)和基于影響力以及活躍度的動態交互指標(粉絲數量、原創帖量、被轉發情況、活躍天數、用戶積分、關注量等)是較為常見的篩選意見領袖指標,如表1所示。
基于社會網絡分析原理和方法建立意見領袖識別指標是最常用的方法,從社交網絡關系結構中發現占據重要位置的節點及節點群,并將其視為有重要影響力的意見領袖[19]。常用指標包括度中心度、接近中心度和特征向量中心度。運用社會網絡分析方法識別意見領袖的優點是指標較少、計算簡便,但缺點也相對明顯,即識別準確度較低。馬寧、田雅儒[20]在社會網絡分析方法的基礎上將動態網絡分析方法(DNA)運用到意見領袖識別中,提出約50個測度指標,既包括傳統的度中心度、接近中心度等指標,也包括實際工作負載、交流/知識/資源一致度等動態網絡專有指標。王佳敏、吳鵬[21]認為意見領袖可以通過影響力和活躍度兩項指標來衡量。用戶的影響力越大,發布的信息就越能得到回應,便越有可能對其他用戶造成影響;活躍度指用戶參與特定主題討論的積極性,活躍度越高,與其他用戶形成互動越強烈,越利于觀點的傳遞。影響力通過粉絲量、被轉發量、被評論數及是否經過認證4項指標表示。活躍度通過發帖量和關注人數兩項指標表示。劉志明、劉魯[22]基于用戶影響力和用戶活躍度識別網絡中的意見領袖,和王佳敏等人的區別在于影響力和活躍度指標的選擇上。方興東等[23]在影響力和關注度基礎上,增加思想力指標來構建識別網絡意見領袖的二級模型,增加“原創比例”和“思想力”判斷指標,認為意見領袖具有獨特的思維方式和情感傾向,這是與普通大眾區別的關鍵要素。還有學者基于意見領袖的特征構建識別指標,如Shoemaker等[24]從社會背景、人口特征、個性等方面研究了意見領袖的上百個特征。Rhee等[25]采用關注度和回復量研究意見領袖特征,將網絡用戶劃分為意見領袖、注意力收集者、安靜說服者及普通大眾4類。endprint
2意見領袖識別模型
本文在綜合前人構建網絡意見領袖識別模型基礎上,將社會網絡分析(SNA)方法中的中心性指標與用戶影響力、活躍度的動態指標相結合,不僅避免了繁瑣的計算過程,而且能較為準確地反映意見領袖特征,從而提高了判斷的精確性。
2.1指標選取與模型設計
2.1.1基于社會網絡分析的指標選取
在社會網絡分析的中心性指標中,點度中心度指某一節點在其與之直接相連的鄰居節點中的中心程度,用與其相連的節點數量衡量,反映該節點在一定范圍內的中心程度[26]。推廣到社交網絡,如果博主有眾多相鄰用戶,則其具有較高的點度中心度,反之,點度中心度就低。接近中心性以距離為指標衡量某一節點與其它節點聯系的程度[26]。該節點與其它節點距離越近,就表示此節點視野更好,更了解網絡信息的產生和流向。反之,如果距離較大,則接近中心性值越低,表示該節點與其它節點的聯系越稀疏。與點度中心度和接近中心度相比,中介中心度指節點對資源的控制程度[26],反映整個社會網絡的集中程度,或者說整個網絡圍繞一個點或一組點運行的程度。在微博、天涯論壇等在線社交網絡中,如果某一用戶有較高的中介中心度,則其發布的觀點更容易影響其他網民,也較容易形成整個網絡的輿論和情感傾向。除點度中心度、接近中心度、中介中心度等指標外,社會網絡分析還包括特征向量中心度等指標,筆者認為這些指標與意見領袖關系不大,所以不選取。
2.1.2基于影響力和活躍度的指標選取
影響力反映某一用戶對其他用戶產生影響的可能性[21]。在微博、天涯論壇等平臺,體現意見領袖影響力的指標分別是粉絲數量和點擊次數。其中,粉絲數量是判斷用戶影響力最直接的依據,用戶擁有的粉絲數量和用戶被關注的程度成正比,即粉絲數量越多代表用戶有更高的關注度,發布的消息也就越有可能被更多的用戶接收到,從而能夠潛在影響消息發布后的評論、討論等行為。點擊次數也能反映影響力,點擊次數越高,用戶對發布消息的關注和認可度越高,這種認可會激發后續的轉發行為。微博、天涯論壇等社區的轉發行為以“信息級聯”方式進行傳播,能快速產生連鎖式影響[22]。
活躍度表示某一用戶參與特定事件的積極性[21]。如用戶僅具備高影響力而不積極參與熱點事件的發言、討論,則不會成為意見領袖。所以,筆者將原創帖數量、回復帖數量作為直接反映意見領袖活躍度指標。如果粉絲數量是形成意見領袖的基礎,那么原創帖則可稱之為意見領袖形成的必要條件。原創帖數量的高低不僅代表意見領袖參與熱點事件的積極程度,也是其思考力和價值觀的體現。意見領袖通過原創帖傳達自己的思想和觀點,進而改變大眾對某一事件的認知,最終形成傾向于意見領袖態度的輿論。而回復帖則反映意見領袖同大眾溝通的積極性,通過積極的回復,意見領袖所表達的具有傾向性的觀點會得到強化,鞏固其意見領袖地位。網絡意見領袖識別模型見圖1。
3實證分析與檢驗
2017年6月9日,一則“中國訪美女碩士章瑩穎失聯數十天的消息”被披露,隨后各大媒體對此進行了報道。一時間,大量網民就“章瑩穎失聯遭綁架”的消息表達了自己的看法,網民之間展開了激烈討論,直到一個月后的7月12日,該事件仍在不斷發酵。
3.1實驗數據獲取與處理
本實驗以“章瑩穎、女碩士、訪美學者、失聯、遭綁架”為關鍵詞,以全球最大的華人論壇“天涯社區”為數據抓取平臺,通過爬蟲軟件SoukeyNetget獲取自事件發生后所有的相關數據。截止到7月12日,共采集10 686條原創帖,包括230位天涯社區用戶和10萬余條回復信息,獲取每位用戶的粉絲數量、主帖數量、點擊次數、積分、登錄次數、最新登錄時間、發帖時間等數據。為便于后續實驗,按照表2的格式對數據進一步處理。
3.2實驗結果
3.2.1關聯系數計算
基于SNA計算用戶的點度中心度、接近中心度和中介中心度,同時根據抓取到的數據計算用戶影響力和活躍度對應的指標值。根據灰色關聯分析法(定義一)設定理想化意見領袖序列作為本實驗的參考序列。設定理想意見領袖的參考序列標準值為:x0={1.000,1.000,1.000,1.000,1.000,1.000,1.000}。根據關聯系數計算公式得到各指標間的關聯系數值。部分數據見表3。
3.2.2關聯度計算
根據關聯度計算公式測算關聯度,即γi=17[εi(1)+εi(2)+…+εi(7)],其中i的取值對應用戶數量。在本實驗中,i為1~230中所有的正整數。根據計算結果,選取關聯度值較高的10位用戶,如表4所示。
3.2.3社會網絡可視化展現
將用戶間的互動關系數據導入Ucinet軟件,經NetDraw可視化工具處理后得到網絡結構圖,對中心性值較高的節點進行篩選,得到圖2所示結果。
圖2社會網絡層意見領袖識別結果
3.3實驗結果分析
從天涯社區獲取本文實驗中關聯度值排前10名的節點數據,整理如表5所示。
(1)對表5數據進行分析,得到以下兩點信息:①關聯度排名靠前的用戶一般擁有規模龐大的粉絲群體,說明粉絲數量是形成網絡意見領袖的前提條件,但并非充要條件。因為排名第一的X36粉絲數量并不是最多,同樣,排名末位的X85粉絲數量也不是最少;②相對于粉絲數量,原創帖量和回復帖量是形成意見領袖更為關鍵的因素。從表5很容易發現原創帖量的排序恰好對應用戶關聯度值的排序,雖然回復帖量的排序未顯示出與原創帖量一樣的整齊狀態,卻僅是少數節點出現偏差。鑒于上述兩點,筆者認為,意見領袖的形成更多地依賴自身素質,即意見領袖通常有著豐富的經歷、專攻的術業、熱衷于時事,并且對事物的發展規律有深刻認知。意見領袖的言論和態度往往能夠獲得人們的認同,并依靠規模龐大的粉絲群體在短時間內形成傾向性輿論。endprint
(2)圖2所示的社會網絡結構直觀展現了中心性較高的節點。從圖中不難發現本文實驗有7個節點處于各個集群的中央,分別是X9、X11、X16、X19、X27、X36和X168,而其中的5個節點(X9、X11、X27、X36、X168)同時以高關聯度出現在表4中,這一現象說明以關聯度值來識別意見領袖的可取性,同時也表明本模型的7個指標對于識別意見領袖的準確性,說明灰色關聯分析法在篩選意見領袖領域的適用性。本文實驗共有研究對象230個,最終確定5名意見領袖,占比為2.17%,這一結果顯示出意見領袖的稀缺性,與“意見領袖”的內涵一致,從側面反映出本模型對意見領袖識別的準確性。此外,表5中的“登錄次數”指標未納入意見領袖識別模型,但可將其列為驗證性變量,即通過觀察登錄次數檢驗意見領袖在一段時間的活躍程度,該指標可作為一個重要信息。本文實驗中意見領袖的登錄次數均在500次以上,處于較高水平。
4結語
網絡意見領袖作為影響網絡態勢發展的關鍵節點,在傳播信息和引導輿情方面起著越來越重要的作用。因此,準確識別網絡意見領袖并加以引導,對凈化網絡環境、輔助政府決策具有重大意義。
本文通過3個方面、7項指標構建出網絡意見領袖識別模型,創新性地將灰色關聯分析作為計算意見領袖指標值的方法,結合網絡結構可視化研究,進一步提升了意見領袖識別的準確性。本模型在設計時遵循以下3大原則:①繼承性。通過系統的文獻梳理與深入分析,本文選取之前研究中使用率最高的識別指標,保證了指標的可靠性和公認性;②科學性。借助灰色關聯分析的計算方法和社會網絡分析的基本原理測算指標值,并通過NetDraw可視化網絡分析軟件繪制社交網絡圖,使判斷結果更加直觀;③可操作性。本模型的3個中心性指標值(點度中心度、接近中心度、中介中心度)均通過公式計算得到,4個交互性指標值(粉絲數量、點擊數量、原創帖量、回復帖量)均通過爬蟲程序直接采集。
運用上述模型實證分析“章瑩穎事件”,發現意見領袖均具有相當規模的粉絲,但粉絲數量僅是形成網絡意見領袖的必要非充分條件,重要的是網絡意見領袖要具有一定的知識背景,經常更新原創性文章,喜歡與網民進行互動且具批判性思維,能在突發事件中對公眾的觀點和態度進行干涉,形成具有傾向性的輿論。今后的研究主要考慮能否在本識別模型基礎上增加情感分析算法,按照“正面”、“中性”、“負面”或更多的情感,對意見領袖進行分類,研究攜帶哪種情感的意見領袖會達成信息傳播的最大化。
參考文獻參考文獻:
[1]ANDREASSEN C S. Online social network site addiction: a comprehensive review[J]. Current Addiction Reports,2015,2(2):175184.
[2]ZHANG W, LI X, HE H, et al. Identifying network public opinion leaders based on Markov logic networks[J]. The Scientific World Journal,2014(4):18.
[3]BURT R S. The social capital of opinion leaders[J]. Annals of the American Academy of Political & Social Science,1999,566(1):3754.
[4]COULTER R A, FEICK L F, PRICE L L. Changing faces: cosmetics opinion leadership among women in the new Hungary[J]. European Journal of Marketing,2002,36(11/12):12871308.
[5]MYERS J H, ROBERTSON T S. Dimensions of opinion leadership[J]. Journal of Marketing Research,1972,9(1):4146.
[6]RIC VERNETTE. Targeting women's clothing fashion opinion leaders in media, planning: an application for magazines[J]. Journal of Advertising Research,2004,44(1):90107.
[7]ROGERS E M. Diffusion of innovations[J]. Journal of Continuing Education in the Health Professions,2010,17(1):6264.
[8]GREENHALGH, TRISHA, ROBERT, et al. Diffusion of innovations in service organizations: systematic review and recommendations[J]. Milbank Quarterly,2004,82(4):581629.
[9]VALENTE T W. Network models of the diffusion of innovations[J]. Computational & Mathematical Organization Theory,1996,2(2):163164.
[10]顧品浩,蔣冠.突發性公共事件中的網絡意見領袖分析——以“楊達才事件”為例[J].情報雜志,2013,32(5):2024.endprint
[11]謝新洲,杜智濤.網絡意見領袖輿論引導能力的評判體系研究——基于灰色統計與層次分析法的模型構建[J].圖書情報工作,2013,57(15):2026.
[12]MATSUMURA N, OHSAWA Y, ISHIZUKA M. Influence diffusion model in textbased communication[J]. Transactions of the Japanese Society for Artificial Intelligence,2002,17(3):259267.
[13]高俊波,楊靜.在線論壇中的意見領袖分析[J].電子科技大學學報,2007,36(6):12491252.
[14]YU X, WEI X, LIN X. Algorithms of BBS opinion leader mining based on sentiment analysis[C].International Conference on Web Information Systems and Mining. SpringerVerlag,2010:360369.
[15]WENG J, LIM E P, JIANG J, et al. TwitterRank: finding topicsensitive influential twitterers[C].ACM International Conference on Web Search and Data Mining. ACM,2010:261270.
[16]陳遠,劉欣宇.基于社會網絡分析的意見領袖識別研究[J].情報科學,2015(4):1319.
[17]王紅瑞.基于社會網絡分析法的微博空間意見領袖識別模型[J].新聞世界,2013(4):219221.
[18]王迪,何躍.基于社會網絡分析的意見領袖網結構[J].統計與信息論壇,2013,28(10):8489.
[19]Z G ZHU. Discovering the influential users oriented to viral marketing based on online social networks [J]. Physica A:Statistical Mechanics and its Applications,2013(392):34593469.
[20]馬寧,田儒雅,劉怡君,等.基于動態網絡分析(DNA)的意見領袖識別研究[J].科研管理,2014,35(8):8392.
[21]王佳敏,吳鵬,陳芬,等.突發事件中意見領袖的識別和影響力實證研究[J].情報學報,2016,35(2):169176.
[22]劉志明,劉魯.微博網絡輿情中的意見領袖識別及分析[J].系統工程,2011(6):816.
[23]方興東,葉秀敏.微博意見領袖的評價研究[J].新聞界,2014(5):5660.
[24]SHOEMAKER, FLOYD F. Communication of innovations[M]. Free Press, 1971.
[25]RHEE JW,EM KIM,H KIM.Exploring online opinion leadership: a validity test of the concept in the digital age[J]. Physica A:Statistical Mechanics and its Applications,2007(392):34503461.
[26]約翰·斯科特.社會網絡分析法[M].重慶:重慶大學出版社,2016.
[27]曹明霞.灰色關聯分析模型及其應用的研究[D].南京:南京航空航天大學,2007.
[28]LOMAS J. Opinion leaders vs audit feedback to implement practice guidelinesreply[J]. Jama the Journal of the American Medical Association,1991,266(9):12171218.
責任編輯(責任編輯:杜能鋼)endprint