張鑫 劉鑫雅 張雅文



摘要:對網絡輿情的有效識別,可為網絡生態健康和網絡社會治理提供重要支持。對國內已有網絡輿情識別的相關研究展開梳理,通過對其發展脈絡、核心主題與方法、主要研究力量以及發展趨勢等方面進行分析、闡釋,以期為未來研究和實踐工作提供參考借鑒。
關鍵詞:網絡輿情;輿情識別;研究進展
中圖分類號:G203 文獻標識碼:A
DOI:10.13897/j.cnki.hbkjty.2021.0054
0 引言
近年來,國內外一些對社會影響較大或涉及大眾敏感因素的事件,往往容易引發網民關注,進而形成網絡輿情。隨著在線社區、微博、微信等社會化媒體的快速發展及移動終端的逐漸普及,網絡輿情呈現出諸如輿情擴散加劇、情感極化突出、傳播路徑多樣、主題演變多元等復雜特征,其對網絡生態健康發展及網絡社會治理提出了較大挑戰。
對網絡輿情的發展進行及時、有效識別可以從初期對輿情態勢進行監測、了解、干預以及疏導,有助于為相關部門工作決策提供理論和數據支持。近年來,輿情識別受到學界的特別關注并涌現出一大批研究成果,其對具體輿情治理工作實踐也做出較大貢獻。本研究對已有研究進行了系統梳理,通過對我國網絡輿情識別的發展脈絡、核心主題與方法、主要研究力量進行分析、闡釋,一方面對已有研究進行全貌概覽,以為后期相關研究和實踐工作提供基礎支持;另一方面,從若干維度對輿情識別已有貢獻進行分析,以探究需要進一步拓展的領域和未來研究的趨勢。
1 網絡輿情識別的研究脈絡
1.1 研究的發文趨勢
在“中國知網”以“網絡”“輿情”“識別”為檢索詞,搜索CSSCI來源論文文獻,共檢索出185篇研究成果。對文章發表時間進行統計不難發現,隨著移動互聯網及社交媒體的發展,網絡輿情事件不斷增多,我國有關網絡輿情識別的研究呈現明顯遞增趨勢,而“輿情識別”作為其中重要研究問題之一自2008年起逐漸引起學者們的關注,并在2019-2020年達到頂峰,如圖1所示。這在一定程度上體現我國網絡輿情的學術研究來源于社會實踐領域的集中點和關注點,社會環境、技術環境以及網絡空間不斷變化的動態為輿情識別的研究提供了演化發展的動力。
1.2 研究的所屬學科
對所屬學科進行統計發現,輿情識別核心研究成果較多見于新聞傳播學、計算機科學、圖書情報與檔案管理、社會學、公共管理、控制工程等學科領域,具體如圖2所示。考慮到輿情識別貫穿整個輿情分析與治理過程,并涉及多學科的核心研究問題,所屬學科的研究者們基于不同視角、理論、方法和技術等對輿情識別展開基于實踐需求的多維度探究與規律揭示。
1.3 研究的主題演化
輿情識別相關研究在多學科領域不斷推動的過程中,還體現出不同時序基礎上主題特征的差異性。本研究基于185篇來源文獻的關鍵詞,通過預處理,利用Citespace可視化面板“Control Panel”生成基于時序的主題變化趨勢時區圖“TimezoneView”,如圖3所示。可以看出,輿情識別以“網絡輿情”為初始核心研究范疇,第一階段主要是整體輿情的識別和相關對策研究;在此基礎上,“情感分析”和“突發事件”作為兩大重點突破主題被研究者演繹為高價值研究主題;隨之,“社交網絡”“微博”“意見領袖”作為輿情識別的重要陣地和核心要素也得到研究者們重點關注,此時輿情分析的創新性、數據化、嚴謹性等被進一步發展;2015年左右,研究者們對“風險識別”和“關鍵節點”更為關注,認為輿情識別還要考慮輿情風險的識別和把控,而“關鍵節點”作為“意見領袖”在網絡空間中量化和可視化研究的操作要素,也得到了進一步拓展;2016-2018年,隨著研究的不斷深入和方法的不斷創新,對文本、聲音、圖片、視頻等多媒體形態的輿情識別有研究的迫切性與可行性,一方面分類識別和主題識別等不同研究范式均得到較為明顯的推進,另一方面社會網絡分析、灰色關聯分析、卷積神經網絡等不同方向的技術方法均得到更深層次的測量與驗證。近兩年來,相關研究對輿情識別的邊界范疇有了新的突破,從知識構建、大數據監測、區塊鏈、可視化等技術范式和應用場景方面做出了較大貢獻。
2 網絡輿情識別的核心主題與方法
本研究利用citespace對所有來源文獻的關鍵詞進行共現分析及初始簇聚類,本文在此基礎上進一步分析歸納,發現研究者們主要圍繞基于事件階段的網絡輿情識別、基于關鍵節點的網絡輿情識別、基于觀點主題的網絡輿情識別以及基于情感的網絡輿情識別等不同維度,同時提出和探討了多種識別方法技術。
2.1 基于事件階段的網絡輿情識別
網絡輿情是特定社會事件發生和演化的重要信息載體。已有研究多是基于生命周期理論,將網絡輿情的傳播演化過程大致分為三至五個階段,如分為成長期、爆發期、衰退期和平緩期這幾個階段[1],并認為可以基于傳播規律、信息特征、評估體系和發展路徑等對網絡輿情的不同階段進行有效識別,以此作為特定階段輿情治理的參考依據。如陳婷等[2]提出了網絡輿情在論壇中的傳播演化模型,通過仿真實驗發現用戶發帖量、發帖增量以及發帖增長率可有效揭示網絡輿情發展的時段規律,并分析了政府最佳干預點的選擇及工作流程。李綱等[3]以自然災害事件為例,提出一種融合主題詞共現和社區發現的輿情識別、測量和演化的研究分析框架,發現災難的不同階段,用戶的話題關注傾向存在較大差別。
近年來,隨著網絡輿情發展過程中出現的復雜狀態,一些學者進一步討論了網絡輿情的衍生、反復等階段的識別方法與治理對策。如安璐和李倩[4]基于word2vec模型、K-means聚類算法的主題識別以及基于H指數的影響力計算,建立了突發事件衍生事件的判定規則與測量方法,其有助于相關部門動態識別和掌握突發事件衍生事件的發展。張鑫等[5]構建了面向反復性事件的網絡輿情風險識別與評估指標體系,并剖析了輿情反復階段與其他階段相比在輿情主體、輿情客體、關鍵傳播節點等不同方面的異同。
2.2 基于關鍵節點的網絡輿情識別
網絡輿情中的“關鍵節點”指在網絡空間用戶交互過程中具有重要影響力的信息傳輸中介,其與輿情傳播中的“意見領袖”對應。通過對關鍵節點進行準確識別,可以有效提升網絡輿情引導的針對性與高效性[6]。網絡輿情中關鍵節點識別方法主要包括網絡結構、鏈接關系、綜合指標體系以及傳播影響力四種思路。
從網絡結構視角來看,已有研究往往利用社會網絡分析方法中的點度中心度、中間中心度和接近中心度等指標來識別關鍵節點。陳遠等[7]探究了社交網絡結構中節點的結構位置及相互關系,通過結構位置、中心度位置和邊緣位置對網絡社區中關鍵節點進行了有效識別。譚雪晗等[8]以重大事故災難為例來分析信息傳播網絡拓撲結構,探究事故災難輿情在網絡結構中的相似性,進而篩選出輿情中的關鍵信息發布者和關鍵事件關注者,并提出以關鍵節點為中心的事故災難輿情治理策略。
從鏈接關系來看,前期一些研究關注了節點間的鏈接關系以及影響強度來判斷和挑選出最體現特征的關鍵節點,主要包括PageRank算法以及其基礎上的TwitterRank、WeiboRank、LeaderRank。如王曰芬等[9]構建了微博輿情社會網絡,運用改進的PageRank算法對網絡輿情事件中的關鍵節點進行識別與評估,并通過實驗證明了算法的有效性。曹學燕等[10]通過彩玉Leader Rank等算法和軟件,對網絡輿情數據進行結構化、節點影響力測算與識別、關鍵節點分類等,揭示出網絡輿情的結構復雜性、無標度性、子社區結構等特征,并得到“網絡名人型”和“事件關注型”兩類關鍵節點的演化規律。
從綜合指標體系來看,研究者們主要利用層次分析法、主成分分析法等對網絡社區中用戶的發帖量、粉絲數、評論數、點贊數、被提及數等要素構建混合加權指標體系,以識別出網絡空間的關鍵節點。彭麗徽等[11]基于社會網絡和內容要素融合構建了關鍵節點識別的綜合指標體系,其中內容要素指標包括活躍度、影響度、認同度和擴散度。
從傳播影響力來看,前期研究聚焦網絡社區中傳播的影響范圍和影響強度來測量和識別關鍵節點,具體包括影響力綜合評價法、信息熵檢驗評價指標體系、影響力擴散概率模型、影響力衡量模型等算法,其可兼顧信息交互關系網絡的結構特征和動態特征,其度量方法的科學性和可信性也較明顯[12]。如朱志國等[13]從用戶的靜態網絡結構特征與動態信息交互兩個維度切入,基于熵權灰色關聯方法建立用戶影響力測度指標體系,以此識別重大突發輿情的意見領袖。
2.3 基于觀點主題的網絡輿情識別
觀點主題識別是指通過一系列技術方法從海量輿情數據中獲取網民主體對特定輿情事件的主要態度或觀點[14]。當前處理網絡社區中非結構化輿情文本數據的方法,主要為以自然語言處理、數理統計分析以及機器學習等為基礎,通過創新的文本挖掘方法描述和識別輿情觀點句或觀點詞,其采用的主要思路方法通常為文本聚類和主題模型兩類。
文本聚類作為一種無監督的機器學習方法,主要采用k-means、SVM、貝葉斯網絡等算法將文本特征數據進行聚類,從而對輿情熱點主題或觀點進行劃分,具有較好的靈活性和自動處理能力[15]。如王旭仁等[16]提出了基于向量空間模SVM的文本聚類算法,其按照層次聚類自下而上得到獲取初始簇信息,并依據K-means算將相似度閾合并、產生設置簇。田世海等[17]融合網絡表示學習與K-means算法,通過事件文本收集、共現頻率分析、降維映射以及聚類分析幾個階段進行輿情聚類識別。
主題模型是基于概率統計與機器學習的方法,從海量輿情信息中提取貢獻度高的、反映用戶觀點特征的輿情熱點話題挖掘方法,其中最有代表性的模型為隱含狄利克雷分布模型( Latent Dirichlet Allocation,LDA),即使用文檔——詞語矩陣進行訓練,得到詞語——主題矩陣與文檔——主題矩陣,進而識別文檔屬于特定話題的概率。陳曉美等[18]運用多文檔摘要技術和基于句子的LDA主題模型算法,揭示網絡輿情的核心主題和觀點。姚兆旭和馬靜[19]基于LDA 模型和改進的TF-IDF算法構建主題特征詞向量, 基于相似度計算自動抽取主題詞匯鏈,并利用情感詞典進行主題觀點詞的抽取。
2.4 基于情感的網絡輿情識別
網絡輿情的情感識別與分析,指對海量輿情數據的挖掘與處理,并在此基礎上的詞性分析以及情感識別,主要包括網絡輿情文本共性詞、極性詞等的語義分析、詞性分析以及情感傾向識別。如劉志明和劉魯[21]基于Aging theory模型、微博主題檢測和情感分析技術,構建了面向輿情事件的微博用戶負面情緒識別和預警模型。李彤和宋之杰[20]通過將突發事件相關微博進行情感分析和集成,形成微博情感時間序列,來有效識別和預測特定事件中網民情感以及發展趨勢。丁晟春等[22]基于心理學理論與自然語言處理方法,將微博文本的情緒劃分為樂、怒、哀、惡、懼五類,用情感特征、句式特征、句間特征來進一步表征,并基于SVM模型構建了微博情緒分類模型,以此來識別網絡輿情事件中廣大網民的情緒態度。
3 網絡輿情識別的主要研究力量
隨著網絡輿情識別的理論緊迫性與實踐重要性不斷凸顯,近年來,相關研究也形成較穩定的研究機構與主要貢獻者,許多研究基于專門的輿情研究中心或各級研究課題項目,在推動創新成果方面發揮著重要價值。本文從主要研究機構、研究人員與高被引文獻三個層面對我國網絡輿情識別研究進行量化分析。
3.1 輿情識別研究的主要研究機構
本研究對我國網絡輿情識別研究的發文量進行統計分析,發現排名前10位的研究機構為吉林大學、武漢大學、南京理工大學、中山大學、華中科技大學、中國科學院大學、武漢理工大學、中國人民警察大學、華中師范大學、清華大學。在此基礎上運用Citespace進行研究機構合作網絡分析,發現武漢大學信息管理學院占據主要地位,如圖4所示。
由數據不難發現,國內學者關于網絡輿情識別的主要力量集中在高校,如吉林大學管理學院、武漢大學信息管理學院、南京理工大學經濟管理學院、華中師范大學信息管理學以及合肥工業大學管理學院等,“雙一流”建設高校占據較大比例,這一定程度上說明網絡輿情識別得到我國主流高等教育機構與研究力量的認同。同時,還有數量較多的研究所、研究中心、創新基地、實驗室等科研機構對網絡輿情識別也較為關注,其往往基于本機構目標任務或研究使命,或獨立進行相關科學研究并產出較多研究成果,或與高校力量進行密切合作,形成相對穩定、成熟的學術共同體,展開多領域、縱深化的研究。
3.2 輿情識別研究的主要研究者
本研究對我國網絡輿情識別的作者發文量進行統計,發現該領域前十位核心作者分別為黃微、李綱、曹樹金、王曰芬、陳憶金、吳鵬、毛進、蘭月新、王晰巍、夏一雪、謝海濤、安璐等。進一步發現,研究者們基于國家自然科學基金、國家社會科學基金、教育部人文社會科學研究項目、中央高校基本科研業務費專項資金項目、國家高技術研究發展計劃(863計劃)、中國博士后科學基金等項目,開展深入研究并貢獻一系列創新成果。
同時根據核心作者間的合作關系,運用Citespace進行作者合作網絡分析,生成我國網絡輿情識別研究主要論文作者合作圖譜,如圖5所示,在高質量的網絡輿情識別研究成果中,吉林大學的黃微是發文量最多的貢獻者,且多位作者間有較好的合作關系。從整體相關研究結構來看,主要研究者間合作關系有一定緊密型,便于發揮研究力量聚合優勢。
3.3 輿情識別研究的高影響力文獻
我國網絡輿情識別研究文獻成果中,基于被引量排名前20位的文獻(如表1所示)。來自圖書情報學、計算機科學、管理科學與工程、公共管理學、傳播學、社會學等不同學科領域,涉及網絡輿情識別相關的理論初探、多元情境、技術方法、風險識別、傳播演化及輿情治理等方面,形成有中國本土化特色的研究成果。具體而言,北京航空航天大學經濟管理學院劉志明、劉魯[21]于2011年發表于《系統工程》的《微博網絡輿情中的意見領袖識別及分析》截至目前被引419次、下載15 258次,為本領域重要影響研究成果。此外,還有謝科范等[23]、康偉[24]、許鑫等[25]研究者于2011年前后發表的若干文章,對后期研究起到奠基作用和重要參考價值。
4 未來研究趨勢
本研究梳理了國內網絡輿情識別相關研究成果,結合發展脈絡、核心主題以及研究力量等,在對現有研究分析總結的基礎上,認為未來研究可從如下幾個方面進行拓展豐富。
其一,借鑒多學科理論基礎,開展面向網絡輿情識別的領域融合研究。一方面,借鑒多學科具較好闡釋性的理論、視角,奠定和豐富網絡輿情識別科學研究的理論架構,挖掘相關概念要素,進一步拓展研究的內涵和外延空間。另一方面,強化建立在多學科基礎上的整體理論構建和具體情境分析,基于網絡輿情的“形成-演化-評估-預警-應對”等不同生命周期階段展開創新性、情境性領域合作研究。
其二,借助數據科學發展,為網絡輿情識別提供海量數據支持及挖掘技術驅動。隨著互聯網技術的發展,針對輿情的研究進一步打破傳統的社會輿情分析,不斷演變為基于大數據的網絡輿情分析。識別技術方法創新性愈加重要,如輿情數據的組織與分析、主題和情感的識別、風險監測及評價方面將不斷拓展,其中數據分析核心階段的持續方法優化是未來推進輿情識別的主要目標。
其三,拓展突發事件網絡輿情風險評估和可視化方法,建立立體的輿情認知視圖示。隨著當前社會突發事件層出不窮,輿情觀點和感情識別將仍是輿情識別研究的熱點,而如何將其進行知識圖譜組織和可視化則是提升輿情識別應用效果的重要途徑。基于此,未來研究有必要構建系統的輿情觀點和情感信息組織架構,并基于立體全面的數據呈現及演化規律,推動輿論演變規律和識別機制研究,這將為實現對網絡輿情的準確預測、制定輿情治理策略提供重要參考依據。
參考文獻
[1]安璐,周亦文.大數據環境下安全情報工作協同研究——以反恐情報工作為例[J].圖書情報工作,2020,64(19):50-60.
[2]陳婷,胡改麗,陳福集.論壇輿情演化趨勢預測和政府最佳干預點選擇的研究[J].情報雜志,2014,33(12):141-145,93.
[3]李綱,陳思菁,毛進,等.自然災害事件微博熱點話題的時空對比分析[J].數據分析與知識發現,2019,3(11):1-15.
[4]安璐,李倩.基于熱點主題識別的突發事件次生衍生事件探測[J].情報資料工作,2020,41(6):26-35.
[5]張鑫,田雪燦,劉鑫雅.反復性視角下網絡輿情風險評估指標體系研究[J].圖書與情報,2020(6):123-135.
[6]蔣侃,唐竹發.微博情境下網絡輿情關鍵節點識別及擴散模式分析[J].圖書情報工作,2015,59(20):105-111.
[7]陳遠,李韞慧,張敏.基于節點度測度SNS用戶信息傳播貢獻的實證研究——以騰訊微博為例[J].情報雜志,2014,33(10):159-164.
[8]譚雪晗,涂艷,馬哲坤.基于SNA的事故災難輿情關鍵用戶識別及治理[J].情報學報,2017,36(3):297-306.
[9]王曰芬,杭偉梁,丁潔.微博輿情社會網絡關鍵節點識別與應用研究[J].情報資料工作,2016(3):6-11.
[10]曹學艷,段飛飛,方寬,等.網絡論壇視角下突發事件輿情的關鍵節點識別及分類研究[J].圖書情報工作,2014,58(4):65-70.
[11]彭麗徽,李賀,張艷豐.基于SNA與模糊TOPSIS的網絡輿情關鍵節點識別分類模型研究[J].現代情報,2017,37(8):17-25.
[12]尚麗維,張向先,盧恒,等.在線社區信息交互關系網絡關鍵節點研究綜述[J].情報科學,2020,38(8):170-177.
[13]朱志國,張翠,丁學君,等.基于熵權灰色關聯模型的重大突發輿情意見領袖識別研究[J].情報學報,2017,36(7):706-714.
[14]李真,丁晟春,王楠.網絡輿情觀點主題識別研究[J].現代圖書情報技術,2017,1(8):18-30.
[15]陳雪剛.基于大數據技術的微博輿情快速自聚類方法研究[J].情報雜志,2017,36(5):113-117.
[16]王旭仁,李娜,何發鎂,等.基于改進聚類算法的網絡輿情分析系統研究[J].情報學報,2014,33(5):530-537.
[17]田世海,董月文,王健.基于NRL和k-means的輿情事件聚類研究[J].情報科學,2021,39(2):129-136.
[18]陳曉美,高鋮,關心惠.網絡輿情觀點提取的LDA主題模型方法[J].圖書情報工作,2015,59(21):21-26.
[19]姚兆旭,馬靜.面向微博話題的“主題+觀點”詞條抽取算法研究[J].現代圖書情報技術,2016(Z1):78-86.
[20]李彤,宋之杰.基于模型集成的突發事件輿情分析與趨勢預測研究[J].系統工程理論與實踐,2015,35(10):2582-2587.
[21]劉志明,劉魯.面向突發事件的民眾負面情緒生命周期模型[J].管理工程學報,2013,27(1):15-21.
[22]丁晟春,王穎,李霄.基于SVM的中文微博情緒分析研究[J].情報資料工作,2016(3):28-33.
[23]謝科范,趙湜,陳剛,等.網絡輿情突發事件的生命周期原理及集群決策研究[J].武漢理工大學學報(社會科學版),2010,23(4):482-486.
[24]康偉.基于SNA的突發事件網絡輿情關鍵節點識別——以“7·23動車事故”為例[J].公共管理學報,2012,9(3):101-111,127-128.
[25]許鑫,章成志.互聯網輿情分析及應用研究[J].情報科學,2008(8):1194-1200,1204.
作者簡介:張鑫(1985),女,博士,河北大學管理學院講師。研究方向:網絡社會治理。
劉鑫雅(2000),女,河北大學數學與信息科學學院本科生。研究方向:大數據資源智能化管理及應用。
張雅文(1990),女,碩士,河北大學管理學院助教。研究方向:新媒體傳播。
(收稿日期:2021-03-01 責任編輯:張長安)
Research Context, Core Theme and Development trend of
Online Public Opinion Identification in China
Zhang Xin LiuXin-ya Zhang Ya-wen
Abstract:The effective identification of network public opinion can provide important support for network ecological health and network social governance. This paper reviews the existing domestic research on online public opinion recognition, analyzes and explains its development context, core themes and methods, main research forces and development trends, so as to provide reference for future research and practice.
Keywords: Network public opinion; Public opinion identification; Research progress