金鑫 李小騰 朱建明
〔摘 要〕為深入研究突發事件網絡輿情的演變形式及演變成因,本文以723溫州動車追尾事件為例,以事件輿情生命周期為脈絡,在利用SVM對各階段輿情進行情感性分析的基礎上,從政府、媒體、意見領袖、網民自身4個維度對網絡輿情事件中各角色對網絡輿情傳播過程的影響及彼此間的相互作用做出了分析,并對輿情的應對提出一些建議。
〔關鍵詞〕網絡輿情;SVM;輿情演變;情感性分析
隨著互聯網的迅猛發展,它已經成為人們信息交流和信息傳播的重要途徑。尤其是Web20的發展,越來越多民眾不再僅僅從網絡上獲取信息,而是迫切希望參與信息的發布,希望通過網絡來表達自己的想法、觀點和自己了解的事實等等,于是涌現了大量的網絡言論。這種社會民眾通過網絡所表達的群體性的情緒、態度、意見與要求等言論形成了網絡輿情[1]。
網絡輿情爆發是針對某一特殊事件產生的涉及民眾利益的社會輿情,它在相對短的時間內產生大量信息,由于數乘效應在互聯網上掀起更大、更強烈的社會反映,如果事件沒有及時正確應對,輿情危機就可能在極短的時間內變成一場包含觀點和行動沖突的群體性突發事件[2]。
媒體的傳播、政府的回應、意見領袖的推動、網民的反應對網絡輿情的傳播有很大的影響,他們之間的相互作用可以影響輿情的情感極性,并最終作用于網絡輿情演化過程,例如可以避免網絡輿情爆發期的出現,直接從成長期過渡到衰退期,從而抑制群體性突發事件的發生,擺脫了網絡輿情危機。當今時代,網絡輿情已經成為最具影響力的公眾意見和評論表達方式,因此,從媒體、政府、意見領袖、網民自身多個維度分析和探討網絡輿情的演變,深入了解輿情演變的內部原因,尋求規避網絡輿情危機的策略依據變得尤為緊迫。
1 網絡輿情演變的研究現狀
隨著新技術的不斷運用,網絡影響力度不斷擴展,網民群體更加龐大和多元,網絡輿情也越來越成為各部門關注的熱點。在網絡輿情領域,許多學者做了相關研究。如有些學者對網絡輿情傳播過程進行了研究,提出了網絡輿情過程模型,將網絡輿情傳播過程劃分為潛伏期、成長期、蔓延期、爆發期、衰退期和死亡期[1]。此外還有一部分學者通過研究突發事件網絡輿情形成過程及其影響因素,建立突發事件網絡輿情演進規律的微分方程模型,確定輿情擴散過程中的3個特征時間點和輿情發展的4個階段,研究不同時段政府的應對對策,為政府實現對突發事件網絡輿情管理提供決策參考[2]。
除了對輿情的傳播過程進行研究,部分學者開始研究輿情演變過程中所涉及的其他因素,如王國華等[3]還對突發事件網絡輿情中的意見領袖進行了研究。他們從知識背景、社會地位、媒體使用3個維度對意見領袖進行了類型分析,然后以事件輿情生命周期為脈絡,具體分析了意見領袖的介入時間,行為方式,最后從事件、媒介、受眾等層面研究了意見領袖的影響。此外,方付建等[4]關于突發事件網絡輿情片面化呈現的形成機理進行了研究。
現有的研究分別從不同的角度對網絡輿情的演變進行了分析,他們都為網絡輿情的研究提供了良好的切入點,但是并沒有深入探索網絡輿情的形成過程及其影響因素,只涉及了網絡輿情對政府、意見領袖、網民的影響,而未研究網絡輿情在政府、意見領袖、網民、新聞媒體的作用下是如何發生演變的,以及未能結合輿情的情感性來探討在輿情發展過程中的影響因素和作用機制。
本文的研究中,首先將提出基于情感分析的網絡輿情演變過程的研究框架,然后基于723動車事件的案例數據,通過對網絡輿情的演變過程中各階段輿情數據的分析,探討了網絡輿情的影響因素,并結合SVM情感性分析,探討了網絡輿情影響因素的作用機制,從而提出了相關的應對策略。
2012年12月第32卷第12期現?代?情?報Journal of Modern InformationDec,2012Vol32 No122012年12月第32卷第12期突發事件網絡輿情的演變機制及其情感性分析研究Dec,2012Vol32 No122 輿情演變研究框架
21 輿情演變過程模型
結合Web20環境下網絡輿情的特點,網絡輿情的傳播過程可以分為潛伏、成長、蔓延、爆發、衰退和死亡6個階段[5]。如圖1所示。
圖1 網絡輿情過程模型
潛伏期時,輿情危機的起因往往是由于民眾對某事或某部門不滿;成長期時,由于上述不滿,信息傳播者為了得到更多網民的關注,開始到各種社交網絡上發布信息;蔓延期時,當發布的信息有一定的新聞價值時,或信息發布者有意炒作該事件時,此信息很快就會引起廣大網民的關注并引發討論;爆發期時,事件會被媒體、意見領袖進一步放大;若相關部門在爆發期時能及時控制住輿情,疏導民眾的情緒,便會使事件進入衰退期;當網民、媒體等輿情主體積極性降低時,事件關注度便會逐漸衰減,最后成為過去,進入死亡期。
22 基于SVM的情感性分析
情感分析,也被稱為觀點挖掘、觀點分析、主客觀分析等。情感分析的目標是從文本中挖掘用戶表達的觀點以及情感極性。挖掘用戶觀點意義重大,比如用戶的觀點能吸引潛在用戶,幫助其它用戶做決定[10],同時用戶的觀點還包含了較有價值的反饋[11]。這里所說的情感極性指正、負、中性情感極性。
本文設計了如圖2所示的情感分析的算法設計流程圖,大體思路如下:首先對采集器所抓取的基于關鍵字的數據進行統計入庫,然后對數據進行預處理(包括特征選擇、中文分詞處理等),之后訓練SVM(支持向量機)分類器來對測試數據進行情感極性分類,輸出情感極性標簽。
圖2 基于SVM情感分析的思路
SVM的主要思想及特點是對于線性可分的數據,可以畫出一條直線直接將元組分開。對于非線性不可分的數據,SVM使用一種非線性映射,將原訓練數據映射到較高的維。從而使得高維特征空間采用線性算法對樣本的非線性特征進行線性分析成為可能。在新的高維空間上,SVM會基于結構風險最小化理論搜索線性最佳分離超平面,即將一類元組與其他類分離的決策邊界。SVM使用支持向量(即基本訓練元組)和邊緣(由支持向量定義)發現該超平面。
為了對網絡輿情進行分類,需要構建一個分類器,即:f(x)=〈w·x〉+b,〈w·x〉,表示w和x的點積,b為偏置。具體的研究步驟如下:
(1)選擇特征值
這里采用了開方檢驗(CHI)的方法來獲取特征值。使用開方統計量來描述特征項與類別之間的關聯程度,開方統計值大則表示特征項與類別之間的獨立性小,對分類的貢獻就大。開方檢驗的計算公式如下:
x(t,c)=AD-BC(A+B)(C+D)
其中A為類c中包含特征項的文檔個數;C為類c中不包含特征項的文檔個數;B為非類c中包含特征項的文檔個數;D為非類c中不包含特征項的文檔個數。
(2)數據集預處理
按照LIBSVM軟件包[6]所要求的格式準備校驗數據和訓練數據。并對數據進行歸一化處理。
(3)選擇核函數
這里考慮選用RBF核函數:K(x,y)=exp{-rx-y2},其實質就是算出SVM分類函數中的點積,即可以求得w和b的值。
(4)采用交叉驗證方式對整個訓練集進行訓練獲取支持向量機模型。
(5)利用獲取的模型進行測試與預測。
其中,利用SVM進行分類的策略有多種,如是否對句子進行分句處理,就可以分成兩種思路。由于本文處理的對象為文本內容很多的帖子,所以采用不分句的策略進行處理。在不分句的基礎上我們采用一步分3類的方法,最終形成正向、中立和負向3種類別。
23 基于情感分析的輿情演變研究模型
本文結合上述的網絡輿情過程模型和情感分析方法,以723溫州動車追尾事件為例,用此事件所收集的數據來實證地分析輿情傳播過程中政府、新聞媒體、意見領袖、網民各自的特點和他們對輿情演變的影響。本文的研究模型如圖3所示。
本文通過對從互聯網上抓取得到的723溫州動車事件中民眾所發表的觀點,對該事件輿情演變過程中的各個階段結合情感分析,分析其情感極性,從而觀察媒介、政府、意見領袖的介入對民眾情感的影響,這些影響的出現又使得輿情在接下來的時間里發生了怎樣的演變。
圖3 輿情演變研究模型
3 網絡輿情演變過程的影響因素分析
31 數據準備
本文采用網絡爬蟲(火車頭采集器)結合人工分析的方式來獲取分析數據。筆者于2011年12月3日采用火車頭采集器對天涯論壇有關溫州動車事件的帖子,對網易新聞有關溫州動車事件的新聞報道進行了采集。通過去重、去除不相關,共得天涯論壇關于動車事件的帖子325篇,網易新聞800篇。為了使數據更精準,更有效,本次分析采用7月23至8月2日的數據。為了發現輿情演變整個過程中政府、新聞媒介、網民的特點,我們利用收集到的關于723溫州動車追尾事件的數據,對其進行統計分析,得到政府、新聞媒體、網民隨著輿情演變所展現出來的特征。如圖4所示。圖4 輿情演變過程中網民、媒體和政府關注度的變化
由觀測到的數據所呈現的特點,我們可以看到整個網絡輿情的演變呈M-態分布。網民對723動車事件的關注在7月25日帖子量達到最高點,隨即有回落趨勢,在7月27日又重新上升,之后慢慢趨于平靜,輿情演變曲線近似M形。新聞媒體對723動車事件的關注度也呈現M-態分布,但是不同的是,其在7月24日的報道量達到最高點,在7月25日開始回落,隨即又開始回升,在7月28日又達到一次高峰點,并在7月30日開始漸漸淡出對723事件的關注。數據顯示政府對723的關注度也近似于M-態分布,在7月24日和7月28日分別達到兩次關注高峰,并在7月30日起關注度開始趨于零。
32 輿情生命周期的劃分
本文參考723溫州動車事件發表輿論的頻繁度來劃分此事件的生命周期。我們根據所有帖子數的變化來劃分的。圖4中顯示了帖子總數的變化曲線呈M形,圖中的A、B、C、D、E具有很明顯的轉折點特征,依據這5個節點將輿情劃分為6個階段,分別對應各輿情演化階段,如表1所示。表1 723事件的輿情生命周期
階段時間關注度階段時間關注度潛伏期7237爆發期725-728621成長期723-724255衰退期728-730144蔓延期724-725127死亡期730-8255
從表1可看出723溫州動車事件為突發事件,潛伏期不明顯,且此事件影響廣泛,所以衰退期和死亡期時間持續較長。
33 新聞媒體的關注度對輿情的影響
通過對網易上從7月23日至8月2日關于723溫州動車事件的新聞報道進行抓取,共得到800條新聞,根據圖4所展現出的動態,并結合輿情的生命周期理論,我們將得到的數據按照輿情的生命周期階段進行劃分,得到的數據如表2所示。表2 新聞媒體在輿情生命周期各階段的情況
階段日期報道量階段日期報道量潛伏期7230爆發期725-728423成長期723-724198衰退期728-73098蔓延期724-72563死亡期730-8218
結合表2和圖4我們可以看到媒體的關注度對輿情的影響是顯著的,在成長期時媒體關注度驟然上升,從7月23日的零報道量到7月24日的第一次報道量高峰,使民眾的注意力集聚723溫州動車事件上,促進輿情進入蔓延期,并繼續發展,之后在7月25日至7月28日間持續高密度的報道723事件,使輿情順勢進入爆發期。
我們也可以看到民眾的關注度對媒體的報道量也是有影響的,7月23日民眾對動車事件開始發表評論,媒體在7月24日便密切關注事件的發展動向,7月28日以后民眾的關注度降低,媒體的報道量也隨即下降。因此媒體與民眾之間相互影響,互為彼此信息的來源,并促使著輿情不斷演變。
34 意見領袖在網絡輿情演變過程中的作用
“虛擬意見領袖”就是那些在虛擬網絡中,熱衷于傳播消息和表達意見的人,他們或是比同伴更多地接觸媒介或消息源,或者同時是某一方面的專家,他們的意見往往左右周圍的人。從事件的發展來看,意見領袖幾乎推動著每一個網絡熱點事件的發展。他們的意見左右著民眾的意見,并被民眾不斷傳播、放大。從傳播信息的角度看,意見領袖形成了一層控制層。意見領袖是在人際傳播網絡中經常為他人提供信息,同時對他人施加影響的“積極分子”,在民眾傳播效果形成過程中起著中介或過濾作用[7]。從受眾的角度看,網絡意見領袖不僅影響網上輿論主題,更影響輿論走向,對于突發事件網上討論焦點及方式都會產生極大的影響。
網絡意見領袖在輿情演變過程中產生著重要作用,研究突發事件網絡輿情演變中意見領袖的構成特點能夠對實踐的變化進行更多、更準確的預測。
以723溫州動車追尾事件為例,我們從所有帖子中整理意見領袖的帖子,按輿情的生命周期進行分類,分析各階段中意見領袖的典型行為特征如表3所示。
表3 領袖意見行為特征
階 段熱議話題時間節點行為特征潛伏期告知“723動車”事件的發生2011723?22:53事實陳述,內容不帶情感極性成長期追問事故發生原因2011724焦點單一,情緒宣泄蔓延期事故原因分析,各界對事故的態度及反應2011725焦點擴散,爭奪話語權爆發期剖析事故發生原因2011726焦點集中,立場堅定衰退期事故后期處理工作(死傷家屬賠償等)2011729焦點開始分化死亡期事故追憶2011731焦點消散,經驗總結
根據我們獲取的領袖意見的數據發現,在突發事件網絡輿情的潛伏期,主要是新聞媒介作為意見領袖,將事件的發生傳向民眾,告知民眾事件的發生,此時意見領袖一般只陳述事件,并不發表意見。
在突發事件網絡輿情的成長期,草根意見領袖成為網絡輿情擴散和發展的主要構成,網絡版主、VIP用戶等通過發帖和轉文,將事件進一步傳播開來,使受眾的規模進一步擴大。在傳播過程中,意見領袖為了吸引眼球,對事件的描述主觀性的加入自己的感情色彩,從而產生更多的網絡輿情。
在突發時間網絡輿情的蔓延期,此時突發事件已經受到一定程度的關注,而突發事件新的進展提供了新的討論話題。在這一階段除了草根意見領袖,一些專家、明星、學者開始加入到意見領袖中,他們有的利用自己的專業知識從不同角度對事件的發生原因、性質、發展進行剖析。
在突發事件網絡輿情的爆發期,輿情受到意見領袖的推動下,關注人群不斷增多,網絡輿情開始偏向一個或少數幾個焦點,輿情走向集中化,明朗化。(如723動車事件,最終民眾的輿論焦點都落在動車事故的發生原因上。)
在突發事件網絡輿情的衰退期和死亡期,意見領袖的言論減少,隨著新的突發事件和熱點話題進入公眾視野,人們的關注點開始分散,同時由于事件開始得到解決和控制,網絡關注度開始下降。相關網絡輿情減少,突發事件開始淡出公共視野,網民主要以突發事件造成的影響及總結經驗教訓為關注點,但是,很多突發事件并不會真正從民眾的議論中消失,如723溫州動車事件,此類事件一旦有新的波動,有可能會重新成為民眾熱議的話題。
35 政府關注度對輿情演變的影響
根據上圖4所展現出的動態,并結合輿情的生命周期階段,我們將得到的政府方面回應的數據按照輿情的生命周期階段進行劃分,得到的數據如表4所示。表4 政府在輿情生命周期各階段的回應情況
階段日期報道量階段日期報道量潛伏期7230爆發期725-728106成長期723-72424衰退期728-73019蔓延期724-72513死亡期730-825
結合表4和圖4我們可以看到政府的回應對輿情演變的影響。在成長期和蔓延期時政府方面的新聞報道量很少,但在723動車輿情發展到爆發期時,政府開始積極響應,新聞報道量較之前倍增,最終使得輿情得以控制開始步入衰退期,進而進入死亡期。
民眾參與輿情的頻繁度直接影響到政府的響應程度,當民眾的參與演變成大規模的群體性事件時,政府就必須做出回應,而且其出面響應的效果會直接影響輿情的下一步發展,處理不當,將會激起輿情進一步高漲。
4 輿情演變過程中的情感性分析
41 基于SVM的網絡輿情的情感性分析
本文通過對采集帖子的內容按照前述第三節內容介紹的思路和流程使用SVM支持向量機進行訓練和分類,得出民眾輿情的情感極性。我們將搜集到的723溫州動車追尾事件的數據作為測試數據,對其進行預處理(去重、去與主題不相關、中文的分詞處理、文本的特征表示等[8])后,利用SVM進行了分類訓練,用前200個數據作為訓練數據,選取了13個特征值。使用matlab進行分類的部分程序如下:
最終的結果如表5中所示,訓練數據的精度為Accuracy=815%,測試數據的精度為Accuracy=576%,由于網絡語言的復雜、多樣性,所以要準確預測情感極性很困難,576%的準確度是可以被采納的。表5 輿情演變各階段民眾的情感極性分析表
階段情感極性極性個數比例(%)觸發事件潛伏期正面10中立6100負面00網民微博報道動車事件成長期正面1303中立151818負面177879動車事件媒體報道蔓延期正面6784中立142353負面316863報道掩埋動車車頭事件爆發期正面141522中立281956負面506522政府公布初步調查報告,稱獲救女孩為生命奇跡等衰退期正面92105中立101053負面196842相關部門慰問傷亡家屬,事故后續安排等死亡期正面1952中立82381負面126627政府承諾給民眾事故真相
42 影響因素對輿情情感極性的影響
由于723溫州動車事件是一起突發性的災難事件,輿情的總體情感極性是偏負面的,如表5所示,這里選取正面、中立、負面占各階段帖子數的比例來研究民眾的情感極性,為了清楚表示民眾的情感性變化,我們繪制了各階段民眾輿情的情感性變化,如圖5所示。
圖5 各階段民眾輿情的情感性變化
對比分析圖4與圖5的信息,由圖4我們可以看出在整個輿情生命周期里民眾的負面情緒占主導,在潛伏期和成長期時,隨著媒體新聞量的增加,意見領袖的介入,中立情緒所占比例不斷下降,正、負面情緒逐漸上升,情感極性開始顯現,負面情緒在成長期、蔓延期時達到至高點,但隨著政府的關注度增加(見圖5),負面情緒有所降低,在爆發期后期開始走向低谷,而與此同時正面情緒在衰退期時達到最高點,這說明政府的回應起到一定的作用,在一定程度上抑制了輿情負面情緒的發展態勢,后期由于政府部門響應積極性降低,負面情緒又有所回升,但伴隨著輿情進入死亡期,也就沒有進一步發展下去。數據可以顯示網民、媒體、政府之間對輿情的關注度是相互影響的,而且在一定程度上促進輿情向前發展。
5 結 論
通過對突發事件網絡輿情的研究,可見政府對待輿情的態度非常重要,隨著網絡輿情的不斷發展,其越來越影響政府的對外形象,所以政府應正視輿情,并盡力處理好輿情所引起的事件。根據上述輿情演變規律,政府應對網絡輿情時應該采取如下策略:(1)及時響應,在輿情發生后第一時間發布信息,搶占輿論先機,避免負面輿情占據主導;(2)實事求是,事件發生后不封堵信息,說真話,提供真實的情況是輿論引導的關鍵,這樣才能贏得公眾的信任;(3)積極引導,網絡輿情通常以個人的觀念和信仰為基礎,以情緒化形式表現,需要通過引導使輿論向有益的、促進社會和諧的方向發展,尤其對意見領袖的言論,更要關注。
本文在總結前人研究的基礎上,以723溫州動車事件為例說明輿情的演變受到民眾、媒介、政府、意見領袖四個方面的影響,并分別對每一方面按照網絡輿情的生命周期,分階段進行了分析,分析過程中采用了情感分析方法,通過判斷民眾的情感性偏向,希望能夠更全面的對突發事件的網絡輿情進行研究。在了解各方面對輿情演變的影響后,我們還針對某些方面提出了一些控制和疏導輿情的策略。但是由于本文列舉的事件是個典型的突發事件,可能不能全面覆蓋現今出現的各種輿情所展現的特點,而且由于語言自身的易變性、復雜性,本文對民眾的情感性分類的精度可能不是很高,不能精確表達受眾們的情感極性,所以本文的一些結論還需在后續階段不斷補充和修正。
參考文獻
[1]劉毅.網絡輿情研究概論[M].天津:天津人民出版社,2007:53.
[2]丁菊玲,勒中堅,王根生.我國網絡輿情危機預警研究探討[J].情報雜志,2010,29(10):5-6.
[3]王國華,張劍,畢帥輝.突發事件網絡輿情演變中意見領袖研究[J].情報雜志,2011,30(12):1-4.
[4]方付建,王國華,徐曉林.突發事件網絡輿情“片面化呈現”的形成機理——基于網民的視角[J].情報雜志,2010,29(4):26-30.
[5]李綱,董琦.Web20環境下企業網絡輿情傳播過程的研究及實證分析[J].情報科學,2011,29(12):1180-1184.
[6]Chang C C,Lin C J,LIBSVM..A library for support vector machines[OL].2009.11.
[7]Lazarafeld P F,et al.The People s Choice:How the Votes Makes Up His Mind in a Presidential Election[J].New York:Columbia University Press,1948:151.
[8]朱嫣嵐,閔錦,周雅倩,等.基于Hownet的詞匯語義傾向計算[J].中文信息學報,2006,20(1):14-20.
[9]許鑫,章成志.互聯網輿情分析及應用研究[J].情報科學,2008,26(8):1194-1200.
[10]MQHu and BLiu.Mining and Summarizing Customer Reviews[C].In ACM SIGKDD,2004:168-177.
[11]Bo Pang and Lillian Lee.Opinion mining and sentiment analysis[J].Foundations and Trends in Information Retrieval,2008,2(1-2):1-135.
(本文責任編輯:馬 卓)