樓藝嬋
[摘 要] 網絡公共輿情可能引爆社會危機,實時監測是輿情發現、預警的前提。公共輿情研判依賴研判指標指導,利用信息技術構建輿情研判預警系統有助于提高輿情監測、研判、預警、處置過程的自動化程度,對提高政府輿情管理效率具有積極作用。
[關鍵詞] 公共輿情; 研判預警; 信息技術; 輿情管理
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 02. 068
[中圖分類號] C912.63 [文獻標識碼] A [文章編號] 1673 - 0194(2014)02- 0132- 02
1 網絡輿情研判的必要性
據《第33次中國互聯網絡發展狀況統計報告》[1],截至2013年6月底,中國網民數量達5.91億,其中,手機上網比例達到78.5%,互聯網在農村的普及速度加快,半年期新增網民中農村網民占到54.4%。近年來,互聯網已成為網民情感宣泄、利益表達乃至思想碰撞的渠道,隨著用戶規模及群體的擴大,互聯網作為國民表達渠道的作用將持續加強。
網絡輿情從論壇帖子、博客、微博等發起,進而通過跟帖、瀏覽關注、轉發等方式傳播擴散,傳播帶有極強的互動性,傳播快、擴散范圍廣,其“裂變式”傳播特性[2]使得網民中具有代表性的情緒和意見被迅速放大。由于網絡上的身份隱蔽性、個人社會邊界模糊且信息龐雜,刺激、特異或沖突激勵的內容往往吸引眾多網民的關注,成為網上輿情信息的主要類型。輿情不僅表達網民的情緒、態度等,而且具有一定的鼓動性,并表現出某種行為傾向影響。當網絡輿情產生聚集時形成網絡輿論,對現實社會產生正面或負面的作用。失實輿情多形成消極輿論,誤導民眾、激化矛盾,擴大輿情事件危害。涉及公共事務的輿情如產生消極輿論甚至會導致社會危機,故輿情處置好壞對社會影響甚大。因此,及時發現、分析、預測、引導網絡輿情變得非常重要。輿情監測從海量網絡信息中識別、 發現輿情,輿情研判則對輿情進行價值和趨向判斷,輿情處置前提。
2 網絡輿情態勢研判
公共網絡輿情危機通常遵循顯現期、擴散期、爆發期、消退期的規律,輿情事件剛發生時,一般只有部分網民關注并參與討論,其影響范圍限制在局部范圍內。由于網絡傳播的快速性,網絡輿情迅速進入擴散期,傳播互動性將在短期內產生大量輿情言論,并通過網絡媒介迅速擴散,演變成為網絡聚集。爆發期指的是聚集速度減慢,也意味著擴散達到一定規模,形成網絡輿論,引起某種危機。波動消退期指的是輿情爆發后得到合理處置,事件的關注度逐漸降低直至消退,但如果輿情處置出現不合理或者出現相關新事件,將重新派生新的輿情,出現波動。顯現期是處置網絡輿情的黃金時期,及時介入處理可以快速控制相關事件;擴散期及時的輿情處置能夠避免輿論壓力和損失;如果輿情進入爆發期,處置難度較大,損失往往已經造成,需要采取非常措施來挽救事態。在波動消退期,處理平息事態意外,對輿情根源的消除措施及長效機制應該被考慮。
研判聚焦輿情發生演變規律,對輿情發展態勢做出預測,對輿情信息傳播影響決策行為價值進行判斷。從危機管理角度來看,最經濟的方法是避免危機發生或將其初期消滅[3],所以網絡輿情分析研判的任務之一是為處置者提供決策依據及一定程度上的應對選擇。所以,我們基于輿情傳播影響、輿情處理考慮,構建一個網絡輿情態勢研判體系,如表1所示。該體系指標包括3個維度一級指標:內容特性、傳播擴散、網民態度。
內容特性包括主題敏感性、來源可靠性、內容質量3個二級指標。網民及網絡媒體比較關注的敏感主題集中于民生、官腐、民主、司法公正等議題,敏感議題的信息更容易擴散、更快速地進入爆發期。輿情研判必須辨別信息真偽,防止虛假信息傳播帶來的損害,來源可靠性與內容質量可以幫助判斷信息真實性。通常來自網絡媒體機構發布的信息具有較高的真實性,可靠性較高,而對于個人發布者,從知名度、活躍度、在事件中的主體身份等判斷來源可靠性。內容質量從內容的性質(描述/評論)、內容詳略考察輿情信息的真實性,越詳細真實性越高。
傳播擴散是輿情作用的必然途徑,傳輸擴散過程及信息衍生變化反映出輿情影響度,多種傳輸平臺、傳播者對輿情的擴散具有不同的作用。根據輿情擴散特性,設置5個子指標:報道的網絡媒體數量、意見領袖關注數量、轉發量、瀏覽量,持續時間。轉發量、瀏覽量反映了網民對某個輿情話題的關注程度,數據越大,關注度越高,也說明事態容易擴大。報道的網絡媒體數量、意見領袖的關注數量反映輿情熱度,接入的媒體機構、知名意見領袖越多,其熱度越高,這兩個指標也一定程度上體現了信息來源的可靠性。
網民態度是網民對輿情話題的心理傾向及看法,包括情感傾向、認知層次、行為意向3個二級指標。情感傾向是網民對輿情對象做出的情感體驗,表現出喜歡/厭惡、同情/漠然、仇恨/尊崇等;認知層次則是網民對輿情對象的認識,一般通過評述表現,反映出對輿情對象的理解、認識、贊成/中立/反對、信任/懷疑等,評述越詳盡、態度越劇烈,則認知層次越高。行為意向是網民對輿情對象的反應或行為可能性。有些網民會在轉發、評論的過程中直接體現,也可從其認知評述、感情傾向進行判斷,漠然態度下基本不會有潛在行為意向,而“仇恨”的潛在報復行為可能性較高。
3 網絡輿情監測分析技術
海量網絡信息下的輿情發現依賴信息技術手段支持。從社會科學角度的研究為認識網絡輿情提供了理論依據,是網絡輿情監測分析的基礎,將理論關注的顯著特征定性化、數量化,設計實現輿情監測預警系統具有較強的現實意義。
根據輿情演變規律,監測分析過程應包括信息采集、信息預處理、輿情分析研判3個階段。信息采集是利用軟件程序,主動抓取網頁信息到本地及其存儲,并不斷更新,主要采用的是基于主題抓取技術,應用較多的是面向主題的網絡爬蟲。基于主題的輿情信息采集一般支持自定義URL的網頁數據抓取,但對網絡上其他類型的文件采集和分析仍有待進一步研究與開發。信息預處理將采集的信息進行去噪、中文分詞,然后利用布爾模型或向量空間模型對網頁信息進行主題過濾與聚合,統一文本特征的格式。輿情分析對主題進行識別、追蹤并研判話題演化趨勢,一般在主題語義分析的基礎上獲取熱點話題,通過情感分析技術進行輿情意見挖掘和觀點分析,利用基于用戶準則構建的輿情研判模型對熱點話題進行判定及演化趨勢預測。輿情管理提供對輿情信息及分析結果的保存、查詢支持,并在輿情分析的基礎上提供相應輿情預警及處置建議。網絡輿情監測各階段所使用技術如表2所示。
中文分詞指的是將一個漢字序列切分成單獨的詞,以便進行語義識別,目前常用的中文分詞包括字符串匹配法、統計法、理解法3種。從采集到的網頁中提取出正文信息,要根據需求針對不同網站制訂相應的采集規則、構造分類器,實現網頁內容的自動抽取為了便于后續的分析工作,分詞后的內容要使用特定的文本表示技術,中文網頁還需要轉換統一編碼格式,以方便文本特征的表示和特征提取。根據頁面內容判斷與主題相關的提取技術使用基于網頁框架、詞頻、語義、聚類、向量空間的提取方法。
輿情分析研判是輿情研究的核心內容,主要包括話題識別、話題追蹤、傾向性分析及熱點分析。目前網絡輿情話題識別技術,已經從線性文本聚類發展到使用注重內容特征的話題標引統計識別。話題跟蹤指將后續內容歸類到已存在的若干話題類型,一般采用文本分類方法實現,其過程分成兩步,首先進行話題模型訓練,獲得話題分類模型,然后對后續文檔進行分類。熱點是反映輿情信息擴散演變的趨勢,話題追蹤過程中發現熱點有助于對輿情管理主體的應對。熱點發現采用的方法又基于詞頻統計排序、基于相似性的熱度排序、基于聚類的熱度排序、基于社會網絡分析的關注度統計等。
傾向性分析可以探查網絡傳播者的意圖和傾向,對傾向性意見與觀點判斷采用的是情感分析技術,從粒度上情感分析可以分成詞語、句子、文檔、整體性傾向4個層次。情感詞是情感分析的基礎,情感詞匯抽取及極性評價是一體的過程,通常采用基于語料庫、基于詞典、基于圖的方法。對于意見挖掘,基于詞匯和語義特征評分的方法利用關鍵詞統計、語義分析從數量特征與數量關系上判斷輿情特點與規律。對文檔情感傾向性分析包括簡單統計方法、機器學習方法、細粒度情感相關性方法。
4 輿情研判預警系統構建
基于上述分析,我們構建用于網絡輿情預警的系統,其結構如圖1所示。系統自底向上分為數據層、研判層、決策層,數據層完成信息采集及預處理的工作,并將信息數據放置于數據庫中。在研判層,輿情分析人員根據研判指標體系采用合理的研判技術對輿情態勢進行研判,并將研判結果提供給決策層。決策層根據輿情態勢發出預警報告,處置機構根據輿情態勢、處置程序采取應急處置方案,一般情況下,處置必須滿足回應及時、信息透明、處置公正、問責到位的基本要求。
5 結 語
輿情管理是政府重要的管理工作之一,網絡輿情研判是開展輿情管理的基礎和關鍵環節。本文根據輿情信息處理分析及處置過程提出了輿情研判體系并構建輿情監測預警系統框架,為輿情系統設計實現提供了參考和指導。
主要參考文獻
[1] 作者不詳. 第32次中國互聯網絡發展狀況統計報告[EB/OL],http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201307/t20130717_40664.htm.
[2] 韓紅星, 趙恒煜. 基于裂變式傳播的新媒體噪音初探——以微博為例[J]. 現代傳播,2012,34(7).
[3] 張小明. 公共危機預警機制設計與指標體系構建[J]. 中國行政管理,2006(7):14 -19.
[4] 陳憶金,曹樹金,陳少馳,等. 網絡輿情信息監測研究進展[J]. 圖書情報知識,2011(6).