999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

淺析網(wǎng)絡輿情信息挖掘技術的局限性及對輿情應對的影響

2023-10-28 16:47:20張瑞萌李建波
傳媒論壇 2023年17期
關鍵詞:文本情感信息

張瑞萌 李建波

新媒體背景下,網(wǎng)絡輿情信息數(shù)量龐大且來源復雜。習近平總書記多次強調(diào)要加強輿情應對工作。越來越多的政府、企事業(yè)單位開始重視輿情監(jiān)測,試圖提高輿情危機應對效能,從而實現(xiàn)新媒體時代輿情的有效應對。

然而,結(jié)合實際和查閱文獻資料,目前研究雖然已經(jīng)注意到利用網(wǎng)絡輿情信息挖掘技術來提升輿情危機應對能力,但是大都集中于對網(wǎng)絡輿情信息挖掘技術的技術手段研究,對其在實際應用中展現(xiàn)的局限性卻少有進行系統(tǒng)論證。而網(wǎng)絡輿情信息挖掘技術的局限性在實際危機應對中將直接影響政府、企事業(yè)單位的輿情研判效能,影響新媒體時代社會輿情治理效果。

本文擬探討網(wǎng)絡輿情信息挖掘技術的局限性對輿情危機應對的影響,以期優(yōu)化網(wǎng)絡輿情信息挖掘技術,提高人機交互互補能力,提升政府、企事業(yè)單位等部門輿情危機應對的效能,提高新媒體時代社會輿情治理效果。

一、網(wǎng)絡輿情信息挖掘技術概述

網(wǎng)絡輿情信息挖掘技術主要是指從海量的網(wǎng)絡媒體信息中提取出有效且關鍵性的數(shù)據(jù),并將數(shù)據(jù)通過一系列算法建立相互聯(lián)系的可視化可檢索數(shù)據(jù)庫的技術。[1]

近年來,國內(nèi)學者都對網(wǎng)絡輿情信息挖掘技術進行了深入研究。本文將介紹幾個重要的網(wǎng)絡輿情信息挖掘技術方法:

(一)權重計算法

權重計算法是目前輿情信息挖掘最常用的方法,它根據(jù)字、詞在網(wǎng)絡文章中的權重來評估其在該篇文章中的重要性。[2]如果某些字詞在一些文章的權重占比較高,在另一些文章的權重占比較低,可以用該字詞來分類文章的情感傾向,從而達到網(wǎng)絡輿情信息挖掘的目的。權重計算法的優(yōu)勢在于計算簡單,但是在實際應用中,有些字詞雖然頻率很高、但對分類的貢獻很小。

(二)文本聚類法

在網(wǎng)絡輿情信息挖掘中,文本聚類法是信息挖掘的一項關鍵技術,文本聚類是一種無監(jiān)督的機器學習方法,采用去除停用詞、詞頻分析[3]等方法,構(gòu)建出所收集文檔的文本信息標記,對文本數(shù)據(jù)進行聚類,將雜亂的文本數(shù)據(jù)劃分成若干類。同類文本相似度大,而不同類文本相似度低。在輿情信息挖掘方面,具有靈活性、機動性和自動化等優(yōu)勢,可以一定程度上提升輿情信息挖掘速度,與權重計算法相比具有更高的準確性。

(三)情感傾向性分析方法

主觀性的輿情文本中蘊含著情感色彩,其中的情感傾向性和主觀性能夠很好地表達用戶對于事件所持態(tài)度,根據(jù)用戶情緒和態(tài)度能夠判定輿情信息的正負面。這種方法通過對網(wǎng)絡輿情信息數(shù)據(jù)中的大量標記情感詞進行統(tǒng)計分析,挖掘文本信息中的情感詞分布特點,剔除網(wǎng)絡輿情信息文本的干擾句和客觀句,對帶有情感色彩的主觀性文本的情感傾向進行分析,計算文本整體的情感傾向值[4],得出網(wǎng)絡輿情信息的情感傾向,快速了解網(wǎng)絡輿情信息狀態(tài),從而完成信息挖掘。

(四)關鍵詞匹配

輿情熱點事件發(fā)生后,做好輿情熱點分析工作最為關鍵。一般來說,比較常見的輿情分析方式就是對輿情熱點關鍵詞進行提取,通過關鍵詞來搜集精準有效的數(shù)據(jù)信息進行分析。[5]它利用正則表達式對網(wǎng)絡輿情信息文本內(nèi)容進行匹配,快速從海量的文本中檢索出關鍵詞,適應網(wǎng)絡輿情演變速度極快的特點,滿足網(wǎng)絡輿情數(shù)據(jù)的挖掘分析對實時性的需求。

二、網(wǎng)絡輿情信息挖掘技術的局限性

在新媒體背景下,網(wǎng)絡輿情呈現(xiàn)出復雜性、時效性[6]、海量性和高影響力四個特征。網(wǎng)絡輿情信息挖掘技術可以快速全面收集和整理危機應對所需要的相關數(shù)據(jù),并且對這些數(shù)據(jù)做系統(tǒng)的、可視化的分析和篩選。網(wǎng)絡輿情信息挖掘技術的運用,對政府、企事業(yè)單位的輿情監(jiān)測和輿情研判處置有著不可替代的優(yōu)勢。然而,當下大家都集中研究輿情信息挖掘技術的技術手段本身,以及大數(shù)據(jù)輿情信息挖掘技術的優(yōu)越性,卻忽略了這個技術衍生的輿情監(jiān)測應用,在實際應用中也是有局限性的。

(一)網(wǎng)絡輿情信息獲取極其被動

輿情信息挖掘技術的主要爬取數(shù)據(jù)技術手段之一就是關鍵詞匹配。關鍵詞匹配是指利用正則表達式對網(wǎng)絡輿情信息文本內(nèi)容進行匹配,快速從海量的文本中檢索出關鍵詞,從而獲得和關鍵詞相關的文章數(shù)據(jù)。由此可見,關鍵詞匹配就是在設定已知關鍵詞的條件下,通過關鍵詞精確命中原則,匹配到相關的網(wǎng)絡輿情信息。也就是說,如果事先并沒有設定突發(fā)事件相關的關鍵詞,或者關鍵詞出現(xiàn)設置偏差(例如“我們今天很開心”和“我們今天很開開心心”機器就會視為偏差),那么在輿情信息的獲取上就匹配不到設置關鍵詞之外的信息和因為關鍵詞設置偏差而漏掉一些重要的信息。

當然,也有假設說按照熱度第一排序,來彌補關鍵詞未知的不足,盡可能主動地獲取信息。通過熱度值比對來找出輿情熱點,將熱點信息作為參考,實現(xiàn)輿情事件預測。但由于網(wǎng)絡輿情信息復雜性、海量性及媒介多樣性等的特征,達到什么標準的熱度值視為輿情熱度爆發(fā)臨界點,是一個復雜且尚未統(tǒng)一的標準,還不能很好應用。

(二)網(wǎng)絡輿情信息溯源判斷不精確

在輿情事件的梳理中,溯源是一個十分重要的產(chǎn)出因素。當前的技術獲得溯源大都是對抓取到的輿情信息做一個時間排列,或者通過一些技術算法,從而判定時間排列最早或者認定相關算法的結(jié)果為溯源。[7]顯然,實際應用中,這些方法并不一定適用。由于信息的海量性、媒介的多樣性和反爬蟲技術的限制,會導致挖掘到的信息不一定是事件信息的源頭。此外,在實際操作中,會出現(xiàn)技術無法掌控的問題。以“河南省高考答題卡掉包”事件為例,該事件的第一公開發(fā)出源為微信公眾號“波動財經(jīng)”,由于微信信息爬取管理限制,監(jiān)測系統(tǒng)并不能爬到該條信息,在實際應用上就遺失了該條重要的信息溯源。

(三)有效數(shù)據(jù)命中率還需提高

在海量的網(wǎng)絡輿情信息文本中,經(jīng)常會有文章掛羊頭賣狗肉、篡改網(wǎng)頁、錯字等行為。這就要求技術不能是簡單的命中匹配,還需規(guī)避這些干擾問題,優(yōu)化技術,做進一步處理再呈現(xiàn)出來。就信息采集而言,信源受采集主體主觀因素及客觀條件制約,會使得采集到的信息不準確、不完整、過時、失真。主觀原因可能有危機應對人員選擇設置關鍵詞的主觀意愿、信息采集者選擇信息的不當或者定向采集、查證信源不規(guī)范、文本核對不到位等;客觀原因包括錯別字的干擾、廣告的植入、采集信息的方法誤差等。

實際應用中常見的情況有以下幾種:

1.網(wǎng)頁篡改或錯字。比如廣告及錯別字導致文本匹配準確度降低。

2.關鍵詞分詞和匹配方式過于簡單。比如中原工學院,分詞為中原、中原工、工學院,很可能就會匹配其他包含中原的院校信息,需要結(jié)合更復雜更精確的匹配方式。

3.無用信息的影響導致命中率不高。比如文本中出現(xiàn)了這個關鍵詞,但關鍵詞在文章中只是簡單的信息列舉,就像列舉了河南高校就匹配了中原工學院,但文章其實說的是其他內(nèi)容,這在輿情危機應對的實際應用中就屬于無用信息。

4.事件定位和相關輿情事件無關。比如河南富士康員工逃亡事件,信息匹配中出現(xiàn)了很多為了蹭熱度定位河南富士康的但是實際發(fā)布內(nèi)容卻與輿情事件不相關信息。

上述情況,都會造成采集到的數(shù)據(jù)有效命中率不高,進而會影響輿情危機應對方案的分析深度和實用程度。

(四)情感分析的正負面判斷過于死板,精確度不足

大數(shù)據(jù)時代,政府和企事業(yè)單位使用網(wǎng)絡輿情信息挖掘技術希望通過更簡單高效的監(jiān)測來了解輿情數(shù)據(jù)信息特征。情感分析技術的確可以幫助用戶一般性地了解信息的正負面傾向?,F(xiàn)在的情感分析技術,通常是通過匹配預設情感詞特征模型來判斷該語句或者文章所反映的情緒傾向。但是正因為這個機制,使得抓取到的信息情緒判斷死板。情感詞特征模型的人為設定,死板的命中匹配機制,在實際應用中很難精確地判斷出文章的整體情緒傾向,容易出現(xiàn)斷章取義的情況,會出現(xiàn)很多正面、中性文章誤判為負面,負面判斷不精確等問題。比如,評論類文章里雖然多次提到了腐敗等負面情感特征詞,但是文章并非負面信息。情感分析技術的死板會判斷該篇文章為負面信息,這種對信息死板的情感判斷現(xiàn)象,會導致危機應對人員在實際應對中對海量輿情信息的篩選產(chǎn)生干擾。

三、輿情信息挖掘技術對網(wǎng)絡輿情危機的影響

網(wǎng)絡輿情信息挖掘技術的局限性,對政府、企事業(yè)單位等進行輿情研判、處理網(wǎng)絡輿情危機工作有著一定的影響。這些局限會在一定程度上限制相關部門精確化分析的能力,增加網(wǎng)絡輿情危機應對難度,減弱網(wǎng)絡輿情社會治理效果。具體影響可以歸納為以下幾點:

(一)不能及時監(jiān)測輿情事件信息,錯失預警時機

在輿情應對中,預警機制是非常重要的。爬取數(shù)據(jù)時關鍵詞設置的被動性,導致目前的網(wǎng)絡輿情信息挖掘技術所呈現(xiàn)的都是已知的發(fā)生的輿情信息,并不能起到預測的功能。所有輿情危機發(fā)生之前,都會有一定的征兆。[8]在實際應用中,政府、企事業(yè)單位對網(wǎng)絡輿情的預測場景是充滿期待的。

在突發(fā)事件的初期,政府、高校及企事業(yè)單位對網(wǎng)絡輿情信息的靈敏度和信息質(zhì)量都存在滯后性。關鍵詞設定的被動性,在輿情危機應對中會降低政府、高校及企事業(yè)單位對網(wǎng)絡輿情可能發(fā)生的行為參考值。關鍵詞匹配技術等數(shù)據(jù)挖掘方法更多適用于事后分析,對網(wǎng)絡輿情的預警并無太大參考,容易在危機應對中錯失預警防范的最佳時機。

(二)不能快速準確抓住輿情源頭,失去有效切斷傳播源的手段

找到負面輿情的源點,在輿情危機應對中起著至關重要的作用。快速、準確的找到輿情源點,對抑制負面輿情傳播、精確治理負面輿情有著不可替代的意義,且是治理輿情最有效的方法之一。輿情溯源判定的不精確,會使危機應對人員在輿情危機應對中難以快速準確地找到源頭,失去有效切斷傳播源的手段。畢竟在海量的網(wǎng)絡輿情信息中,靠人工去完成這個溯源挖掘,是費時費力的行為。所以網(wǎng)絡輿情信息挖掘技術中存在的溯源判斷不精確問題,仍需有更優(yōu)化的算法與評價標準。

(三)信息挖掘命中不深入,應對能力難以提升

對網(wǎng)絡輿情危機應對而言,網(wǎng)絡輿情信息挖掘技術的深入應用,一是可以通過對數(shù)據(jù)進行全面地分析和整理,提取出危機特征,這樣大大提高了政府、高校、企事業(yè)單位相關研究以及危機應對的能力;二是還能在第一時間快速地了解突發(fā)狀況信息,制定應對輿情事件的部署方案,確保該方案能夠在一定程度上滿足輿情危機應對的處理要求。然而,海量的信息如果只是以簡單文本聚類的方式呈現(xiàn)出來,不能有效規(guī)避無用信息和干擾信息,會使危機應對人員對輿情事件的判斷產(chǎn)生信息讀取干擾和偏差,不能準確地了解輿情傳播范圍,也不能精確地了解媒體傾向性,影響輿情研判和危機處置方案的制定。

(四)情感分析準確度不足,篩選負面信息耗費精力

在輿情危機應對中,危機應對人員更傾向于關注負面信息的數(shù)據(jù)特征。網(wǎng)絡輿情的危機治理離不開對負面信息特征、數(shù)量的整體了解。對海量的信息進行初步的正負面分析,對公眾的情緒傾向性有一個大致的了解,是應對網(wǎng)絡輿情的重要環(huán)節(jié)。

網(wǎng)絡輿情信息挖掘技術情感分析死板,文章情緒判斷準確度不夠,使得危機應對人員在負面信息的判斷篩選上花費大量時間,很容易錯失最佳處置時機,同時對公眾正負面情緒的整體占比分析不夠精確,降低危機應對效果。

四、結(jié)語

輿情信息挖掘技術可以幫助危機應對人員快速對海量的網(wǎng)絡輿情信息進行篩選,通過數(shù)據(jù)分析比較,系統(tǒng)地制定危機應對方案。但是網(wǎng)絡輿情信息挖掘技術的局限性所造成的影響也需要重視。這些局限包括技術上有待優(yōu)化的地方和技術上不能實現(xiàn)的功能。未來,針對網(wǎng)絡輿情信息挖掘技術信息獲取被動、溯源判斷不準確、有效數(shù)據(jù)命中率不高、正負面判斷死板等的局限,需要進一步優(yōu)化網(wǎng)絡輿情信息挖掘技術,完善輿情預警技術和人力相配合機制,提高輿情預警效能;精確找到輿情溯源,快速了解輿情傳播規(guī)律;提高輿情海量信息有效命中率;精確情感分析的正負面判斷,優(yōu)化死板問題;更好地進行輿情危機應對,為社會網(wǎng)絡輿情危機應對開辟新道路,從而提高網(wǎng)絡輿情社會治理效能。

猜你喜歡
文本情感信息
如何在情感中自我成長,保持獨立
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
情感
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
如何在情感中自我成長,保持獨立
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
主站蜘蛛池模板: 亚洲天堂日韩在线| 小说区 亚洲 自拍 另类| 久久精品国产亚洲麻豆| 亚洲自拍另类| 日本午夜网站| 日韩不卡高清视频| 尤物精品视频一区二区三区| 91娇喘视频| 97一区二区在线播放| 九色视频线上播放| 亚洲天堂2014| 99久久精品视香蕉蕉| 19国产精品麻豆免费观看| 国产精品一区二区不卡的视频| 亚洲国产精品一区二区第一页免| 高清免费毛片| 国产打屁股免费区网站| 国产无码精品在线| 小13箩利洗澡无码视频免费网站| 国产欧美精品一区二区| 青青青伊人色综合久久| 精品一区国产精品| 97视频免费在线观看| 国产高潮视频在线观看| 国禁国产you女视频网站| 一级片免费网站| 精品伊人久久久久7777人| 亚洲天堂视频网站| 91小视频在线播放| 亚洲精品第一页不卡| av无码一区二区三区在线| 国产极品美女在线播放| 日韩精品专区免费无码aⅴ| 毛片在线看网站| 亚洲人成色77777在线观看| 欧美日韩国产精品va| 久久这里只有精品2| 99精品免费在线| 中文字幕一区二区人妻电影| 日韩免费视频播播| 亚洲成A人V欧美综合天堂| 亚洲精品视频免费| 专干老肥熟女视频网站| AV网站中文| 刘亦菲一区二区在线观看| 亚洲国产精品人久久电影| 中文字幕欧美日韩| 婷婷成人综合| 免费A级毛片无码无遮挡| 亚洲中久无码永久在线观看软件| 中文字幕天无码久久精品视频免费| 亚洲午夜国产精品无卡| 精品国产成人a在线观看| 国产精品爆乳99久久| 午夜爽爽视频| 成人精品视频一区二区在线| 在线观看无码a∨| 九色视频最新网址 | 欧美成人午夜在线全部免费| 亚洲中文字幕在线精品一区| a级毛片在线免费| 欧美在线一二区| 天天综合色网| 欧美亚洲国产一区| 71pao成人国产永久免费视频| 日韩欧美中文字幕在线韩免费| 免费看美女自慰的网站| 一本无码在线观看| 欧美性猛交xxxx乱大交极品| 老司机久久99久久精品播放| 国产99精品视频| 久久精品无码一区二区国产区 | 福利国产在线| 99精品视频在线观看免费播放| 免费无码又爽又刺激高| 国产精品九九视频| 亚洲国产精品一区二区第一页免| 激情爆乳一区二区| 67194亚洲无码| 色综合狠狠操| 华人在线亚洲欧美精品| 色综合久久久久8天国|