申 晨,程冬玲,張 倩
(1.河北金融學院 金融科技學院,河北 保定 071000;2.河北金融學院 信息工程與計算機學院,河北 保定 071000;3.河北軟件職業技術學院 互聯網商務系,河北 保定 071000)
截至2020年3月,我國網民數量已達9.04億,網絡成為公眾抒發情感、表達立場的重要渠道,也逐漸成為輿情產生、發展和演化的重要場所。網絡中的信息傳播具有實時、便捷和互動性強的特點。面對傳染性疾病、食品安全等重大突發公共事件,網民的情緒和觀點會在網絡中迅速傳播和感染他人,并可能導致輿情的迅速爆發。如果不能對輿情進行準確的研判和及時有效地引導,可能會產生輿情危機并導致嚴重的社會問題。
通過網絡爬蟲和分詞等技術對網民的觀點進行信息提取,并通過情緒感知技術進行輿情感知,最后對網絡輿情的演化趨勢進行建模和預測,可以及時有效地掌握網絡輿情的現狀和發展態勢。這對于把握輿情的特點和演變規律,并進一步進行有效的引導具有重要意義。
綜合搜索引擎、新聞媒體和社交網絡3類數據作為信息來源,以文本信息為主要數據源。一定時間范圍內,某些關鍵詞的搜索次數表明了網民對某一熱點人物或事件的關注程度。采用百度搜索引擎內置的“百度指數”可以方便地統計網民的搜索情況;新聞媒體的一些文章和觀點體現了社會主流輿論;以微博為代表的社交媒體則代表了網民的情緒和觀點表達。當研究某一領域的特定問題時,還可以加入與此領域高度相關的專業媒體和社交平臺數據。如對于突發公共衛生事件,可以加入丁香園論壇等專業醫療平臺作為社交網絡數據。對于新聞媒體和社交網絡,可以使用Python語言結合Beautiful Soup庫進行信息的爬取,并通過Jieba庫進行分詞;然后利用得到的分詞,根據情緒極性詞典,對其中的情緒極性詞進行提取和計算,進而獲得對應來源的情緒極性和程度的分布情況[1]。最后,通過主成分分析法等手段,綜合一定時間范圍內上述3種來源的信息,即可得到該時間范圍內某一特定主題的網民情緒極性和程度的分布情況。
構建輿情演化模型對于研究輿情的發展變化趨勢并進一步對輿情進行正向引導具有重要意義。朱毅華等[2]根據輿情傳播的一般過程,將網絡輿情的演化過程劃分為3個階段,即爆發期、持續關注期和消退期。在此,引入元胞自動機(Cellular Automata,CA)以更準確地對輿情演化過程進行建模。
首先,初始化元胞空間。利用元胞代表網絡空間中的個體。通常的做法是,假定元胞極性(cell-polarity)服從二項分布,元胞情感強度(cell-strength)服從均勻分布,這種假定可能與實際情況并不完全吻合。因此,本研究使用上一節得到的輿情感知數據替代原有假設,使元胞的極性和情感強度的分布與所得真實數據一致。元胞個數、元胞知識素養(cell-knowledge)和權威值參數等參考實際數據設定。元胞免疫力、傳播可能性服從0到1的均勻分布。設定元胞初始接觸次數為0、傳播范圍為4、初始傳播次數為0。
然后,進入元胞演化傳播階段。此時,在T0時刻隨機選擇某一元胞N0作為輿情發出個體,將其情感強度設置為1,極性設置為-1,接觸次數設置為1。自T1時刻起,挑選接觸次數大于0的元胞向其范圍內的其他元胞施加影響直到系統到達穩定狀態。
以2020年長江中下游汛情這一公共事件為例,指定7月1日0至24時作為時間范圍,選取百度搜索引擎、新浪新聞和微博作為數據來源,使用上述流程對網絡輿情進行信息提取和輿情感知,得到網民情緒的極性和程度分布情況。然后使用元胞自動機模型進行建模,得到輿情規模與時間變化關系如圖1所示。從圖中可以看出。與一般熱點事件相比,突發公共事件具有傳播迅速、規模廣、持續期長的特點。且從中可以明顯分辨出爆發期、持續關注期和消退期的演化趨勢。這與輿情演化的一般理論相符合。

圖1 輿情規模與時間變化
上述方法利用網絡爬蟲、分詞和情緒感知等技術,并結合元胞自動機模型對網絡輿情的演化進行建模,可以有效地掌握網絡輿情的現狀并預測其發展態勢,這對于有效地引導突發公共事件導致的網絡輿情,并做好輿情預警[3],具有重要意義。
以上方法仍然存在一些不足,一是對于元胞自動機的一些初始參數設置,可以根據突發公共事件背景下網絡輿情的特點進行進一步有效調整;二是上述方法在初始化元胞空間時,默認網絡輿情的傳播處于初始階段。對于實踐中,已經處于爆發期或其他階段的網絡輿情可能并不適用,這也是今后改進的方向。
突發公共事件背景下的網絡輿情受眾廣泛、傳播迅速、持續期長,一些擔憂和恐慌等負面情緒極易迅速放大。因此,相關部門一定要充分利用好網絡空間傳播迅速的優勢,及時公開真實信息,充分滿足公眾知情權,傳播正能量,做好輿情引導工作,力爭在輿情爆發期完成輿情引導工作,把握主動權。