摘 要:網絡輿情是網民對社會問題不同看法的輿論,網絡輿情事件如果處理不當,極有可能誘發民眾的不良情緒,進而對社會穩定構成威脅。擬構造動態的網絡輿情演化模型:每經過一個時間尺度,重新分析一次網絡輿情序列的統計特征;根據其統計特征,選擇合適的預測模型來建立模型,以準確掌握網絡輿情的演化規律。
關鍵詞:網絡輿情 時間序列 人口模型 灰色預測
一、引言
根據CNNIC發布的《第39次中國互聯網絡發展狀況統計報告》,截至2016年12月,互聯網普及率達53.2%,標志著我國已成為一個互聯網大國。實踐證明,一些重大的網絡輿情事件使人們開始認識到網絡對社會監督起到的作用。同時,網絡輿情突發事件如果處理不當,極有可能引發群眾的違規和過激行為,進而對社會穩定構成威脅。因此,探究網絡輿情的演化規律對于危機應對、輿情引導有著重要的研究價值和現實迫切性。中國股市在時隔8年后的2015年又迎來了新一輪的牛市及下半年的股災,上半年股市的瘋漲在互聯網輿情的傳播下幾乎呈現“人人炒股”的趨勢,結果導致了在下半年股災發生后股民的猝不及防,最終引起了民眾恐慌和社會動蕩。據百度指數統計數據顯示,隨著時間的推移,股市指數的漲跌和政策輿情事件相互影響,形成多個關鍵節點。因此能從股市輿情的變化中探尋出一定的股市規律性,對于社會事件的發展有一定的先導作用。
二、文獻綜述
網絡輿情是近年來的研究熱點,各專家學者都期望通過網絡輿情演變方式的規律研究來對社會產生一個良好的熱點導向,為政府提供支持性依據。分別使用回歸模型和ARIMA模型來研究網絡輿情,并得到了相應的規律性結論。通過仿真方法重點研究了傳播內容以及網民個體屬性對輿情演化傳播的影響。此外,在國外也有許多這方面的研究,分別使用元胞自動機模型與Gompertz曲線模型研究輿論擴散規律。針對個人在輿論傳播中的特性,建立了基于復雜網絡的網絡輿情演化模型。國內外對網絡輿情演變的研究遠不止上述的文獻,但大多數研究都使用單一模型對網絡輿情的演化規律進行研究。這往往使不同模型研究之間的兼容性變差,甚至結論相悖。結合上述研究,本文擬構造動態的網絡輿情演化模型:每經過一個時間尺度,重新分析一次網絡輿情序列的統計特征;根據其統計特征,選擇合適的預測模型來建立模型,以準確掌握網絡輿情的演化規律。
三、動態模型
1.動態模型簡介。事件輿論量的產生存在一定的規律性,其中的規律是通過前期的輿論情況而定的,而根據已有的研究可知序列模型短期預測更為精確。因此在預測的過程逐步更新數據進行短期預測,使得結果更為精確。此外,假設有一個模型庫,可以視作是一個存儲數學模型的“大倉庫”,通過構建模型庫并實現自動化選取較好模型的目的,即模型更加準確。作為統一度量模型好壞的偏差率,是構建最優動態模型的關鍵。采用數學定義得到偏差率,公式如下:
2.單一模型簡介。通過查閱相關資料發現,預測分析模型共有9種。而根據預測范圍、預測準確度以及預測所需數據量大小剔除了幾種模型,最終選擇以下4類模型。
2.1 馬爾薩斯模型:在孤立的生物群體中,生物總數的變化率與生物總數成正比,但這個模型存在一定的缺陷:忽略了群體個體之間的差異。
2.2 Logistic模型:又稱阻滯增長模型,其原理是考慮到自然資源、環境條件等因素對人口增長的阻滯作用,對指數增長模型的基本假設進行修改后得到的。
2.3 時間序列模型:是根據客觀事物發展的連續規律性,運用過去的歷史數據,進一步推測未來的發展趨勢。但時間序列分析法對于短、近期預測比較顯著。
2.4 灰色預測模型:是一種對含有不確定因素的系統進行預測的方法。用觀察到的反映預測對象特征的時間序列來構造灰色預測模型,預測未來的特征量。
四、應用及實例
1.數據來源及數據處理。選取了自2015年5月26日至2015年9月3日“滬深300”的百度指數搜索量(即用戶關注度)作為研究樣本,數據來源于百度指數官網。該樣本包括了網絡輿情傳播的形成期、高潮期和消退期三個階段。建立搜索量是關于時間函數,需要對其進行累加得到所需的變量數據。累加數據如圖4-1。為了建模的方便,之后會使用時間變量t=1,2,3…來替換具體日期。
2.單一模型分析。從前9期搜索量開始建模(除ARIMA模型),分別應用到馬爾薩斯模型、Logistic模型、ARIMA模型以及灰色預測這四種模型,得到各個模型的預測值、初始值和增長率等各項統計指標,并預測出下一期的搜索量,直到迭代輸出92期所有的預測結果。其中馬爾薩斯模型將t值代入模型得到的預測值與真實值比較??梢燥@著看出隨著時間的增長,預測值與真實值的偏離程度不斷擴大。說明其擬合效果隨著期數的增加逐漸變差。由于ARIMA模型不適用于少量數據的預測,因此通過計算篩查,從第14期開始進行輿情預測。雖然預測值走勢總體上是和實際相符合的,但也存在偏差較大的預測區間。灰色預測模型的預測結果雖然最小偏差率僅0.21極其接近實際值,但其最大偏差率為27.06,同樣體現了預測整體并不完美,這也恰恰說明,使用單一擬合預測模型是很難達到最優效果的。
3.最優動態模型。選取了符合股災輿情數據的四個模型組合成一個模型庫,并建立統一的評價標準。模型庫根據不同時間段的輿情數據自動化建模,直到得到評價指數最高的一個模型,得到的模型為下一期輿情演化預測。以“滬深300”事件為例,將其產生的搜索量數據應用到建立完整的模型庫。通過偏差率進行每一期最優模型的選擇,將最小偏差率的模型作為下一期的預測模型。整個動態模型的偏差率保持在6%左右,最大偏差率出現在第37期,達到了12%,最小的偏差接近于0。由最優動態模型預測出的預測值,如圖4-2。其是由3種不同預測模型組合而成的,如第14、15期預測模型為Logistic模型,而第16期則是ARIMA模型,到了第36期灰色預測成為了預測模型。因此最優動態模型由41期Logistic模型、44期時間序列模型以及7期灰色預測模型。
五、結語
2015年股市如此的“異?!?,一方面大大挫傷了股民的積極性,另一方面也反映了中國股市監管制度不健全的弊端。雖然政府已經采取了一系列的舉措進行干預。但由于政策干預不及時、成效過慢等原因,導致了社會動蕩。作為網絡公民的我們,在突發事件到來之際,不應該在網上傳播一些不正確的事實和謠言等。政策的制定離不開技術的支持,技術上越快的反應速度以及越準確的預測精度,才可以將網絡輿情的訛傳危害性降到最低。本文建立動態模型得到的預測結果,可以顯著發現其在預測網絡輿情演化時速度和精度方面的優勢。因此,為網絡輿情的發展及預測做出了一定的貢獻,為網絡輿情實時監測技術提出保障。此外,動態模型的實時性也能為政府定位事件的重要節點提供依據,保證國家相關部門政策的時效性。
參考文獻:
[1] 楊暢,蘇國強,蘭月新,何永紅. 基于統計回歸模型的突發事件網絡輿情研究[J]. 武警學院學報,2014,(07):80-83.
[2] 滕文杰. 時間序列分析法在突發公共衛生事件網絡輿情分析中的應用研究[J]. 中國衛生統計,2014,06:1071-1073.
[3] 朱毅華,張超群. 基于影響模型的網絡輿情演化與傳播仿真研究[J]. 情報雜志,2015,(02):28-36.
[4] Yao C Y. The Application Study of Simulation Model Based on Cellular Automata in the Evolution of Internet Public Opinion[J]. Applied Mechanics Materials, 2012, 198-199:828-832.
[5] Cao W, Fu W, Lan Y, et al. The Research about Diffusion Law and Countermeasures of Internet News Public Opinion Based on Gompertz Curve Model[J]. Journal of Modern Information, 2015.
[6] Sun S, Zhang Y, Zhang J, et al. Study on Evolution Model of Internet Public Opinion Based on Complex Network[C]// International Conference on Electronics, Network and Computer Engineering. 2016.
[7] 百度.百度搜索指數.滬深300搜索量,http://index.baidu.com/?tpl=trendword=%CE%BA%D4%F2%CE%F7.
[8] 中國互聯網信息中心.第39次中國互聯網網絡發展狀況統計報告,http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201507/t20150722_52624.htm.