蘭月新+夏一雪+劉冰月



〔摘 要〕 [目的/意義]研究網絡輿情演化的多維度模型,從更高視角解讀網絡輿情傳播規律,豐富和完善網絡輿情傳播理論。[方法/過程]定量分析網絡輿情趨勢預測中信息增長率的變化問題,構建以增長率和時間為自變量,信息累計數量為因變量的多維函數模型,并通過MATLAB仿真研究各個參數對網絡輿情傳播的影響以及網絡輿情傳播路徑分析,然后通過“成都女司機”微博數據驗證了模型的可行性,更加直觀地詮釋了高維模型研究網絡輿情演化機理的優勢。[結論/結果]經過理論建模和實證分析得出,將logistic模型拓展到高維研究網絡輿情演化機理是可行的,并且多維度模型很好地解釋了網絡輿情數據出現多個“峰值”現象,而網絡輿情統計數據的實質是高維度模型曲線在時間軸的投影。
〔關鍵詞〕網絡輿情;Logistic模型;演化機理;仿真分析;實證分析;大數據
DOI:10.3969/j.issn.1008-0821.2017.08.008
〔中圖分類號〕 G206 〔文獻標識碼〕A 〔文章編號〕1008-0821(2017)08-0057-08
〔Abstract〕This paper studied the multidimensional model of network public opinion evolution,interpreted the law of network public opinion from a higher angle,and enriched the theory of network public opinion communication. Quantitative studied the change of information growth rate during network public opinion trends forecast,constructed a multidimensional function model that the rate of growth and time were the independent variables,and the cumulative number of information was the dependent variable. Then studied the effect of various parameters on the network public opinion dissemination and its path through MATLAB simulation,verified the feasibility of the model by analysis of the “Chengdu female driver” microblog data,and illustrated the advantages of the high dimensional model to study the mechanism of network public opinion. Through theoretical modeling and empirical analysis,it was feasible to extend the Logistic model to higher dimensional research of network public opinion evolution mechanism. The multidimensional model explained the phenomenon of appearing more “peak” in network public opinion data,and the essence of network public opinion statistics was the projection of the high dimensional model curve in the time axis.
〔Key words〕 network public opinion;logistic model;evolution mechanism;simulation analysis;empirical analysis;big data
1 現狀分析
根據第39次中國互聯網絡發展狀況統計報告(CNNIC),截至2016年12月,我國網民規模達7.31億,互聯網普及率為53.2%,其中手機網民規模達6.95億,網民中使用手機上網的比例為95.1%[1]。隨著移動寬帶互聯網的普及,網民可以通過手機快速、及時參與網絡熱點討論,所以,每天都會發生規模或大或小的網絡輿情,其中包含定量文字、圖片、視頻等,形成一個網絡輿情大數據環境。面對海量網絡輿情信息,如何精確研究網絡輿情演化機理成為網絡輿情精細化研究的一個重要內容。
網絡輿情是極具現階段中國政治與社會特色的研究領域。國外網絡媒體在反映社情民意方面的作用不及我國,研究相對較少,他們較多的關注網民進行的網絡內容創作、編輯與篩選,使網民能夠與編輯、記者進行意見交流,對網絡新聞制造和傳播產生影響。國外網絡輿情的傳播演化的研究,吸引了物理學、計算機、通信網絡、社會學和經濟管理等學科學者的關注,顯示了該領域的跨學科性和熱門性[2-6]。這些研究雖然能解釋網絡輿論傳播演化中的某些現象,但輿論主體間具有情感性、復雜性和多變性的社會關系,使這些模型的解釋能力都有各自的局限,且無法描述網絡輿論演化的整體態勢。
國內網絡輿情演化機理方面研究較多,將國內研究文獻通過CiteSpace軟件進行可視化可使前沿主題更加清晰,隱去關鍵詞出現頻率3以下的關鍵詞,生成關鍵詞共現可視化圖譜,如圖 1所示。觀察知識圖譜發現,目前國內網絡輿情演化機理研究前沿主要集中在 3個部分: 一是以“自回歸模型”、“指數平滑模型”、“隱馬爾科夫模型”等為主的基于統計學的輿情演化機理模型[7-9](A區); 二是以“灰色理論模型”、“神經網絡模型”、“支持向量機模型”、“貝葉斯網絡”等為主的基于智能機器算法的輿情演化機理模型[10-12](B區); 三是以“系統動力學”、“社會網絡分析”、“演化博弈”等為主的基于社會學理論仿真的輿情演化機理模型[13-15](C區) 。
雖然學術層面取得了很多研究成果,但是網絡輿情演化機理仍有很多問題需要解決,例如①如何解讀網絡輿情統計數據的多“峰值”現象;②目前的演化機理模型大多只有一個時間變量和一個信息量變,但網絡輿情傳播演化受多個因素影響,所以需要考慮更多的影響要素,開展精確化研究。綜合以上問題,本文在定性分析網絡輿情演化機理的基礎上,通過求解Logistic模型的解析解,構建多維度演化機理模型開展網絡輿情演化的精細化研究,以期為網絡輿情傳播理論提供參考依據。
2 網絡輿情演化機理問題
隨著網絡輿情監測軟件的開發和利用,通過軟件可以非常便利的采集新聞網站、微博、博客、微信、論壇等互聯網平臺上的網絡輿情信息,為網絡輿情分析提供統計數據。例如, “信息量~時間”的二維統計數據(圖2)常用來描述網絡輿情演化機理,通過統計數據可以直觀了解網絡輿情傳播態勢。
然而,根據網絡輿情定義[16-18],網絡輿情即網民通過互聯網對某一網絡話題進行交流的信息總和。不難發現,網絡輿情定義中,信息量和值是一個隨時間變化的變量,所以需要對監測軟件獲取的統計數據進行累加,得到累加數據,進而構造信息量和值變量研究網絡輿情演化機理。
2.1 網絡輿情演化基本模型
2.2 網絡輿情演化動態預測問題
文獻[19]研究了基于logistic模型的動態預測方法,即,首先,通過監測獲取的數據應用差分回歸法確定模型系數 和K,進而預測輿情未來趨勢;其次,隨著新數據的加入逐步修正模型系數 和K,進而實現動態預測輿情未來趨勢。但在實際應用中,隨著新數據的加入,模型參數 變化明顯,所以參數 亦隨著時間在變動。以“歸真堂”輿情為例,圖3是“歸真堂”網絡輿情網絡新聞詞頻統計數據[20](輿情監測區間為2012.02.10-2012.03.13,關鍵詞為歸真堂)。以前10個數據為基礎數據確定模型參數,然后逐個加入后面的數據,通過差分回歸法確定增長率,得出增長率隨時間變化的曲線(圖4),圖中曲線在初期變化明顯,但隨著數據的增多變化逐步趨于穩定。
綜合以上兩點,網絡輿情在傳播演化過程中,網絡輿情信息量隨著時間的變化而變化,并且隨著增長率的變化而變化,所以如果將變化率作為變量來看待的話,便可以構建網絡輿情信息量關于時間和增長率的多元函數關系。基于此,本文構建網絡輿情演化的多維度模型,從更高視角解讀網絡輿情傳播演化機理,以期為研究網絡輿情傳播理論提供參考依據。
3 基于logistic模型的網絡輿情演化機理多維模型
3.1 網絡輿情演化機理多維建模
在K=100,初值=1%K時,繪制模型對應三維圖像示意圖(圖5),圖中曲面均是連續光滑的,可以對其進行求導,研究對應變量的變化規律。模型在面的投影(圖6)均是“S”形曲線,與網絡輿情數據累加量的曲線相吻合,換句話說我們通過監測軟件獲取的輿情累加數據曲線只是本文構建的多維模型的一個投影。所以,本文構建的演化機理多維模型有助于從更高視角解讀網絡輿情演化機理,并且可以深層次挖掘數據之中的變化規律,尤其是發現增長率對網絡輿情傳播的影響。(注:三維曲面圖中紅色代表網絡輿情信息量最大,黃色次之,藍色最小)。
除此之外,本文構建的網絡輿情演化多維模型中的初值是作為常數出現的,不同的初值對網絡輿情的影響相對較小(圖7),模型曲面會隨著初值的變化被“壓縮”或者“拉長”,但曲面形態基本不變。通過模型也可看出,它對網絡輿情的影響包含于之中,所以下文會對開展一些研究,而不針對初值開展專門研究。
3.2 模型分析
4 仿真研究
網絡輿情演化多維模型中的涉及參數包括、、,在這些參數作用下網絡輿情演化呈現多維曲面結構,而網絡輿情信息量曲線則是這個曲面上的一條曲線,并且隨著參數的變化,這條空間曲線在曲面上的位置也在變化,也就是網絡輿情傳播路徑在發生變化。基于此,本文先研究模型的參數仿真,然后研究網絡輿情傳播路徑仿真與分析。
4.1 關鍵參數仿真
4.1.1 變上限模型仿真對比研究
通過圖11發現,上限高的曲面完全覆蓋上限低的曲面,直面與三個曲面相交的三條空間曲線均具有“S”曲線結構,且網絡輿情傳播初期增長率高,隨著時間的推移,信息量在增長,而增長率在變小,在信息量趨近于飽和之時,增長率也穩定于最小值(圖12),這個最小值往往就是模型擬合數據獲取的定值增長率。這些圖像特征說明上限值的增大極大提升了網絡輿情信息的增長空間,換句話說,當網絡輿情信息量突破上限值后,信息量增長速度不會變緩,而是會繼續高速增長,直至接近下一個信息量上限前,增速才變緩慢。所以,在某些網絡輿情信息量會出現多個小的“S”形,其對應為累加的統計數據曲線圖則會出現多個“峰值”現象,雖然如此,在對網絡輿情數據進行累加之后,總體趨勢依然呈現“S”形,將三條曲線在軸做投影很好地印證了這一點(圖13)。
以“霧霾”微博輿情數據(統計時間:2016.11.1-2016.2.16)為例,在微觀層面,累加數據曲線是由多個小的“S”形曲線組成的,每產生一個小的“S”形,信息量都會突破原有上限繼續增加(圖14);在宏觀層面,總體依然呈現“S”形,并且每一個小的“S”形對應統計數據的一個峰值,圖中的累加曲線是一條二維曲線,其實質是本文構建的多維模型曲面上空間曲線的一個投影。
4.1.2 恒定、高速增長模型仿真研究
以“和頤酒店遇襲”事件微博輿情數據為仿真基礎,該事件微博輿情信息的上限與初值的比為,=1.9540。具體仿真參數設定見表3,根據MATLAB繪制模型對應曲面(圖15),研究模型在恒定、較高的增長率條件下的演化規律。
通過圖16發現,恒定高增長率條件下網絡輿情信息量短時間快速增長達到飽和狀態,所以突破上限的概率明顯增加,突破第一個上限后,信息量繼續增加直至下一個上限,進而形成前文討論的多“S”形狀(圖15和圖16中虛線所示),這種現象會隨著網民關注度的增加不斷出現,直至關注度降低后穩定于一個高值上限,這也和前文研究相吻合;反過來,如果網絡輿情信息量空間受限,即上限降低,則網絡輿情則將快速飽和于一個低值上限,以此類推,網民關注持續降低會使網絡輿情信息量飽和于一個較低的數值。所以當網民數量相對穩定時,這種現象較為常見,當多個網絡輿情同時期產生后,關注度高的一個網絡輿情信息量空間增加出現多個輿情數據峰值,而其他網絡輿情信息量空間降低,網絡輿情很快飽和, 本文稱這種現象為信息量相對“守恒”現象。
4.2 網絡輿情傳播路徑仿真與分析
通過前文分析,網絡輿情產生初期,時間小,增長率大,信息量小;網絡輿情飽和階段時間大,增長率則很小,信息量很大。基于此,本文研究網絡輿情傳播不同路徑對輿情傳播的影響,選取三個平行于軸的直面與模型曲面相交構造路徑,三個直面方程為
通過圖17發現,三條路徑是模型曲面與三個直面相交而成的,它代表網絡輿情具體的傳播路徑,三條路徑在面進行投影均是“S”曲線(圖18)。三條路徑上增長率均隨著時間增長而單調遞減,路徑起點和終點相同,但是網絡輿情信息量隨著時間變化的曲線卻差距很大,三條路徑在面進行投影(圖18)不難印證這一點:1號路徑在經歷5個時間單位后快速達到飽和狀態,2號次之,而3號路徑則在30個時間單位才達到飽和,所以1號和2號路徑突破上限的概率遠高于3號路徑。在實際網絡輿情傳播過程中,由于網絡輿情傳播受網民關注度、意見領袖、網絡水軍的影響,所以輿情傳播實際路徑會在多個模型路徑上波動,所以從微觀視角觀察的話,反映網絡輿情傳播路徑是一條有很多“彎曲”的空間曲線。
結合以上內容,容易得出,網絡輿情監測軟件獲取的輿情數據僅僅是網絡輿情傳播過程中信息量在時間軸上的“投影”,直接研究監測數據會損失部分關鍵信息,而本文構建的多維度模型將增長率作為一個維度進行建模,可以得出影響輿情傳播的關鍵就是增長率函數,這一點更好地解釋網絡輿情數據的波動現象,也可以為網絡輿情導控提供指導。
5 模型驗證研究
5.1 數據來源
2015年5月3日下午,成都市嬌子立交橋男司機狂毆女司機事件引發一場輿論風暴,新浪微博“@成都商報”首次曝光嬌子立交橋下男子狂毆女司機事件,輿論迅速發酵。截至13日24時,通過網絡輿情監測軟件獲取新浪微博發布和轉發信息100萬多條,相關話題#女司機慘遭男司機暴打#閱讀量8312.8萬,話題討論數12.8萬。以新浪微博按小時統計數據為基礎繪制網絡輿情傳播趨勢圖(圖19)。
5.2 數據建模
5.3 結果分析
通過圖20的三維圖像可以得出如下結果:
1)“成都女司機”輿情曲線完全附著在空間曲面上,監測獲取的輿情數據,只是網絡輿情演化信息量在時間軸的投影。正好驗證了本文構建的多維模型的合理性,相對于二維的監測數據,多維模型是相對全面的描述了網絡輿情傳播機理。
2)將黑色曲線在面做投影,得到投影圖像(圖21),容易看出,增長率整體趨勢隨著時間增長而變小,但如果將圖像放大會發現增長率在局部出現了波動,這一點正好印證了仿真研究中網絡輿情信息量增長率會出現波動現象,進而導致網絡輿情傳播路徑是一條有很多“彎曲”的空間曲線(圖22)。
通過MATLAB仿真研究了模型特性,并通過“成都女司機”網絡輿情數據驗證了模型。通過本文的研究可以得出以下結論:
1)將logistic模型拓展到高維研究網絡輿情演化機理是可行的。這一點已經通過模型仿真和實際數據進行了驗證;
2)本文構建的多維度模型很好地解釋了網絡輿情數據出現多個“峰值”現象。多“峰值”現象的實質是網絡輿情傳播不斷超越模型上限的過程。
3)網絡輿情統計數據的實質是高維度模型曲線在時間軸的投影,并且網絡輿情傳播路徑可以在多條增長率函數上波動,但是信息量在時間軸的投影依然是“S”形曲線。
基于以上結論可以繼續開展研究,例如:本文構建的基礎模型是logistic模型,除此之外,還有其他的“S”形曲線模型有待進一步嘗試。
參 考 文 獻
[ 1 ]中國互聯網絡信息中心.第39次中國互聯網絡發展狀況統計報告[R/OL]. [2017-2-18]. http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201701/t20170122_53271.htm
[ 2 ] Rowe G,Hawkes G,Houghton J.Initial UK Public Reactionto Avian Influenza:Analysis of Opinions Posted on the BBC Website[J].Health,Risk&Society Health,Risk&Society,2012,10(4).
[ 3 ] Daley D J,Kendall D G.Epidemics and Rumours[J].Nature(S0028-8036),1965,204(9):1118.
[ 4 ] Serge Galam. Modeling Rumors:The no Plane Pentagon French Hoax Case[J]. Physica A:Statistical Mechanics and its Applications,2013,320:571-580.
[ 5 ] Zanette D H. Dynamics of Rumor Propagation on Small-world Networks[J].Phys. Rev. E (1539-3755),2012,65:041908.
[ 6 ] Moreno Y,Nekovee M,Pacheco A F.Dynamics of Rumor Spreading in Complex networks[J] . Phys.Rev.E E(S1539-3755),2014,69:066130.
[ 7 ]周耀明,李弼程.一種自適應網絡輿情演化建模方法[J].數據采集與處理,2013,28(1):69-76.
[ 8 ]徐敏捷,劉冰月.基于組合預測的網絡輿情數據預測模型研究[J].情報科學,2016,34(12):40-46.
[ 9 ]何建民,李雪.面向微博輿情演化分析的隱馬爾科夫模型研究[J].情報科學,2016,34(4):7-13.
[ 10 ]杜智濤,謝新洲.利用灰色預測與模式識別方法構建網絡輿情預測與預警模型[J].圖書情報工作,2013,57(8):27-33.
[ 11 ]孫玲芳,周加波,林偉健,等.基于BP神經網絡和遺傳算法的網絡輿情危機預警研究[J].情報雜志,2014,33(11):18-24.
[ 12 ]張一文,齊佳音等.基于貝葉斯網絡的非常規危機事件預警研究[J].圖書情報工作,2012,56(2):76-81.
[ 13 ]張一文.齊佳音等.網絡輿情與非常規突發事件作用機制研究——基于系統動力學建模[J].情報雜志,2010,29(9):1-6.
[ 14 ]王晰巍,邢云菲,趙丹,等.基于社會網絡分析的移動環境下網絡輿情信息傳播研究—以新浪微博“霧霾”話題為例[J].圖書情報工作,2015,59(4):14-22.
[ 15 ]陳福集,黃江玲.基于演化博弈的網絡輿情熱點話題傳播模型研究[J].情報科學,2015,33(11):74-78.
[ 16 ]曾潤喜,徐曉林.網絡輿情突發事件預警系統、指標與機制[J].情報雜志,2009,28(11):52 -54.
[ 17 ]王青,成穎,巢乃鵬.網絡輿情監測及預警指標體系構建研究[J].圖書情報工作,2011,55(4):54-57.
[ 18 ]丁菊玲,勒中堅,薛圈圈.定量網絡輿情危機預警模型構建[J].圖書情報工作,2011,55(10):59-63.
[ 19 ]蘭月新,董希琳,蘇國強.公共危機事件網絡輿情預測問題研究[J].情報科學,2014,32(4):35-38.
[ 20 ]鳳凰網新聞頻道:歸真堂事件展現網絡公關攻防技巧[EB/OL].[2013-1-20].http://news.ifeng.com/gundong/detail_2012_02/29/12862548_0.shtml?_from_ralated.
(本文責任編輯:孫國雷)