徐紅
淺談網(wǎng)絡(luò)輿情預(yù)測方法
徐紅
(四川警察學(xué)院,四川 瀘州 646000)
隨著互聯(lián)網(wǎng)的不斷發(fā)展以及網(wǎng)民人數(shù)的不斷增多,網(wǎng)絡(luò)輿情對社會的影響越來越大,預(yù)測網(wǎng)絡(luò)輿情的發(fā)展趨勢對維護社會和諧具有重要的意義。分析了基本的網(wǎng)絡(luò)輿情預(yù)測方法,重點探討了基于人工神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)輿情預(yù)測方法,并給出了相應(yīng)的設(shè)計和實現(xiàn)方法。
網(wǎng)絡(luò)輿情;預(yù)測方法;ARIMA;灰色預(yù)測
隨著互聯(lián)網(wǎng)的飛速發(fā)展和網(wǎng)民數(shù)量的不斷增加,網(wǎng)絡(luò)在中國已經(jīng)成為一類重要的媒體。由于網(wǎng)絡(luò)信息發(fā)布具有隱匿性等特點,吸引了廣大網(wǎng)民不斷地通過互聯(lián)網(wǎng)發(fā)表個人的觀點和意見,眾多網(wǎng)民觀點和意見匯聚形成了網(wǎng)絡(luò)輿情。
近年來,移動互聯(lián)網(wǎng)的普及使得網(wǎng)民之間能更加方便、快捷地分享自己的思想和進行信息的交互,推動網(wǎng)絡(luò)輿情產(chǎn)生及快速地擴散,對社會生活產(chǎn)生了更大的影響。如果網(wǎng)絡(luò)輿情處理不當(dāng),就可能誘發(fā)民眾的過激行為,威脅社會的穩(wěn)定。因此,必須對網(wǎng)絡(luò)輿情加以正確應(yīng)對,以促進社會的和諧發(fā)展。
由于網(wǎng)絡(luò)輿情關(guān)系到社會的穩(wěn)定發(fā)展,引起了眾多學(xué)者的關(guān)注,近些年來已成為研究的熱點。網(wǎng)絡(luò)輿情研究涉及面較廣,大致包括網(wǎng)絡(luò)輿情監(jiān)測、網(wǎng)絡(luò)輿情分析、網(wǎng)絡(luò)輿情預(yù)測和網(wǎng)絡(luò)輿情引導(dǎo)等。網(wǎng)絡(luò)輿情預(yù)測是根據(jù)當(dāng)前網(wǎng)絡(luò)輿情的發(fā)展?fàn)顩r對網(wǎng)絡(luò)輿情的未來發(fā)展趨勢進行預(yù)測。網(wǎng)絡(luò)輿情預(yù)測對于把握網(wǎng)絡(luò)輿情的發(fā)展趨勢、指導(dǎo)網(wǎng)絡(luò)輿情的引導(dǎo)工作、保障社會的和諧穩(wěn)定非常重要。因此,網(wǎng)絡(luò)輿情預(yù)測在網(wǎng)絡(luò)輿情工作中具有重要的地位,而預(yù)測方法又是網(wǎng)絡(luò)輿情預(yù)測的核心,它直接關(guān)系著預(yù)測的準(zhǔn)確性和穩(wěn)定性,非常有必要對網(wǎng)絡(luò)輿情預(yù)測方法進行研究。
本文對基本的網(wǎng)絡(luò)輿情預(yù)測方法進行分析,探討其優(yōu)缺點,然后以人工神經(jīng)網(wǎng)絡(luò)為例闡述網(wǎng)絡(luò)輿情預(yù)測的具體實施步驟和方法。
通常而言,網(wǎng)絡(luò)輿情的發(fā)展趨勢在互聯(lián)網(wǎng)上可以通過某個話題的發(fā)帖數(shù)、回帖數(shù)、點擊數(shù)等數(shù)據(jù)隨時間的變化態(tài)勢客觀地反映出來,即發(fā)帖數(shù)、回帖數(shù)等相關(guān)指標(biāo)對應(yīng)的時間序列客觀上表征了網(wǎng)絡(luò)輿情的發(fā)展趨勢。網(wǎng)絡(luò)輿情預(yù)測方法就是基于時間序列的計算和處理,以實現(xiàn)對未來網(wǎng)絡(luò)輿情走勢的預(yù)測?;镜木W(wǎng)絡(luò)輿情預(yù)測方法分析如下。
ARIMA模型是自回歸移動平均模型的簡稱,它常被用于短期的時間序列預(yù)測。該方法的基本思想是將時間序列視為隨機序列,并建立相應(yīng)的數(shù)學(xué)模型ARIMA(,,)來近似這個時間序列。然后利用這個模型再進行預(yù)測。
假設(shè)時間序列1,2,…,n是平穩(wěn)隨機序列,它對應(yīng)的ARIMA(,,)必須滿足式(1)和式(2):
t1t-1…+pt-p+δ+t(1)
tt+1t-1+…+qt-q(2)
式(1)(2)中:和為系數(shù);為回歸階次;δ為常數(shù);為白噪聲;為原時間序列的均值;為移動平均階次。
如果時間序列不是平穩(wěn)隨機序列時,首先要對它進行差分處理,以轉(zhuǎn)換得到平穩(wěn)序列,再通過解上述方程建立模型。
ARIMA預(yù)測的主要步驟如下:①利用單位根檢驗法對時間序列進行檢驗,如果序列存在單位根則不是平穩(wěn)隨機序列,否則就是平穩(wěn)隨機序列;②如果時間序列不是平穩(wěn)隨機序列,則通過差分處理將其轉(zhuǎn)換為平穩(wěn)隨機序列;③將平穩(wěn)隨機序列建立起ARIMA(,,)模型;④對建好的ARIMA(,,)模型進行檢驗;⑤利用ARIMA(,,)模型進行時間序列預(yù)測。
ARIMA預(yù)測方法的優(yōu)點是模型簡單,但是它的缺點也很明顯,就是它要求時間序列是穩(wěn)定的,所以該方法的使用有一定的局限性。
灰色系統(tǒng)是用來解決信息不完備系統(tǒng)的數(shù)學(xué)方法。灰色預(yù)測屬于灰色系統(tǒng)的內(nèi)容之一,它通過灰色微分函數(shù)對不確定的系統(tǒng)進行分析和預(yù)測。而網(wǎng)絡(luò)輿情具有較強的不確定性,所以可以將灰色預(yù)測運用在網(wǎng)絡(luò)輿情分析中?;疑A(yù)測方法通過處理原始時間序列來獲取系統(tǒng)的變化規(guī)律,生成規(guī)律性強的數(shù)據(jù)序列,再根據(jù)數(shù)據(jù)序列建立微分方程模型并求解,以此來預(yù)測系統(tǒng)未來的狀態(tài)。
為了突出時間序列的規(guī)律性,需要對原始時間序列進行運算處理,累加和累減是常用的有效處理方式。
處理后的時間序列可以通過GM(1,1)模型建立如下所示的微分方程:

式(3)中:為處理后的時間序列;為發(fā)展灰數(shù);為內(nèi)生控制灰數(shù)。
求解該微分方程即可得到用以預(yù)測的模型?;疑A(yù)測的優(yōu)點是簡單,不需要大量的數(shù)據(jù),在時間序列數(shù)據(jù)較少時能獲得較好地預(yù)測效果;它的缺點是當(dāng)時間序列具有較強的波動性時,其預(yù)測效果會受嚴(yán)重影響。
網(wǎng)絡(luò)輿情本質(zhì)上是一個變化發(fā)展的動態(tài)系統(tǒng),表征網(wǎng)絡(luò)輿情發(fā)展趨勢的時間序列是非線性的序列。網(wǎng)絡(luò)輿情預(yù)測需要做的工作就是通過已知的時間序列1,2,…,n,推導(dǎo)出今后一段時間的時間序列n+1,n+2,…,已知的時間序列和未來的時間序列之間是存在一定非線性關(guān)系的。而人工神經(jīng)網(wǎng)絡(luò)中的BP神經(jīng)網(wǎng)絡(luò)理論上具有無限逼近任何非線性關(guān)系的能力,所以可以采用BP神經(jīng)網(wǎng)絡(luò)逼近網(wǎng)絡(luò)輿情的時間序列,進而實現(xiàn)對網(wǎng)絡(luò)輿情的預(yù)測。
基于BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)輿情預(yù)測設(shè)計和實現(xiàn)方法如下所示。
對原始時間序列1,2,…,n進行歸一化處理,將所有數(shù)據(jù)映射到[0,1]區(qū)間,可以得到新的時間序列數(shù)據(jù)′1,′2,…,′n。
針對網(wǎng)絡(luò)輿情預(yù)測,這里采用單步預(yù)測方式,用時間序列中連續(xù)的幾個數(shù)據(jù)預(yù)測之后的1個數(shù)據(jù)。即BP神經(jīng)網(wǎng)絡(luò)根據(jù)之前的個時刻的數(shù)據(jù)預(yù)測當(dāng)前時刻的數(shù)據(jù)。根據(jù)這個條件,建立BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練集如表1所示。
表1 BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練集
序號輸入輸出 1x′1,x′2,…,x′k-1x′k 2x′2,x′3,…,x′kx′k+1 ……… n-k+1x′n-k+1,x′n-k+2,…,x′n-1x′n
BP神經(jīng)網(wǎng)絡(luò)采用輸入層、隱含層和輸出層的3層結(jié)構(gòu),輸入層為個節(jié)點,輸出層為1個節(jié)點,分別對應(yīng)用于預(yù)測的個時刻數(shù)據(jù)以及1個時刻的預(yù)測值。根據(jù)Kolmogorov定理設(shè)置隱含層節(jié)點個數(shù)。隱含層和輸出層各節(jié)點的激活函數(shù)均選用Sigmoid函數(shù)。
BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程如下:①初始化相關(guān)參數(shù),設(shè)置包括學(xué)習(xí)率、最大迭代次數(shù)、誤差范圍等參數(shù),對BP神經(jīng)網(wǎng)絡(luò)連接權(quán)值矩陣賦隨機值,在訓(xùn)練集中選取一組數(shù)據(jù)作為訓(xùn)練樣本;②將訓(xùn)練樣本提供給BP神經(jīng)網(wǎng)絡(luò),BP神經(jīng)網(wǎng)絡(luò)計算出隱含層、輸出層的輸出;③計算模型輸出的總誤差,再通過求導(dǎo),計算各層的誤差,根據(jù)計算得到的誤差對網(wǎng)絡(luò)權(quán)值進行修正;④如果全部樣本都完成了訓(xùn)練則跳轉(zhuǎn)至步驟⑤,否則選取下一組訓(xùn)練樣本,跳轉(zhuǎn)至步驟②;⑤如果BP網(wǎng)絡(luò)全局誤差小于或者訓(xùn)練已達到最大迭代次數(shù),則完成訓(xùn)練。
向訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)輸入經(jīng)歸一化處理的時間序列,然后將BP神經(jīng)網(wǎng)絡(luò)的輸出值反歸一化則可得到對應(yīng)的預(yù)測值。
當(dāng)前,網(wǎng)絡(luò)輿情已成為影響社會安定團結(jié)的重要因素,對網(wǎng)絡(luò)輿情發(fā)展趨勢的預(yù)測就顯得尤為重要。本文對網(wǎng)絡(luò)輿情預(yù)測方法進行了討論,分析了基本的網(wǎng)絡(luò)輿情預(yù)測方法,重點介紹了采用BP神經(jīng)網(wǎng)絡(luò)進行網(wǎng)絡(luò)輿情預(yù)測的方法,并闡述了具體的設(shè)計和實現(xiàn)方法。本文的研究可為相關(guān)的網(wǎng)絡(luò)輿情工作提供一定的借鑒和參考。
[1]劉毅.略論網(wǎng)絡(luò)輿情的概念、特點、表達與傳播[J].理論界,2007(1):11-12.
[2]周蔚華.網(wǎng)絡(luò)輿情概論[M].北京:中國人民大學(xué)出版社,2015.
[3]黃亞駒,陳福集,游丹丹.基于混合算法和BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)輿情預(yù)測研究[J].情報科學(xué),2018,36(2):24-29.
[4]杜智濤,謝新洲.利用灰色預(yù)測與模式識別方法構(gòu)建網(wǎng)絡(luò)輿情預(yù)測與預(yù)警模型[J].圖書情報工作,2013,57(15):27-33.
[5]蘭月新,董希琳,蘇國強.公共危機事件網(wǎng)絡(luò)輿情預(yù)測問題研究[J].情報科學(xué),2014,32(4):35-38.
G202
A
10.15913/j.cnki.kjycx.2019.23.024
2095-6835(2019)23-0060-02
〔編輯:張思楠〕