楊 浩,向 征
(1. 湖南信息學院計算機科學與工程學院,湖南 長沙 410151;2. 湖南大學物理系,湖南 長沙 410000)
自組織網絡是移動計算機網絡中的一種[1],突發性輿情就是在移動計算機網絡中通過電腦等工具,對即將要發生和已經發生的事件進行主觀評論[2]。目前網絡上出現很多網民對不了解的事情發表個人觀點,導致言語上對事件當事人產生很多負面影響,破壞網絡大環境秩序性。因此,對輿論的實時監測意義重大[3]。
針對此問題,目前相關領域專家也得到了較好的研究成果。例如:王會權等人[4]提出基于大數據思維的突發性輿情交互信息監控方法。該方法在分析大數據與網絡輿情適用性的基礎上綜合了大數據思維,建立網絡輿情監控模型,將網絡輿情的監控工作分為數據采集、數據處理和數據分析三部分,并通過大數據技術對網絡輿情實施監控并解決即將面臨的問題,進而實現突發性輿情交互信息監控。但是該方法不具有實時性,無法提前獲取輿情可能發生的聚集區域,導致監控過程難度較大,監控時延較長,降低了輿情監控效率。羅凌璐等人[5]提出智能過程層網絡突發性輿情交互信息監控方法。該方法將過程層交換機作為過程層網絡運行狀態的數據采集和監控單元,基于網絡分析儀通過動態學習過程層網絡拓撲、建立鏈路映射關系和流量統計列表,實時監控網絡突發性輿論,以此實現突發性交互信息的監控,該方法沒有利用交互空間掃描變量和概率分布模型運算出最有可能出現輿情的空間窗口及其概率再進行控制輿情,因此該方法只能根據網絡之間的關系實時監控輿情發展,無法提前得知輿情最有可能出現的地理區域,導致輿情監控率偏低。周昊飛等人[6]提出基于深度置信網絡的突發性輿情交互信息監控方法。該方法利用灰度圖建立突發性輿論圖譜,精準表達出輿情走向,并建立用于識別輿情過程的深度置信網絡模型,在深度置信網絡模型的基礎上識別目前監控窗口內的突發性輿論,實現突發性輿情交互信息的監控。該方法在監控突發性輿情過程中,忽略了對交互空間掃描統計量的分析,無法判斷監控的輿情是否屬于隨機發生的,因此不能保證預測輿情聚集區域的真實性,降低了輿情預測率。
為解決上述傳統方法存在的問題,提出新的自組織網絡突發性輿情交互信息監控方法。
監測自組織網絡突發性輿情的過程就是利用掃描統計思想對自組織網絡進行數據掃描,獲取網絡用戶信息及網絡信息[7],最終確定出輿論聚集概率最大的窗口,實現突發性輿論監測。
假設交互空間掃描范圍S內的網絡項信息和用戶信息分別為Me及Mr,假設交互空間掃描范圍S內特定用戶閾值?的用戶數量小于Mr用戶信息量Rif數量,從而實現在不同區域和環境下對不同影響力用戶的實時輿情監測,并獲取到不同類別的輿情聚集窗口,則用戶信息Mr的表達式為
Mr=Count(Rif>?|S)=∑((ri2+ri1+ri3)>?)
(1)
假設交互空間掃描范圍S中特定閾值β的網絡項個數小于掃描變量Me網絡信息量Ejf數量,則網絡項信息Me的表達式為
Me=Count(Eif>β|S)=∑((ej2+ei1+ei3)>β)
(2)
式中,β為網絡信息閾值。
經統計發現,網絡中的數據具有隨機性且都為離散型數據,所以可利用泊松分布模型進行計算,因此當S的大小可隨意定義且S≥0時,Me需要遵從參數λ3>0泊松分布,即得出Me(s)…Poisson(λ3),則概率分布模型表達式為
P{X(x+S)-X(x)=n}=e-λs(λS)0/n!
(3)
式中,X(x+S)-X(x)表示在[x,S+x]區間內的自組織網絡用戶個數或者網絡項個數,其中n=0,1,2,…。
為更加精確監測不同空間區域的突發性輿論,分別分析實際地理空間區域內的交互空間掃描窗口和基于空間關系獲取的對應交互空間掃描窗口。
建立網絡空間現象及輿論目標之間的關系模型,并將其稱之為空間關系[8],首先建立自組織網絡空間的鄰接關系矩陣,得出不同地理區域間的關系,其構建過程為:


(4)
式中,W代表n個基本單元的空間區域的臨近關系,Wij代表掃描基本單元的實際地理區域i及j的鄰接關系,若Wij等于1,且區域i與區域j為鄰近區域,若Wij等于0,則區域i與區域j不相鄰。
獲取到大量交互空間掃描窗口后,運算出每個窗口的掃描統計量,并求解出每個窗口的對數似然比,以此辨別出不同地理空間區域內突發性輿情的聚集性[9],其求解經過為:
假設某個交互空間掃描窗口S中的輿情都屬于MIe類別的概率是p∈[0,1],在所有交互空間掃描窗口G中,除S外的其它輿情屬于MIe類別的概率是q∈[0,1],MIe類別指的是在某個交互空間掃描窗口S中的輿情符合閾值α的單個輿情。此時,若空假設為H0,S仍屬于G,但p=q,則假設為H1,S仍屬于G,但p>q。
則在空假設下關于泊松模型的μ(S)和μ(G)的表達式為

(5)
式中,Ks表示掃描窗口S中已發表的所有文章個數,KG表示所有掃描窗口G中已發布的所有文章個數,μ(S)表示掃描窗口S中預估出的MIe輿情個數,μ(G)表示所有掃描窗口G中預估出的所有輿情個數。


(6)
當H0無效時,其似然比函數表達式為

(7)


(8)


根據LR表達式,求解出LR的對數似然比為

(9)
因此,可得出掃描窗口S的最大似然比為maxLLR=maxlg(L(S)/L0),對G中的每個掃描窗口進行上述運算即可得出每個窗口的似然比,并求解出所有似然比中最大的對數似然比,即求出最大概率發生突發性輿情的聚集空間區域[10]。

若LLR的順序越靠前,說明聚集區域的隨機性越小,否則反之。
令輿情聚集區域的顯著性水平α為0.01,則最終p值小于0.01就認為此輿情不是隨機性的,并根據LLR值排列符合α=0.01的交互空間掃描窗口,即可判別出最有可能成為突發性輿情聚集的空間窗口,進而監測出最有可能發生突發性輿情爆發區域。
假設輿情擴散測度值為R0,R0值的大小直接體現出自組織網絡中突發性輿情的擴散程度,R0中含有兩個關鍵因素分別是參數a1和參數a2,令參數a1和參數a2是關于時間t的函數,則函數分別為a1(t)和a2(t),其函數的意義分別是突發性輿情擴散到時間t時,采取措施控制輿情發展而生成的控制變量,以此遏制輿情發展,降低輿情擴散率,及突發性輿情擴散到時間t時采取措施控制輿情發展而生成的控制變量,以此感動網民進行情感召喚,提高輿情散播者的“喚醒率”[12]。若函數ai(t)屬于區間[0,1],則此時的函數ai(t)就是可測函數,其中i=1,2。
則突發性輿情的最優控制模型的表達式為

(10)
求解最優控制輿情模型的最終目的是最大效率地降低輿情帶來的負面影響。將正能量的社會效應開發到最大化,因此將輿情擴散者Sh(t)、St(t)和疑惑者H(t)的數值設置為最小,將沒有參與散播輿情的人員I(t)數量設置為最大,并將運行成本控制在最低,則此時的函數ai(t)為可測函數,因此得出輿情目標函數G(a1,a2)的表達式為

(11)



(12)
其中,Γ={(a1,a2)∈L1(t0,tf)|1≥ai≥0,i=1,2}表示控制約束集合,ai(i=1,2)表示可測變量。
將突發性輿情監測聚集區域和最優控制輿情模型相結合即可實現突發性輿情交互信息的監控。
為驗證所提方法的整體有效性,需要對自組織網絡突發性輿情交互信息監控方法、文獻[4]方法和文獻[5]方法進行輿情監控效率、輿情監控率測試,實驗環境如表1所示。

表1 實驗環境
分析圖1可知,經過在不同地理區域和不同人數下的多次試驗發現,所提方法的突發性輿情監控用時一直低于5天,而文獻[4]方法和文獻[5]方法監控輿情所用時間都高于6天,尤其是文獻[5]方法,其所用時間最高趨近于8天,因為所提方法在監控突發性輿情前對輿情進行輿情聚集區域的實時監測,因此可獲取到輿情聚集區域,使得監控更加簡單容易,以此減少監控時間,提高輿情監控效率。

圖1 不同方法的監控效率
選取2020年任意五天中的輿情進行監控,經實驗后得知,所提方法監測并控制住的輿情傳播者和疑似傳播者達到實際傳播用戶的80%,其它兩種方法的監控率均不足80%,因為所提方法利用交互空間掃描變量和概率分布模型求出最有可能出現輿情的空間窗口及其概率再進行控制輿情,從而提前得知輿情最有可能出現的地理區域,因此提高了所提方法的監控率。

圖2 不同方法的監控率
針對當前方法的不足,提出自組織網絡突發性輿情交互信息監控方法。該方法首先對自組織網絡中的輿情進行監測以此獲取輿情聚集區域,再通過求解輿情最優控制模型和其目標函數控制輿情發展,以此實現突發性輿情交互信息的監控。經實驗表明,所提方法效率高、監控率高。為今后的網絡環境提供了保障。