王妞 康輝英



摘要:網絡輿情的復雜多變對教育網絡輿情監測及應對提出了挑戰.本文提出了一種依賴網絡輿情監測評估指標的教育考試網絡輿情監控與突發事件應急處理體系構建方法。針對不同類型處理時不同指標,建立了教育考試質量(Quality of Education Examination,QEE)教育考試模式(Educational Examination Model,EEM)和突發事件應急處理效率(Emergency Response Efficiency,ERE)的網絡輿情監測評估指標。本文結合網絡輿情特點構建了教育網絡輿情監測評估指標體系,克服了以往評價指標體系的模糊性和不可比較的缺點,增強教育網絡輿情事件熱度評估和監測的準確性和客觀性,為構建和完善我國突發事件應急管理體系提供基礎和依據。
關鍵詞: 教育考試網絡輿情監控;指標體;突發事件應急處理體系
中圖分類號:TP393? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2019)18-0030-05
x評估指標體系的權重量化在數值分析、模式識別以及搜索等領域得到了大規模的應用[1-2]。教育網絡輿情研究多集中于網絡輿情理論、工作機制,關于輿情評估指標體系的研究相對匱乏。所以,構建教育考試網絡輿情監控與突發事件應急處理體系已變成目前的研究重點[3-4]。如今,大多研究學者主要的研究重點是使用不相同的特殊算法對教育考試網絡輿情監控進行處理[5]。
本文選取了3個網絡輿情監測評估指標,在保證初始網絡輿情監控準確度一致的前提下,構建了針對不同類型的教育考試網絡輿情監控與突發事件應急處理體系.實驗結果表明:不同類型的教育考試將會導致對教育考試網絡輿情監控處理產生不一樣的影響,同時對于處理側重角度的不同,指標使其發生改變。本文構建的教育考試網絡輿情監控與突發事件應急處理體系克服了以往評價指標體系的模糊性和不可比較的缺點,增強教育網絡輿情事件熱度評估和監測的準確性和客觀性。
1 基于凝聚鏈算法的網絡輿情監控
在對突發事件的輿論信息進行分析的過程中,每種輿論都擁有一個中心焦點,圍繞相關的中心展開相關的討論、發表對應的評論信息,因此,基于某個中心話題的輿論信息可以用圖1的點分布進行描述。
圖1中,小圓圈代表某一個具體的輿論信息(如新聞、評論等),黑點代表輿論中心,虛線的大圓圈代表給定以某一輿論信息為參考對象,文檔相似度小于等于給定的相似度閉值為半徑所覆蓋的區域,該區域所覆蓋的點表示與該參考信息非常相似的輿論信息。基于熱點突發事件的輿論信息都是輿論的中心話題,因此,具有熱點的輿論信息其形成過程一般為首先發表熱點信息(如圖1中的點Pn),圍繞該熱點信息進行相關的大量轉載與評論報道(如圖1中的點B2),這些輿論與該熱點信息非常相似。但在對Pn的評論中可能存在某種觀點不被人接受,因此針對B2的信息進行再次評論(如圖1中的點B1)而點B1的內容與原始焦點Pn的內容相差較大,因此相似程度降低,在圖1中表示為B1不在Pn的二一鄰域內。在有關的輿論分布中,由于Pn為輿論中心,因此圍繞該中心的輿論信息量最大,對應的二一鄰域所覆蓋的點密度也最大,而針對點B2的輿論信息的評價,信息的關注度明顯下降,因此,我們可以根據熱點輿論信息的擴散過程的逆過程進行反向搜索,針對任意一個輿論信息(如圖1中的Pl點),獲取與之相似的輿論信息,并計算其s一鄰域所覆蓋的點的輿論密度情況,得到點P2最大,說明P2極有可能是Pl的信息來源處,因此針對PZ再次進行分析。在P2的s一鄰域中,P3的點對應密度最大,說明P3極有可能是P2的信息來源處。再次對P3進行分析,獲取P3的s一鄰域,得到P4為最大密度,再以P4為中心進行計算,得到Pn的密度最大。通過對Pn的分析過程中,發現其一鄰域沒有超過該點的分布密度,因此我們可以說明該點為該區域的輿論中心,搜索過程完成。
凝聚鏈算法描述如下:
(1)當前信息集合I(ti)清空;當前特征詞集合T(ti)清空;特征詞頻變化數TC(ti)清空;
(2)獲取給定站點中的網頁信息P;
(3)獲取該網頁P的更新日期,若該網頁P的更新時間小于上次統計時間,則轉(5)進行;否則執行(4);
(4)對網頁P提取信息內容,將相應信息加入I(ti)中,并對內容進行分詞處理,獲取網頁P的分詞向量,添加入當前特征詞集合T(ti)中,更新相應分詞的頻度;
(5)獲取下一網頁信息,若存在轉(1)執行,若不存在,則轉(C6)執行;
(6)計算特征詞詞頻變化數TC(ti)= T(ti)一T(ti-1),過濾點磁盤變化數小于等于0的特征詞;
(7)對每一個文檔計算其[ε]一鄰域;獲取相應的點密度;
(8)對信息集合I(ti)中的每一個信息文檔設置為未處理狀態;
(9)獲取信息集合中下一個未處理狀態的文檔d,若不存在則轉(11);否則轉(10)執行;
(10)將當前文檔d的狀態改為已分析,同時獲取文檔d的[ε]一鄰域,對[ε]一鄰域內的點分別計算各自的點密度,獲得最大的點密度所對應的文檔e,若p(e)}p(d)則標記文檔d的狀態為鏈尾,轉(9)執行;否則,獲取文檔e作為當前分析文檔d,轉(10);
(11)獲取所有鏈尾狀態的文檔集合,過濾點密度小于給定閉值M-point的文檔,得到熱點文檔信息。
2 教育考試網絡輿情監控的指標體設計
突發事件應急處理體系憑借自身對教育考試網絡輿情監控誤差的容錯特點,本文在上述分析的基礎上,對不同體系進行指標體分析,同時測試這種體系與其他體系之間的差異性,對教育考試網絡輿情監控指標所帶來的影響。
本文定義的“指標體”代表的是相似運算下節約的資源[Esavings]和輸出誤差值[Qloss]之間的比值。
式中,求解[Qloss]的度量值應結合實際的問題而定,比如在進行發事件應急處理的過程中,[Qloss]一般按照相似先后順序將事件緊急的信噪比(PSNR)作為度量標準。本文研究的內容主要是網絡輿情監控階段消耗的時間。按照運算系統層次和耗時因素,把網絡輿情監控階段的時間劃分為:
式中,[ESMS]代表教育考試網絡輿情監控處理使用時間,在本文主要指的是將教育考試網絡輿情監控處理方法應用到四六級英語考試中所用的時間;[ESMA]代表教育考試網絡輿情監控處理的時間。
將教育考試網絡輿情監控處理的樣本[ESMS]通常是指運用到整個突發事件應急處理體系的部分內容。表1表示將不同部分的質量處理置標題占據的比例。其中,使用教育考試網絡輿情監控指標占據整個處理過程的比例為25%。需要注意的是每個部分處理所占用的比例根據參數變化而改變。主要的參數包括數據存儲時間、樣本規模等。本文使用的突發事件應急處理體系主要是根據對教育考試網絡輿情監控處理的結果得到的。
將教育考試網絡輿情監控數據進行有效存儲是使用多元決策體系處理分析的關鍵,但是,如果增大四六級英語考試的密度,那么在相同的時間段內將刷新四六級英語考試處理數據也將變得更多,使得刷新占據的資源也相應增加。因此,網絡輿情監控已變成提高處理突發事件應急處理體系的有效手段。
四六級英語考試刷新次數的減少將會導致一些教育考試網絡輿情監控指標數據在存儲的過程中發生丟失的現象。而對于分配教育考試任務的四六級英語考試,使用這種體系將會使得部分教育考試網絡輿情監控指標體的數據存在較大的誤差,如同這些指標體在受到其他外界因素的干擾下引起數值發生改變。四六級英語考試次數越多,那么受到外界因素干擾的概率就會越高。
教育考試網絡輿情監控處理結果如圖2所示。其中,橫坐標表示指標數據占據總體處理質量的百分比;縱坐標表示使用多元網絡輿情監控體系下教育考試網絡輿情監控的準確度。根據圖可知,使用不一樣的體系,質量指標就顯得更加突出。其中,QEE體系是網絡輿情監控指標體中最為重要的指標;ERE指標是最差;EEM指標處于以上兩個體系之間.比如針對HAR數據。比如EEM指標準確度為10%;QEE的網絡輿情監控準確度仍能達到90%以上,而ERE體系的網絡輿情監控精度為53%左右。
值得注意的是,存在的差異程度也會影響教育考試網絡輿情監控與突發事件應急處理體系的使用,而對于網絡輿情監控結果不敏感的教育考試網絡輿情監控指標,使用的體系之間的指標體也比較小。例如在圖1中的Adult數據庫中,EEM、QEE以及EREH這3中體系的效果曲線變化十分相近。同樣還存在另一種特點就是在圖1(c)中的MNIST數據庫中,ERE指標明顯優于EEM,但是其他類型的數據庫中,相似計算結果的ERE指標遠遠比EEM指標的要低很多。主要是因為教育考試網絡輿情監控在對處理突發事件應急處理體系的信息采集過程中,刪除部分處理突發事件應急處理體系的能力。
通過數值化的方式來說明本文教育考試網絡輿情監控指標差異,將上文得到的曲線變化進行擬合,運算出的斜率相應的教育考試網絡輿情監控處理敏感度使用[SMS]進行表示。[SMS]代表了單位比例指標體數據導致的教育考試網絡輿情監控指標網絡輿情監控精度不斷降低。如果[SMS]變小,則表明本文體系對存儲相似,那么得到的存儲處理消耗的時間也將改變。表2給出了三個不同指標在進行教育考試網絡輿情監控處理相互之間的靈敏程度,由突發事件應急處理體系可以計算出,教育考試網絡輿情監控指標所占的比列每次增加1%,處理準確率將降低1.78%,QEE平均下降0.7%,教育考試網絡輿情監控與突發事件應急處理體系平均下降1.95%。
3 教育考試網絡輿情監控與突發事件應急處理體系構建
教育考試方式與體系類型有關,即在應用突發事件應急處理體系前,不同體系的[EMMA]和[EMCP]區別很大,使用不同體系進行對此部分進行多元決策時,應該優先考慮體系在近似之前進行的初始評論效果。
需要注意的是四六級英語考試方法[EMMA]的處理不可忽視。對于部分體系來講,體系中的參數個數比較多,并且在處理樣本數據較少的情況下,在對考試熱點分析進行評估所占據的比例也不多。本文重點研究了在構建教育考試網絡輿情監控與突發事件應急處理體系時,將指標體引入其中,然后對體系進行分級指令,以實現對教育考試網絡輿情監控。
就像前文介紹的一樣,教育考試網絡輿情監控的處理([EMODEL])主要由2部分構成:突發事件應急處理體系下的處理[EMMA]和考試熱點分析處理[EMCP]。本文使用體系的訪問負載使用[FMMA]代表;質量指標的負載使用[EMCP]進行表示。那么教育考試網絡輿情監控與突發事件應急處理體系可用以下公式表示:
4 實驗與結果分析
本實驗以2018年5月1日-2018年10月1日的新聞為例,對四六級網絡輿情評估指標進行分析。為了對數據庫中的網頁新聞集合特點進行分析,統計在某時間區間內出現的四六級新聞主題報道數量,可以更清晰地看到公眾或媒體對于該主題的關注度變化情況。例如,以“四六級考試考試時間”“四六級考試考試報名”“四六級考試作弊” “四六級考試考試成績查詢”為主題的新聞呈現的分別為單峰型、梯形形式,說明在此期間該事件可能激化了新的矛盾;之后新聞數量逐漸減少,意味著人們對該事件關注度下降。
在對熱點整體發展情況進行預判之后,采用先整體后局部的分析方法進行分處理。為了提高分析效率,在中文分詞之前將每條記錄中的content內容導出數據庫,用Jieba技術進行分詞并將結果寫入txt文本中。如表4所示,獲得每篇新聞分詞結果后,需要對出現的詞語進行權值計算(見表5),并建立向量矩陣。根據上述分析可知,使用上文中的3種體系進行的教育考試網絡輿情監控處理以及評估計算公式,分別在4個不一樣的數據庫中進行多元決策分析,分析結果如表6所示。因為參數的設定以及教育考試網絡輿情監控與突發事件應急處理體系的構建,能夠獲得對此3種指標進行網絡輿情監控處理,如圖4所示,圖4(a)為多元決策分析結果;圖4(b)(C)依次表示四六級英語考試方式處理和考試熱點分析評估結果,圖4(d)表示四六級英語考試模式處理與考試熱點分析之間存在的差異度。
針對教育考試方式目處理[EMMA]和考試熱點分析處理[EMCP],體系指標體的差別一般對處理結果影響很小,處理體系的確定主要是依據處理體系最初的處理差異。由圖4(a)可知,不同處理突發事件應急處理體系最初處理的差異比較大,EEM指標因為教育考試網絡輿情監控處理以及處理運算都是與支持向量總數呈正比關系,但是在一些計算量比較大的應用中,數據通常很多。所以,對多元決策分析要求標膠高。QEE指標因為存在許多節點,導致體系參數數據增加,訪存處理的要求也變得很高。差不多和EEM指標下的質量指標處理一樣,。但是ERE置標題下因為體系參數數據和突發事件應急處理體系都很少,多元決策分析在此3種指標下處理準確度相對比較低,與平均分裂處理相比,EEM指標體下的質量指標準確率是ERE指標體處理的29倍,QEE的平均網絡輿情監控處理是ERE的11倍。所以,通過此種初始處理差異性很大,表明突發事件應急處理體系對質量處理突發事件應急處理體系影響很大。
不同教育考試方式處理和考試熱點分析處理的比例有明顯的差異.通過圖4(b)和圖4(c)可以發現,EEM的教育考試方式處理和考試熱點分析處理是屬于相同級別,主要是由于在EEM指標下的教育考試網絡輿情監控處理以及處理運算都是與支持向量的總數呈正比,所以這兩類的差異不大;QEE指標下將突發事件應急處理體系引入到教育考試質量處理中效率很快,但是對于考試熱點分析的處理比較低,主要是由于QEE指標下樣本節點數太多,所以使得教育考試網絡輿情監控的處理與節點之間呈正比關系。所以,對于考試熱點分析的處理要小于教育考試質量的處理。
5 總結
突發事件應急處理體系的指標差異對教育考試網絡輿情監控與突發事件應急處理體系問題有著重要的影響,本文通過利用3種教育考試網絡輿情監控與突發事件應急處理體系,構建的教育考試網絡輿情監控與突發事件應急處理體系,以實現對教育考試中緊急事件的準確處理。通過實驗結果可知:將評估指標體應用到教育考試網絡輿情監控與突發事件應急處理體系的構建中,對提高四六級英語教育考試質量具有積極作用,同時,可以針對不同的考試進行不同類型的處理,在處理突發事件應急處理體系的結構上也具有很大優勢。
參考文獻:
[1] Noori R, Karbassi A R, Ashrafi K, et al . Development and application of reduced‐order neural network model based on proper orthogonal decomposition for bod5 monitoring: active and online prediction. Environmental Progress & Sustainable Energy, 2013, 32(1):120-127.
[2] Tolonen H, Koponen P, Mindell J, et al. European health examination survey--towards a sustainable monitoring system. The European Journal of Public Health, 2014,24(2):338-344.
[3] Mahawar K K, Parmar C, Graham Y , et al. Monitoring of liver function tests after roux-en-y gastric bypass: an examination of evidence base. Obesity Surgery, 2016, 26(10):2516-2522.
[4] Thoe W, Lee O H K, Leung K F, , et al. Twenty five years of beach monitoring in hong kong: a re-examination of the beach water quality classification scheme from a comparative and global perspective. Marine Pollution Bulletin, 2018(131):793-803.
【通聯編輯:唐一東】