999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于改進(jìn)Stacking 集成算法的網(wǎng)絡(luò)輿情預(yù)警研究

2022-11-16 08:45:46劉經(jīng)緯
中國管理信息化 2022年18期
關(guān)鍵詞:模型

劉經(jīng)緯,彭 佳

(首都經(jīng)濟(jì)貿(mào)易大學(xué) 管理工程學(xué)院,北京 100070)

0 引言

隨著互聯(lián)網(wǎng)的迅速發(fā)展,網(wǎng)絡(luò)輿情危機(jī)逐漸增多,國內(nèi)外許多知名學(xué)者都對網(wǎng)絡(luò)輿情進(jìn)行了危機(jī)管理和風(fēng)險預(yù)測等方面的研究,目前網(wǎng)絡(luò)輿情危機(jī)預(yù)警成為一個熱門的研究話題[1]。網(wǎng)絡(luò)輿情危機(jī)預(yù)警工作具有顯著的現(xiàn)實意義。例如,從經(jīng)濟(jì)的角度來看,網(wǎng)絡(luò)輿情危機(jī)預(yù)警工作可避免經(jīng)濟(jì)損失;從社會的角度來看,其有利于社會穩(wěn)定;從政府的角度來看,其有利于提升政府公信力。現(xiàn)如今,交叉學(xué)科的發(fā)展為輿情預(yù)警指明了全新的方向。基于此,本文將機(jī)器學(xué)習(xí)方法與網(wǎng)絡(luò)輿情預(yù)警相結(jié)合,利用機(jī)器學(xué)習(xí)的方法構(gòu)建輿情預(yù)警模型,以達(dá)到及時對網(wǎng)絡(luò)輿情進(jìn)行預(yù)警的目的。

1 網(wǎng)絡(luò)輿情預(yù)警研究現(xiàn)狀

網(wǎng)絡(luò)輿情預(yù)警是指對網(wǎng)絡(luò)輿情發(fā)展具有重大影響的關(guān)鍵指標(biāo)進(jìn)行及早識別、監(jiān)測和預(yù)測,繼而對網(wǎng)絡(luò)輿情的態(tài)勢走向進(jìn)行預(yù)警的行為。目前,國內(nèi)對網(wǎng)絡(luò)輿情預(yù)警的研究主要集中在以下3 個方面。

(1)基于運籌學(xué)理論的網(wǎng)絡(luò)輿情預(yù)警研究。該類研究主要是通過構(gòu)建輿情事件評價指標(biāo)體系,并在評價指標(biāo)體系的基礎(chǔ)上運用運籌管理方法,對不同指標(biāo)賦予不同的權(quán)重,最終得到輿情事件的發(fā)展情況預(yù)警評價體系。這類研究的方法主要有層次分析法、熵權(quán)法與模糊推理法[2]。

(2)基于數(shù)據(jù)挖掘方法的網(wǎng)絡(luò)輿情預(yù)警研究。該類研究是利用情感分析、文本分析等技術(shù)對輿情進(jìn)行分析,從而得出預(yù)警等級[3]。

(3)基于智能機(jī)器學(xué)習(xí)模型的網(wǎng)絡(luò)輿情預(yù)警研究。該類研究是指通過對輿情事件進(jìn)行分析和評估,給出算法參數(shù)輿情方面的現(xiàn)實意義,實現(xiàn)對輿情事件的分析評價[4]。

2 Stacking 集成算法概述

2.1 傳統(tǒng)Stacking 集成算法

Stacking 是一種分層模型集成框架,它結(jié)合Boosting 和Bagging 兩種集成方式[5]。Stacking 集成通常會設(shè)計兩層,第一層由多種基模型組成,輸入為原始訓(xùn)練集,輸出為各種基模型的預(yù)測值,而第二層只有一個元模型,對第一層的各種模型的預(yù)測值和真實值進(jìn)行訓(xùn)練,從而得到完整的集成模型。為了防止出現(xiàn)模型過擬合的情況,一般Stacking 算法在第一層訓(xùn)練基模型時會結(jié)合k 折交叉驗證法,每個基學(xué)習(xí)器引入k 折交叉驗證方法,再將這些不同基學(xué)習(xí)器的預(yù)測結(jié)果進(jìn)行整合,作為第二層的訓(xùn)練集。第二層的元學(xué)習(xí)器根據(jù)第一層輸出的訓(xùn)練集和原先的樣本標(biāo)簽進(jìn)行訓(xùn)練,最后利用此原模型進(jìn)行預(yù)測。Stacking 集成算法流程如圖1 所示。

2.2 融合最優(yōu)特征子集的改進(jìn)Stacking 集成算法

(1)Stacking 集成過程中,只是將基學(xué)習(xí)器對訓(xùn)練集和測試集的預(yù)測結(jié)果合并,并將真實值作為元學(xué)習(xí)器的訓(xùn)練集和測試集。但這樣的方式并不能融合原始數(shù)據(jù)中各特征變量與輸出值之間的關(guān)系,丟失了原始數(shù)據(jù)的信息,這對于Stacking 算法的性能會有極大的影響。改進(jìn)后的Stacking 算法通過篩選最優(yōu)特征,并把最優(yōu)特征加入第二層模型,即第二層模型的輸入是最優(yōu)特征子集加上第一層的預(yù)測結(jié)果。

(2)在k 折交叉驗證過程中,同一基學(xué)習(xí)器由k個訓(xùn)練子集對測試集完成預(yù)測,其中不同的訓(xùn)練子集在預(yù)測精度上會存在差異。對同一個基學(xué)習(xí)器形成的k 個測試集預(yù)測結(jié)果采取均值的方法獲取該基學(xué)習(xí)器的測試集輸出。而訓(xùn)練子集不同、參數(shù)不同,必然會存在不同的預(yù)測精度。想要克服這種缺點,就需要結(jié)合不同訓(xùn)練集的預(yù)測精度來組合測試集。因此,針對最后對同一個基學(xué)習(xí)器形成的k 個測試集預(yù)測結(jié)果,將平均值改進(jìn)為預(yù)測精度加權(quán)平均來獲取該基學(xué)習(xí)器的測試集輸出。

3 基于改進(jìn)Stacking 的網(wǎng)絡(luò)輿情預(yù)警指標(biāo)體系和模型構(gòu)建

3.1 指標(biāo)體系構(gòu)建

大部分輿情數(shù)據(jù)都是網(wǎng)民所發(fā)表和討論的文本數(shù)據(jù),而對輿情進(jìn)行預(yù)警則需要通過量化的方式將文本數(shù)據(jù)轉(zhuǎn)化為可以輸入到模型的數(shù)據(jù),因此需要利用各種指標(biāo)將輿情數(shù)據(jù)進(jìn)行量化,從而更好地實現(xiàn)網(wǎng)絡(luò)輿情危機(jī)預(yù)警。本文將評估網(wǎng)絡(luò)輿情危機(jī)預(yù)警的指標(biāo)體系分為主體影響力、輿情熱度、輿情趨勢、輿情狀態(tài)4個一級指標(biāo),并在一級指標(biāo)的基礎(chǔ)上建立相應(yīng)的二級指標(biāo),詳細(xì)指標(biāo)如圖2 所示。

圖2 網(wǎng)絡(luò)輿情預(yù)警指標(biāo)體系

3.2 模型構(gòu)建

輿情預(yù)警本質(zhì)是一個分類問題,根據(jù)每天的輿情影響指標(biāo)確定其對應(yīng)的輿情預(yù)警等級,因此可以選用機(jī)器學(xué)習(xí)分類模型。Stacking 模型是一種融合模型,它的基學(xué)習(xí)器可以融合多種分類器,因此具有預(yù)測準(zhǔn)確、速度快、可配置等特點。改進(jìn)后的Stacking 模型克服了傳統(tǒng)模型的缺陷,而基于改進(jìn)Stacking 的網(wǎng)絡(luò)輿情預(yù)警模型構(gòu)建的主要實現(xiàn)過程如下。

(1)將輿情數(shù)據(jù)劃分為訓(xùn)練集和測試集。

(2)將輿情預(yù)警指標(biāo)作為模型的輸入數(shù)據(jù)特征,輿情預(yù)警等級作為輸出數(shù)據(jù)標(biāo)簽來訓(xùn)練模型。

(3)將測試集輸入模型中,獲得測試集預(yù)警級別的預(yù)測結(jié)果。

4 實證分析

4.1 案例選取

微博是網(wǎng)絡(luò)輿情發(fā)酵的大平臺,大部分輿情輿論都能通過微博平臺傳播。博主在微博平臺上發(fā)布相關(guān)輿情博文可以快速讓其他網(wǎng)民了解該輿情事件,同時其他網(wǎng)民對輿情博文進(jìn)行轉(zhuǎn)發(fā)、評論和點贊,也會使輿情事件在短時間內(nèi)熱度上漲。因此,本文選用微博平臺進(jìn)行基于改進(jìn)Stacking 的網(wǎng)絡(luò)輿情預(yù)警模型實證分析,使用話題關(guān)鍵詞“瑞麗市長”在微博中搜索2020 年10 月到2020 年11 月的相關(guān)輿情信息,并利用爬蟲工具獲取數(shù)據(jù),一共獲取了約2 萬條數(shù)據(jù)。

4.2 數(shù)據(jù)預(yù)處理

在進(jìn)行數(shù)據(jù)存儲后,首先要對獲取的數(shù)據(jù)進(jìn)行預(yù)處理以保證數(shù)據(jù)的準(zhǔn)確性。因此,將數(shù)據(jù)存到數(shù)據(jù)庫后,應(yīng)將所獲取的數(shù)據(jù)進(jìn)行清洗,也就是數(shù)據(jù)的預(yù)處理過程,具體工作如下。

(1)數(shù)據(jù)去重。在爬取的過程中,因為內(nèi)容進(jìn)行過更新,而且服務(wù)多次下發(fā)內(nèi)容等,同樣的文本內(nèi)容可能會被爬取到多次,所以要對數(shù)據(jù)進(jìn)行去重,刪掉多余的重復(fù)數(shù)據(jù)。

(2)文本預(yù)處理。將所有非中文和非英文字符過濾舍去,如“@”“#”及HTML 標(biāo)簽等字符。

(3)指標(biāo)計算。按照上述確定的預(yù)警指標(biāo)體系和各指標(biāo)的計算方法,將處理好的數(shù)據(jù)帶入公式計算各指標(biāo)的值,并進(jìn)行歸一化處理。

4.3 模型測試

筆者搜集了輿情事件“瑞麗市長”的相關(guān)數(shù)據(jù),該事件總共經(jīng)歷了51 天,筆者選取了其中輿論較大的10 天數(shù)據(jù),將數(shù)據(jù)的80%劃分為訓(xùn)練數(shù)據(jù),20%劃分為測試數(shù)據(jù),并對其進(jìn)行標(biāo)準(zhǔn)化處理,再輸入模型中進(jìn)行訓(xùn)練,以驗證基于改進(jìn)Stacking 算法的網(wǎng)絡(luò)輿情預(yù)警模型對網(wǎng)絡(luò)輿情預(yù)警識別的可行性。

將訓(xùn)練數(shù)據(jù)輸入模型中進(jìn)行訓(xùn)練和調(diào)參后,得到一個準(zhǔn)確率較高的模型,再將測試數(shù)據(jù)輸入訓(xùn)練好的模型,能得出測試結(jié)果,測試結(jié)果如表1 所示。

表1 預(yù)測結(jié)果

根據(jù)微博環(huán)境下的公共危機(jī)事件的嚴(yán)重性、緊急程度以及事件的影響范圍等因素,結(jié)合實際情況將預(yù)警等級進(jìn)行劃分,本文將預(yù)警等級劃分為4 個等級,其中Ⅰ代表安全級別,Ⅱ代表輕警級別,Ⅲ代表中警級別,Ⅳ代表巨警級別。由預(yù)測結(jié)果可知,未改進(jìn)前的Stacking 模型預(yù)測準(zhǔn)確率只有64%,而改進(jìn)后的Stacking 模型的預(yù)測準(zhǔn)確率有82%,驗證了模型的有效性和準(zhǔn)確性。

5 結(jié)語

本文通過對網(wǎng)絡(luò)輿情危機(jī)的影響因素進(jìn)行分析,選取了主體影響力、輿情熱度、輿情趨勢、輿情狀態(tài)4 個方面的因素作為影響網(wǎng)絡(luò)輿情危機(jī)的指標(biāo)因素,將其輸入基于改進(jìn)Stacking 集成算法的網(wǎng)絡(luò)輿情預(yù)警模型,并進(jìn)行了實證分析。實驗結(jié)果表明,改進(jìn)后的Stacking 有效提升了模型的準(zhǔn)確率,這為網(wǎng)絡(luò)輿情預(yù)警研究提供了一個新思路。

猜你喜歡
模型
一半模型
一種去中心化的域名服務(wù)本地化模型
適用于BDS-3 PPP的隨機(jī)模型
提煉模型 突破難點
函數(shù)模型及應(yīng)用
p150Glued在帕金森病模型中的表達(dá)及分布
函數(shù)模型及應(yīng)用
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 少妇极品熟妇人妻专区视频| 久久精品人人做人人爽| 国产人成在线视频| 综合色在线| 日本午夜三级| 亚洲综合经典在线一区二区| 99热这里都是国产精品| 久久天天躁狠狠躁夜夜躁| 国产人在线成免费视频| 丁香五月激情图片| 国内精品自在欧美一区| www精品久久| 一本一本大道香蕉久在线播放| 伊人无码视屏| 黄色网页在线播放| 久久免费视频播放| 欧美成人影院亚洲综合图| 亚洲美女视频一区| 国产亚洲精| 午夜老司机永久免费看片| 国产精品欧美日本韩免费一区二区三区不卡| 亚洲视频在线观看免费视频| 国产免费a级片| 这里只有精品在线播放| 草逼视频国产| 日韩激情成人| 99re66精品视频在线观看| 伊人精品视频免费在线| 亚洲天堂网视频| 成人免费黄色小视频| 国产成人av一区二区三区| 91年精品国产福利线观看久久| 久久人与动人物A级毛片| 亚洲av综合网| 色婷婷天天综合在线| 午夜激情福利视频| 视频一本大道香蕉久在线播放 | 欧美综合一区二区三区| 伊人无码视屏| av一区二区三区高清久久| 国产尤物视频在线| 国产精品一区在线观看你懂的| 久久久久国色AV免费观看性色| 国产永久无码观看在线| 亚洲天堂视频在线观看| 精品三级在线| 亚洲欧美另类色图| 国产精品成人不卡在线观看| 久久久久九九精品影院| 中文一级毛片| 亚洲人免费视频| 久久77777| 99在线观看国产| 天堂网亚洲综合在线| 无码人中文字幕| 久久香蕉国产线看精品| 最新国产麻豆aⅴ精品无| 91免费在线看| 天天躁狠狠躁| 人妻精品全国免费视频| 伊人久久大香线蕉成人综合网| 亚洲swag精品自拍一区| 无码电影在线观看| 天天色天天综合网| 国产精品久久久久鬼色| 无码高潮喷水在线观看| 国产91精选在线观看| 精品亚洲国产成人AV| 理论片一区| 最新日本中文字幕| 在线免费观看a视频| 亚洲资源站av无码网址| 真人免费一级毛片一区二区| 呦女亚洲一区精品| 亚洲男人的天堂网| 久久香蕉欧美精品| 欧美日韩一区二区三| 欧美中出一区二区| 亚洲黄色高清| 黄色成年视频| 亚洲国语自产一区第二页| 国产不卡网|