999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于樸素貝葉斯的新冠疫情新聞分類研究

2020-10-26 08:55:40馬亞州侯益明王紫薇
無線互聯科技 2020年14期
關鍵詞:分類疫情

馬亞州,張 勇,侯益明,王紫薇

(山西農業大學 信息科學與工程學院,山西 太谷 030801)

0 引言

2020年,新冠病毒來勢洶洶,席卷全球。隨著新型冠狀病毒性肺炎疫情的蔓延,防控工作越來越艱巨,面臨的問題也越來越嚴峻。在這沒有硝煙的“戰場”上,普通民眾能做的就是保護好自己,因此,能夠正確接收正規新聞報道,清楚地認清當下疫情情勢和防控措施,才可以更好地保護自己,對社會有所貢獻。

為了能夠快速閱讀到關于疫情的新聞,本文基于樸素貝葉斯算法來對當前一些實時新聞進行分類,將實時新聞分為疫情類與非疫情類。該算法用于分類的準確率較高且有一定使用意義,值得進一步研究。

1 樸素貝葉斯算法

樸素貝葉斯(Naive Bayes,NB)是基于“特征之間是獨立的”[1]這一樸素假設,應用貝葉斯定理的監督學習算法。對應給定的樣本X的特征向量x1,x2, ...,xm;該樣本X的類別y的概率可以由貝葉斯公式得到:

(1)

特征之間是相互獨立的,可得:

(2)

在給定樣本的情況下,P(x1,x2, ...,xm)是常數:

(3)

要求得到最終的模型為:

(4)

計算出新聞分類中用于訓練的每個新聞標題的每個單詞在詞匯表中出現的概率,之后對于待分類的新聞可分別計算其屬于兩個類別的概率,然后比較其大小,最終予以分類[2]。算法流程如圖1所示。

2 數據準備

(1)通過Java爬蟲代碼分別從中國日報網英文版(http://www.chinadaily.com.cn/)、人民網英文版(http://english.peopledaily.com.cn/)、中國日報英文版(http://europe.chinadaily.com.cn/ )、新浪英文版(http://english.sina.com/ )等各大權威網站搜集近一個月以來的新聞報道標題,從中共篩選得到1 085條關于新冠疫情的新聞報道標題,從中隨機選取200條用于測試錯誤率,其余用于訓練,另外,選取同樣數目的其他新聞標題也用于訓練。將每個樣本分別單獨放到一個文本文檔中,構成訓練數據集和測試數據集[3]。

(2)訓練數據時,將所有訓練數據集和測試數據集構成一個詞匯表并且將其向量化,將得到包含所有單詞的單詞表及向量表,如表1所示。

表1 樣本數量

3 實驗過程

3.1 構造分類器

根據樸素貝葉斯算法的原理,首先,需要針對所有樣本集構造一個詞匯表;其次,根據詞匯表將訓練樣本集向量化[4];最后,構造一個帶有兩個參數的分類器:訓練文檔矩陣和訓練類別標簽向量。將依次求得在整個數據集中,文檔分別屬于疫情類以及非疫情類的概率、詞匯表中各個單詞分別在疫情類以及非疫情類的概率,分類流程如圖2所示。

圖2 分類流程

3.2 新聞識別

進行新聞識別前,根據在“構造分類器”部分得到的詞匯表將待分類的200個新聞標題向量化[5],各自形成文本文檔。

根據之前構造分類器輸出返回的結果,可用于對新聞文檔來進行分類。對每一個待分類新聞,首先使用split函數將其內部單詞且分開,然后去除沒意義的部分(長度小于3),之后將該文檔使用于式(3),求出該文檔分別屬于各個類別的概率,最后取概率大的類別為最終分類類別。將測試結果與其真實類別進行比較,若不相等,則分類錯誤,錯誤次數加1,錯誤率為式(5):

(5)

其中,X為錯誤分類的數據個數,N為進行測試的數據個數。可以得到新聞分類的錯誤率,以此來評價分類的效果。

4 結果分析

經過對隨機抽取的200條新聞進行分類測試,平均正確率可達到95.94%,分類準確率較高,如表2所示。

表2 每一次分類準確率

5 結語

將該分類器應用于實際的新聞分類將有實際意義,使民眾能夠快速接收到關于新冠肺炎疫情的消息,更好地保護自己和保護別人。

猜你喜歡
分類疫情
戰疫情
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
抗疫情 顯擔當
人大建設(2020年5期)2020-09-25 08:56:22
疫情中的我
疫情當前 警察不退
北極光(2020年1期)2020-07-24 09:04:04
待疫情散去 春暖花開
文苑(2020年4期)2020-05-30 12:35:48
疫情期在家帶娃日常……
37°女人(2020年5期)2020-05-11 05:58:52
分類討論求坐標
數據分析中的分類討論
主站蜘蛛池模板: 欧美成人精品在线| 免费无码网站| 欧美亚洲日韩中文| 大香网伊人久久综合网2020| 在线日韩一区二区| 国产成人亚洲毛片| 亚洲国产精品VA在线看黑人| 怡红院美国分院一区二区| 丁香五月亚洲综合在线| 天天色综网| 成人欧美在线观看| 色婷婷在线播放| 亚国产欧美在线人成| 欧美一级高清片久久99| 香蕉视频在线观看www| 国外欧美一区另类中文字幕| 国产精品lululu在线观看| 国产欧美日韩专区发布| 久久成人国产精品免费软件| 一本大道AV人久久综合| 国产午夜看片| 亚洲乱码精品久久久久..| 国产区网址| 综合人妻久久一区二区精品 | AV在线天堂进入| 青青青伊人色综合久久| 久久亚洲欧美综合| 日韩欧美国产成人| 在线看片免费人成视久网下载| 国内精品伊人久久久久7777人| 91久久偷偷做嫩草影院免费看| 色偷偷一区| 黄色在线网| 国产乱码精品一区二区三区中文 | 在线五月婷婷| 国产91丝袜在线播放动漫| 久久 午夜福利 张柏芝| 精品无码国产自产野外拍在线| 亚洲狼网站狼狼鲁亚洲下载| 国产亚洲男人的天堂在线观看| 一级高清毛片免费a级高清毛片| 免费啪啪网址| 中文国产成人精品久久| AV不卡国产在线观看| 日本五区在线不卡精品| 高清色本在线www| 国产亚洲精品自在线| 天堂va亚洲va欧美va国产 | 波多野结衣视频网站| 成色7777精品在线| 在线观看精品自拍视频| 国产高清免费午夜在线视频| 在线日本国产成人免费的| 国产一级无码不卡视频| 国模极品一区二区三区| 国产精品大白天新婚身材| 国产成人免费手机在线观看视频 | 首页亚洲国产丝袜长腿综合| 一级成人欧美一区在线观看| 久久网综合| 黄色网址手机国内免费在线观看| 国产成人精品免费av| 色婷婷狠狠干| 亚洲无码视频图片| 国产精品99在线观看| 久久人人妻人人爽人人卡片av| 高潮毛片免费观看| 91小视频在线观看免费版高清| 欧美色综合网站| 午夜视频在线观看区二区| 91美女在线| 国产成+人+综合+亚洲欧美| 欧美日韩午夜| AV网站中文| 在线观看国产一区二区三区99| 亚洲男人天堂网址| 亚洲乱码精品久久久久..| 久久久久久尹人网香蕉| 欧美 国产 人人视频| 久一在线视频| av尤物免费在线观看| 伊人五月丁香综合AⅤ|