999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

改進樸素貝葉斯算法在文本分類中的應用

2019-03-13 13:00:16黃勇羅文輝張瑞舒
科技創新與應用 2019年5期

黃勇 羅文輝 張瑞舒

摘? 要:樸素貝葉斯算法是一種基于概率統計的分類算法,廣泛應用于機器學習中分類問題的求解中。文本分類是自然語言處理和數據挖掘領域中的研究熱點有著廣泛的應用前景。樸素貝葉斯算法已經在文本分類中取得了較好的分類效果,但是由于文本詞向量的特征向量維度高,很多分類算法的求解效率和準確率都不高。文章提出一種基于詞向量間余弦相似度的改進樸素貝葉斯算法,有效的降低了特征向量的數據冗余和計算復雜性。

關鍵詞:文本分類;樸素貝葉斯算法;特征向量;余弦相似度

中圖分類號:TP391 文獻標志碼:A 文章編號:2095-2945(2019)05-0024-02

1 概述

在文本分類任務中,目前采用的主要方法是將文本分詞,通過詞向量技術進行特征提取文本被表示成一個高維度的文本向量集合。然后通過分類器進行文本類別的學習。目前很多主流的機器學習分類算法都取得了較好的分類效果。但是由于文本數據特征表示復雜,分類效率和精度還沒有取得較大的提高,樸素貝葉斯算法是在傳統貝葉斯算法上假定待分類特征的分量之間相互獨立,這使得貝葉斯這種分類方法的工程化應用得以實現[1]。但是文本中的數據由于上下文的語義關系,各個詞組的特征向量之間并不都是相互獨立的,這給分類器增加了很大的計算和求解負擔,參數學習效率低數據特征冗余度大,如果考慮到利用各個上下文詞組之間的概率相關性,利用詞向量[2]之間的相似度有選擇的剔除一些語義近似的詞向量將大大簡化分類過程。余弦相似度就能夠很好的度量特征詞向量之間的相關性程度,很好的表征了上下文詞組之間的相似程度,可以利用這一相似性指數簡化文本特征表示集合的大小,簡化分類器的學習過程,提高分類效率。

3 文本分類實驗

在此使用谷歌訓練好的開源詞向量模型,利用開源IMDB、文本數據集來對改進模型進行分類實驗和效果評估。IMDB數據集包含來自互聯網的50000條嚴重兩極分化的評論[3],該數據被分為用于訓練分類模型的25000條評論文本和用于測試分類效果的25000條評論文本,訓練集和測試集都包含50%的正面評價和50%的負面評價。實驗利用開源的深度學習框架TensorFlow和Keras。實驗過程為文本數據導入、文本預處理、文本特征轉換、分類器實現、參數初始化、參數迭代、結果輸出,利用Keras提供的樸素貝葉斯分類器[4],在此基礎上實現了改進的分類算法模型。同時也在傳統樸素貝葉斯模型上進行實驗過程,實驗在測試集上得到分類效果如下表所示:

比較傳統樸素貝葉斯分類算法和改進樸素貝葉斯分類算法模型在實驗中的結果可以發現,基于文本詞向量余弦相似度的改進樸素貝葉斯文本分類算法有著更好的分類精度和更低的迭代時間,大大降低了文本高維度的特征帶來的計算復雜度。

4 結束語

本文分析了傳統樸素貝葉斯算法在文本分類問題上存在的問題,針對傳統文本分類中存在的數據冗余度大、特征表示復雜、分類效率低下的問題提出了基于上下文詞向量之間余弦相似度的改進樸素貝葉斯算法,有效降低了文本特征向量的數據冗余度和模型計算復雜性通過實驗驗證了該改進算法的有效性,分類效果得到極大提升。

參考文獻:

[1]趙文濤,孟令軍,趙好好,等.樸素貝葉斯算法的改進與應用[J].測控技術,2016(02).

[2]唐明,朱磊,鄒顯春.基于Word2Vector的一種文檔向量表示[J].計算機科學,2016,43(6):14-217.

[3]林士敏,田鳳占,陸玉呂.貝葉斯學習、貝葉斯網絡與數據采掘[J].計算機科學,2005,27(10):69-72.

[4]Y.-L. Boureau, J. Ponce, and Y. LeCun. A theoretical analysis of feature pooling in visual recognition.In Proceedings of the 27th International Conference on Machine Learning (ICML-10), pages 111-118,2010.

主站蜘蛛池模板: 久久窝窝国产精品午夜看片| 久久精品丝袜| 日本在线亚洲| 国产高清无码第一十页在线观看| 国产嫖妓91东北老熟女久久一| 青草精品视频| 秋霞午夜国产精品成人片| 国产在线八区| 国产精品污污在线观看网站| 国产精品太粉嫩高中在线观看| 久久性妇女精品免费| 无码内射在线| 色悠久久久久久久综合网伊人| 欧美精品成人一区二区在线观看| 国内精品免费| 五月天综合网亚洲综合天堂网| 女人18一级毛片免费观看 | 成年av福利永久免费观看| 国产精品成人AⅤ在线一二三四 | 国产真实自在自线免费精品| 日韩二区三区无| 18禁影院亚洲专区| 亚洲另类第一页| 亚洲欧洲日韩综合| 国产精品成人一区二区不卡 | 精品久久久久久中文字幕女| 99久久国产综合精品女同 | 人人看人人鲁狠狠高清| 国产精品久久久久婷婷五月| 国产欧美日韩视频怡春院| 欧类av怡春院| 国产色网站| 人人91人人澡人人妻人人爽| 一级毛片免费播放视频| 久久国语对白| 永久在线播放| 中文字幕乱妇无码AV在线| 五月天福利视频| 欧美日本在线观看| 在线观看亚洲精品福利片| 欧美日本在线观看| 2020亚洲精品无码| 色综合激情网| 国产尤物视频在线| 丝袜美女被出水视频一区| 亚洲国产欧美目韩成人综合| 亚洲成在人线av品善网好看| 全午夜免费一级毛片| 99人妻碰碰碰久久久久禁片| 青青青国产视频手机| 亚洲天堂777| 2024av在线无码中文最新| 熟女视频91| 亚洲二区视频| 亚洲中文字幕在线观看| 67194亚洲无码| 色播五月婷婷| 国产精品永久不卡免费视频| 日韩天堂视频| 中文国产成人久久精品小说| 久久精品亚洲专区| 国产在线98福利播放视频免费| 午夜国产在线观看| 亚洲精选无码久久久| 国产人成午夜免费看| 中文字幕66页| 国产亚洲一区二区三区在线| 中文字幕在线视频免费| 97狠狠操| av无码久久精品| 无码网站免费观看| 无码电影在线观看| 国产精品区网红主播在线观看| 亚洲小视频网站| 欧美成人手机在线视频| 亚洲黄色激情网站| 欧美福利在线观看| 色悠久久综合| 潮喷在线无码白浆| 欧美福利在线观看| 精品成人一区二区| 日韩经典精品无码一区二区|