








摘要:【目的】文章比較多個基于深度神經網絡的中文新聞文本分類模型,旨在找到準確度較高的方法用以實際工作,為中文新聞文本分類提供更加高效的方法。【方法】對文本分類技術和中文新聞分類進行了梳理和歸納,對中文新聞文本的特征和預處理進行了闡述,詳細介紹FastText算法、Bert分類算法、TextCNN算法和TextRNN算法。【結果】四種深度神經網絡算法均可以應用于中文新聞文本分類,可以有效處理信息紊亂問題以及快速準確進行分類。【結論】通過對四種深度神經網絡算法進行試驗和效果對比,發現FastText模型在實際工作中的文本分類效果最為優異。
關鍵詞:深度神經網絡;文本分類;中文新聞;自然語言處理" " " " " " 中圖分類號:TP183" " " " " "文獻標識碼:A
文章編號:1671-0134(2023)03-147-05" " " " DOI:10.19483/j.cnki.11-4653/n.2023.03.033
本文著錄格式 :鄭創偉,王泳,邢谷濤,謝志成,陳義飛.基于深度神經網絡的中文新聞文本分類方法[J].中國傳媒科技,2023(03):147-151.
導語
隨著信息時代的高速發展,網絡信息呈現爆炸式增長。新浪、今日頭條等一些主流新聞網站,每天提供數以百萬計的新聞數據,然而這些爆炸式增長的數據給網站帶來了巨大的挑戰。新聞文本分類可以有效地對文本進行快速準確分類,提高網站的工作效率,成為近些年來的研究熱點。新聞文本分類屬于文本分類的一個子任務。文本分類廣泛應用于各個領域,如網頁分類、微博情感分析、用戶評論挖掘等,是自然語言處理中使用率最廣泛的技術之一。文本分類最重要的作用是可以有效處理信息紊亂問題,尤其是對海量信息而言,更能夠幫助用戶快速、高效準確地定位所需信息,從而更加高效地分析數據。……