999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于TFIDF和梯度提升決策樹的短文本分類研究

2019-10-21 21:07:26劉春磊梁瑞斯邸元浩
科技風 2019年24期
關鍵詞:機器學習

劉春磊 梁瑞斯 邸元浩

摘 要:自然語言處理是人工智能領域中的一個熱門方向,而文本分類作為自然語言處理中的關鍵技術受到專家學者的廣泛關注。隨著機器學習技術的發展,決策樹算法已經在文本分類中取得了較好的分類效果。本文針對短文本分類問題,利用TFIDF提取文本特征后,結合梯度提升決策樹算法進行文本分類,并與樸素貝葉斯、邏輯回歸和支持向量機的分類效果進行對比分析,驗證了梯度提升決策樹用于短文本分類的可行性。

關鍵詞:自然語言處理;文本分類;機器學習;決策樹

短文本分類是信息檢索和文本數據挖掘的基礎,也是當前自然語言處理領域中一個重要的研究方向,在情感分析、垃圾郵件過濾、新聞分類等領域有著廣泛的應用價值。

機器學習方法的應用將文本分類任務拆分為特征工程和分類器,完成數據到信息和信息到知識的過程。[1]文本特征選擇方法較多,其中TFIDF可以有效評估特定字詞對于一個文本集或一個語料庫中的重要程度。[2]文本分類常用的分類器有樸素貝葉斯、邏輯回歸、支持向量機、決策樹等算法。[3]樸素貝葉斯和邏輯回歸在屬性個數比較多或者屬性之間相關性較大時,分類效果較差。當需要分類的樣本較多時支持向量機將耗費大量的機器內存和運算時間。決策樹算法中的GBDT(Gradient Boosting Decision Tree),是一種迭代的回歸決策樹算法,該算法由多棵決策樹組成,將所有樹的結論融合求解,是泛化能力較強的算法。

基于此,本文提出一種基于TFIDF和GBDT的短文本分類算法,用以解決現有短文本分類算法準確率較低、分類時間長、計算量較大等問題。

1 文本特征提取

文本數據屬于非結構化數據,一般要轉換成結構化的數據,將文本數據特征進行向量化。[4]詞袋模型是一種常用的用于文本向量化的模型,通過權重表示詞在一段文本中的重要程度,并進一步利用TFIDF提取文本的特征。TFIDF的主要內容是:如果某個詞在一段文本中出現的頻率高,并且在其他文本中出現的次數較少,則認為該詞具有較強的類別區分能力,即TF和IDF的乘積,適合作為文本分類的特征。

綜合上表中的F1值和訓練時間可以看出,梯度提升決策樹模型有較高的F1值。同時,相比與其他模型,在訓練時間有著更優的表現。

4 結論

本文在現有短文本分類方法的基礎上,使用梯度提升決策樹模型作為分類器,進行了文本分類的實驗。通過基于TFIDF的特征提取,十折交叉驗證后取平均值,F1值達0.81,驗證了梯度提升決策樹分類器在短文本分類上的適用性。

參考文獻:

[1]盧健,馬成賢,楊騰飛,周嫣然.Text-CRNN+Attention架構下的多類別文本信息分類[J/OL].計算機應用研究.

[2]牛永潔,田成龍.融合多因素的TFIDF關鍵詞提取算法研究[J/OL].計算機技術與發展,2019(07).

[3]丁月,汪學明.一種基于改進特征加權的樸素貝葉斯分類算法[J/OL].計算機應用研究.

[4]孟濤,王誠.基于擴展短文本詞特征向量的分類研究[J/OL].計算機技術與發展,2019(04).

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數據分析研究
基于Spark的大數據計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統
基于圖的半監督學習方法綜述
機器學習理論在高中自主學習中的應用
極限學習機在圖像分割中的應用
主站蜘蛛池模板: 亚洲欧美综合另类图片小说区| 57pao国产成视频免费播放| 日本午夜三级| 美女潮喷出白浆在线观看视频| 伊人久久大香线蕉成人综合网| 在线观看无码av五月花| 久久黄色小视频| 国产国产人成免费视频77777| 996免费视频国产在线播放| 国产麻豆精品久久一二三| 婷婷六月综合| 手机在线国产精品| 欧美精品成人| 国产一区二区三区精品久久呦| aⅴ免费在线观看| 日韩精品久久无码中文字幕色欲| 亚洲欧美日韩天堂| 手机精品福利在线观看| 国产午夜看片| 真人免费一级毛片一区二区| 91精品免费高清在线| 国产精品永久免费嫩草研究院| 日本高清有码人妻| 自慰高潮喷白浆在线观看| 六月婷婷激情综合| 天堂在线www网亚洲| 日韩成人在线视频| 91久久国产综合精品| 99re66精品视频在线观看| 99热国产在线精品99| 四虎国产精品永久一区| 国产精品无码一二三视频| 国产精女同一区二区三区久| 国产一区免费在线观看| 99九九成人免费视频精品| 欧美视频免费一区二区三区| 国产精品无码AⅤ在线观看播放| 精品一区二区三区视频免费观看| 91精品国产91久无码网站| Jizz国产色系免费| 97视频精品全国在线观看| 综合色区亚洲熟妇在线| 亚洲欧美一区二区三区蜜芽| 青青草原国产一区二区| 免费看美女自慰的网站| 福利在线免费视频| 91在线一9|永久视频在线| 97视频在线精品国自产拍| 日本亚洲欧美在线| 88av在线| 亚洲精品另类| 欧美在线免费| 久久青草精品一区二区三区| 成年人国产视频| 久久免费视频播放| 欧美日韩午夜| 亚洲男人天堂网址| 日韩精品欧美国产在线| av在线人妻熟妇| 九色在线观看视频| 青青青国产视频| 伊人丁香五月天久久综合| 激情综合网激情综合| 欧美日韩精品一区二区视频| 亚洲AV无码一区二区三区牲色| 亚洲国产日韩在线观看| 日韩麻豆小视频| 成AV人片一区二区三区久久| 国产91av在线| 青青青国产精品国产精品美女| 精品小视频在线观看| 国产精品短篇二区| 日韩一级毛一欧美一国产| 国产亚洲精久久久久久久91| 亚洲一区色| 亚洲欧洲自拍拍偷午夜色无码| 老汉色老汉首页a亚洲| 亚洲一级色| 亚洲中文字幕久久无码精品A| 中文字幕人妻无码系列第三区| 亚洲开心婷婷中文字幕| 亚洲视频欧美不卡|