999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于電商評價的文本情感分析研究與應用

2022-07-08 07:47:14唐孝國郭俊亮
黑龍江科學 2022年12期
關鍵詞:分類文本情感

王 恒,唐孝國,郭俊亮

(銅仁職業技術學院,貴州 銅仁 554300)

文本情感分析又稱意見挖掘、傾向性分析等[1]。電商平臺為受眾提供了評論途徑,而這些評價信息是基于用戶對所見所聞的事情或購買商品時而表達的個人感受,具有很高的應用價值,如果商家對這些評論信息進行挖掘,獲得用戶的情感態度和涉及的話題,就可以針對用戶的評論改善商品,對未購買過的用戶進行個性化推薦。同時,消費者也可以根據后臺的計算程序快速得到店鋪的商品信息,幫助消費者做出是否值得購買的建議,對電商平臺上的用戶評論信息進行深度挖掘,可為人們提供更加便利和智能化的服務[2-3]。

1 文本情感分析

文本情感分析是將帶有情感色彩的文本進行分析和挖掘。文本數據量由少量數據增長到大量數據,人們發現將情感分類應用于文本處理具有重要的社會價值和商業價值,文本情感分析在此背景下成為自然語言處理的主要趨勢之一?;谠~典的應用方法、基于機器學習的應用方法、基于深度學習的應用方法是傳統文本情感分類的主要應用方法[4-5]?;谏疃葘W習的應用方法無論是面對大量數據還是少量數據都能得到較好的分析效果?;谠~典的應用方法在少量數據的情況下能得到較好的分類結果。隨著大數據時代的到來,傳統的情感分析方法已經不適用,人們在發展和尋求新的情感分析方法,深度學習能在一定程度上解決這一問題[6]。文本情感分析是通過人工智能分析文本信息中的感情傾向,即發布者所表達的情感是消極還是積極的。隨著互聯網的發展,論壇、貼吧、微博、淘寶、京東等眾多APP為廣大用戶提供了可發表自己想法的平臺[7-8],想要對這些文本信息進行深度挖掘具有較大的難度,因此運用自然語言處理技術中的文本挖掘技術對這些信息進行處理就顯得尤為重要。

2 文本情感分類模型

2.1 LSTM 模型

LSTM也稱Long Short Term 網絡,是1997年由Hochreiter & Schmidhuber正式提出的。它可以學習長期的依賴信息,是RNN分類中特殊的一種。LSTM網絡在很多方面都取得了巨大的成功,因而廣受關注并得到了廣泛使用[9]。

LSTM模型由三個門構成,如圖1所示,分別為“輸入門”“遺忘門”和“輸出門”。其中,“輸入門”和“遺忘門”能影響模型確定信息的丟棄和保留,起著決定性的作用[10]。

圖1 LSTM單元結果示意圖Fig.1 Schematic diagram of LSTM element results

2.2 基于貝葉斯的文本分類模型

樸素貝葉斯是一種常見的監督學習的分類算法,人們熟知的有多項式模型及伯努利模型兩種[11]。

A.多項式模型的似然估計。

其中,c表示某個類別,wi表示某個詞語。

B.伯努利模型的似然估計。

首先看訓練階段的去除停用詞(保留核心詞)操作對兩個概率的影響。先看多項式模型,如果執行了去除停用詞操作,分母減小,分子不變,則會增大核心詞的概率。但是與多項式模型不同,貝努利模型執行去除停用詞操作,其分母文檔數基本不太可能會減少,分子不變,所以最終核心詞的概率基本不會受到影響,這是因為伯努利的計算粒度是文件,而多項式的計算粒度是單詞,二者不同的計算粒度導致其概率計算方法不同。

2.3 BERT模型

BERT(Bidirectional Encoder Representation from Transformers)是由谷歌于2018年提出的一個預訓練的語言表征模型[12],該模型生成深度的雙向語言特征,采用新的masked language model(MLM),不再采用之前傳統的單向語言模型,也不再采用簡單的拼接兩個單向語言模型的方法進行預訓練。Bert進行預訓練之后,會直接保存24層Transformer權重(BERT-LARGE)或Embedding table和Transformer權重(BERT-BASE)。使用訓練好的Bert模型可以直接進行文本分類、閱讀理解等操作。圖2是BERT模型的架構圖。

圖2 BERT的架構圖Fig.2 Framework of BERT

3 數據采集與預處理

3.1 數據采集

本次研究數據來源于某東的用戶評論,采用Python爬蟲技術,將爬取的數據存入對應的文本中,選擇有研究意義的數據,實驗數據爬取的是某東網站平臺上面10個類別的用戶評論,分別為杯子、電腦、鮮花、堅果、手機、書籍、玩具、牛奶、鞋子、口紅,一共49 000多條用戶評論數據。需要大致分析爬取的數據,這些數據是電商平臺上面用戶真實的對商品的評論數據,通過分析把不同評論數據分到不同的類別中,且每條數據只能屬于10個類中的某一個類,還需要對這些評論進行情感傾向性分析。要清洗掉數據中的空值和重復值,因為這些數據中可能會出現默認好評和一個用戶的多次評論。

3.2 數據預處理

在進行數據預處理之前先對數據進行去重,因為這些數據中可能會含有用戶未作出評價顯示默認好評的情況。在對中文文本進行預處理時需要對不完整的數據進行處理,還需要刪除重復數據,對數據進行分詞。進行分詞之后還是會產生很多的沒有實際含義的標點符號和停用詞,需要將這些詞語刪除,因為這些符號和詞語對數據挖掘沒有意義,還會增加計算的復雜度和時間。清洗之后的分詞如表1所示。

表1 數據進行分詞并去停用詞對比圖表Tab.1 Comparison of data segmentation and stop words elimination

對數據進行分詞且對分詞去停用詞之后,對這些詞進行詞頻統計,以便了解哪些詞是數據集中的高頻詞匯,這對實驗數據判斷有一定的意義。為了方便文本分類模型的訓練,將中文代表的類別轉換成數字ID,如表2。將類別由中文轉換成數字代替(0~9)。

表2 label對應ID表Tab.2 ID corresponding to label

4 實驗評估與結果分析

采用文本分類中3個常用的指標對實驗結果進行評估。

第一個是系統選擇的正確項與全部正確項的比值準確率(precision)。在情感分類中準確率可以看成是正確的情感分類在總的情感分類中所占的比值,如公式(1)所示:

(1)

第二個是模型中情感分類的正確樣本結果與人工情感分類的文本數相比較的比率得到的召回率(recall),具體的計算公式如(2)所示:

(2)

第三個是F值(F-measure)。將結果值統一到一個全面的度量尺度上,以便能夠更直觀地觀察實驗結果,這個值稱為F值,如公式(3)所示:

(3)

根據表3數據類型及用戶評論數量分類統計表中的數據,分別用LSTM模型、貝葉斯模型和BERT模型對處理好的數據進行訓練和預測,結合公式(1)(2)(3)得到了LSTM模型、貝葉斯模型、BERT模型的訓練結果圖,如表4所示。

表3 數據類型及用戶評論數量分類統計表Tab.3 Classification statistics of data type and the number of user’s comment

表4 LSTM模型、貝葉斯模型和BERT模型對比結果表Tab.4 Results of the comparison of LSTM, Bayesian and BERT model

貝葉斯模型和BERT模型的訓練結果的精準率、召回率,F1和準確率均低于LSTM模型的訓練結果。就準確率而言,LSTM的訓練模型準確率為0.83,貝葉斯的訓練模型準確率為0.68,BERT模型的訓練模型準確率為0.75。LSTM的訓練模型召回率為0.84,貝葉斯的訓練模型召回率為0.66,BERT模型的訓練模型召回率為0.69。LSTM的訓練模型F1值為0.83,貝葉斯的訓練模型F1值為0.69,BERT模型的訓練模型F1值為0.78。由此可以看出,LSTM模型的訓練效果要優于以上兩種方法。

5 結語

隨著大數據時代的到來,情感分析在文本數據處理中有著越來越重要的社會價值和商業價值,挖掘這些信息對于商家和用戶都有很重要的實際意義?;贚STM模型、貝葉斯模型、Bert模型三種方法進行文本情感分析,綜合實驗得出,LSTM模型在文本情感分析中的效果優于另外兩種模型,情感分析模型將會越來越廣泛地應用于人們的生活中,對這些數據進行分析具有社會意義。

猜你喜歡
分類文本情感
分類算一算
如何在情感中自我成長,保持獨立
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
情感
在808DA上文本顯示的改善
分類討論求坐標
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
如何在情感中自我成長,保持獨立
數據分析中的分類討論
教你一招:數的分類
主站蜘蛛池模板: 午夜视频免费试看| 欧美成人二区| 亚洲人成人无码www| 99精品热视频这里只有精品7| 无码一区18禁| 精品国产自在现线看久久| 亚洲无码熟妇人妻AV在线| 又粗又大又爽又紧免费视频| 国产00高中生在线播放| 国产精品欧美亚洲韩国日本不卡| h网站在线播放| 亚洲男人在线天堂| 国产美女精品一区二区| 欧美日韩国产综合视频在线观看| 亚洲男人天堂2018| 天堂av综合网| 国产v精品成人免费视频71pao| 在线日韩日本国产亚洲| 欧美一道本| 亚洲制服丝袜第一页| 国产9191精品免费观看| www.91在线播放| 天天躁夜夜躁狠狠躁躁88| 亚洲精品国产乱码不卡| 成年午夜精品久久精品| 高清色本在线www| 久久77777| 欧美一区福利| 中国国产高清免费AV片| 久久精品人人做人人爽| 亚洲无卡视频| 亚洲精品天堂在线观看| 免费一极毛片| 国产精品.com| 青草视频网站在线观看| 久久99精品久久久大学生| 欧美一级大片在线观看| 丁香五月婷婷激情基地| 亚洲精品爱草草视频在线| 亚洲国产精品成人久久综合影院| 色婷婷成人| 亚洲高清中文字幕| 日韩国产综合精选| Jizz国产色系免费| 女人av社区男人的天堂| 免费看一级毛片波多结衣| 国产h视频免费观看| 欧美成人在线免费| 67194在线午夜亚洲| 色天天综合| 无码视频国产精品一区二区 | 人妖无码第一页| 欧美黄网在线| 欧美在线观看不卡| a毛片免费在线观看| 国产情侣一区| 国产凹凸视频在线观看| 欧美亚洲国产日韩电影在线| 搞黄网站免费观看| 国产9191精品免费观看| 国产欧美日韩另类| 四虎国产精品永久在线网址| 国产成人精品一区二区免费看京| 久久久久亚洲Av片无码观看| 最近最新中文字幕免费的一页| 国产欧美日韩免费| 超碰aⅴ人人做人人爽欧美 | 国产精品粉嫩| 少妇精品网站| www.亚洲国产| 美臀人妻中出中文字幕在线| 国产在线98福利播放视频免费| 波多野结衣一区二区三区四区视频| 久久久久免费精品国产| 日韩欧美国产成人| 国产在线视频导航| 中文字幕人妻av一区二区| 国产在线观看91精品亚瑟| 日本一本正道综合久久dvd| 99这里只有精品免费视频| 呦系列视频一区二区三区| 久久综合国产乱子免费|