999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于電商評價的文本情感分析研究與應用

2022-07-08 07:47:14唐孝國郭俊亮
黑龍江科學 2022年12期
關鍵詞:分類文本情感

王 恒,唐孝國,郭俊亮

(銅仁職業技術學院,貴州 銅仁 554300)

文本情感分析又稱意見挖掘、傾向性分析等[1]。電商平臺為受眾提供了評論途徑,而這些評價信息是基于用戶對所見所聞的事情或購買商品時而表達的個人感受,具有很高的應用價值,如果商家對這些評論信息進行挖掘,獲得用戶的情感態度和涉及的話題,就可以針對用戶的評論改善商品,對未購買過的用戶進行個性化推薦。同時,消費者也可以根據后臺的計算程序快速得到店鋪的商品信息,幫助消費者做出是否值得購買的建議,對電商平臺上的用戶評論信息進行深度挖掘,可為人們提供更加便利和智能化的服務[2-3]。

1 文本情感分析

文本情感分析是將帶有情感色彩的文本進行分析和挖掘。文本數據量由少量數據增長到大量數據,人們發現將情感分類應用于文本處理具有重要的社會價值和商業價值,文本情感分析在此背景下成為自然語言處理的主要趨勢之一?;谠~典的應用方法、基于機器學習的應用方法、基于深度學習的應用方法是傳統文本情感分類的主要應用方法[4-5]?;谏疃葘W習的應用方法無論是面對大量數據還是少量數據都能得到較好的分析效果?;谠~典的應用方法在少量數據的情況下能得到較好的分類結果。隨著大數據時代的到來,傳統的情感分析方法已經不適用,人們在發展和尋求新的情感分析方法,深度學習能在一定程度上解決這一問題[6]。文本情感分析是通過人工智能分析文本信息中的感情傾向,即發布者所表達的情感是消極還是積極的。隨著互聯網的發展,論壇、貼吧、微博、淘寶、京東等眾多APP為廣大用戶提供了可發表自己想法的平臺[7-8],想要對這些文本信息進行深度挖掘具有較大的難度,因此運用自然語言處理技術中的文本挖掘技術對這些信息進行處理就顯得尤為重要。

2 文本情感分類模型

2.1 LSTM 模型

LSTM也稱Long Short Term 網絡,是1997年由Hochreiter & Schmidhuber正式提出的。它可以學習長期的依賴信息,是RNN分類中特殊的一種。LSTM網絡在很多方面都取得了巨大的成功,因而廣受關注并得到了廣泛使用[9]。

LSTM模型由三個門構成,如圖1所示,分別為“輸入門”“遺忘門”和“輸出門”。其中,“輸入門”和“遺忘門”能影響模型確定信息的丟棄和保留,起著決定性的作用[10]。

圖1 LSTM單元結果示意圖Fig.1 Schematic diagram of LSTM element results

2.2 基于貝葉斯的文本分類模型

樸素貝葉斯是一種常見的監督學習的分類算法,人們熟知的有多項式模型及伯努利模型兩種[11]。

A.多項式模型的似然估計。

其中,c表示某個類別,wi表示某個詞語。

B.伯努利模型的似然估計。

首先看訓練階段的去除停用詞(保留核心詞)操作對兩個概率的影響。先看多項式模型,如果執行了去除停用詞操作,分母減小,分子不變,則會增大核心詞的概率。但是與多項式模型不同,貝努利模型執行去除停用詞操作,其分母文檔數基本不太可能會減少,分子不變,所以最終核心詞的概率基本不會受到影響,這是因為伯努利的計算粒度是文件,而多項式的計算粒度是單詞,二者不同的計算粒度導致其概率計算方法不同。

2.3 BERT模型

BERT(Bidirectional Encoder Representation from Transformers)是由谷歌于2018年提出的一個預訓練的語言表征模型[12],該模型生成深度的雙向語言特征,采用新的masked language model(MLM),不再采用之前傳統的單向語言模型,也不再采用簡單的拼接兩個單向語言模型的方法進行預訓練。Bert進行預訓練之后,會直接保存24層Transformer權重(BERT-LARGE)或Embedding table和Transformer權重(BERT-BASE)。使用訓練好的Bert模型可以直接進行文本分類、閱讀理解等操作。圖2是BERT模型的架構圖。

圖2 BERT的架構圖Fig.2 Framework of BERT

3 數據采集與預處理

3.1 數據采集

本次研究數據來源于某東的用戶評論,采用Python爬蟲技術,將爬取的數據存入對應的文本中,選擇有研究意義的數據,實驗數據爬取的是某東網站平臺上面10個類別的用戶評論,分別為杯子、電腦、鮮花、堅果、手機、書籍、玩具、牛奶、鞋子、口紅,一共49 000多條用戶評論數據。需要大致分析爬取的數據,這些數據是電商平臺上面用戶真實的對商品的評論數據,通過分析把不同評論數據分到不同的類別中,且每條數據只能屬于10個類中的某一個類,還需要對這些評論進行情感傾向性分析。要清洗掉數據中的空值和重復值,因為這些數據中可能會出現默認好評和一個用戶的多次評論。

3.2 數據預處理

在進行數據預處理之前先對數據進行去重,因為這些數據中可能會含有用戶未作出評價顯示默認好評的情況。在對中文文本進行預處理時需要對不完整的數據進行處理,還需要刪除重復數據,對數據進行分詞。進行分詞之后還是會產生很多的沒有實際含義的標點符號和停用詞,需要將這些詞語刪除,因為這些符號和詞語對數據挖掘沒有意義,還會增加計算的復雜度和時間。清洗之后的分詞如表1所示。

表1 數據進行分詞并去停用詞對比圖表Tab.1 Comparison of data segmentation and stop words elimination

對數據進行分詞且對分詞去停用詞之后,對這些詞進行詞頻統計,以便了解哪些詞是數據集中的高頻詞匯,這對實驗數據判斷有一定的意義。為了方便文本分類模型的訓練,將中文代表的類別轉換成數字ID,如表2。將類別由中文轉換成數字代替(0~9)。

表2 label對應ID表Tab.2 ID corresponding to label

4 實驗評估與結果分析

采用文本分類中3個常用的指標對實驗結果進行評估。

第一個是系統選擇的正確項與全部正確項的比值準確率(precision)。在情感分類中準確率可以看成是正確的情感分類在總的情感分類中所占的比值,如公式(1)所示:

(1)

第二個是模型中情感分類的正確樣本結果與人工情感分類的文本數相比較的比率得到的召回率(recall),具體的計算公式如(2)所示:

(2)

第三個是F值(F-measure)。將結果值統一到一個全面的度量尺度上,以便能夠更直觀地觀察實驗結果,這個值稱為F值,如公式(3)所示:

(3)

根據表3數據類型及用戶評論數量分類統計表中的數據,分別用LSTM模型、貝葉斯模型和BERT模型對處理好的數據進行訓練和預測,結合公式(1)(2)(3)得到了LSTM模型、貝葉斯模型、BERT模型的訓練結果圖,如表4所示。

表3 數據類型及用戶評論數量分類統計表Tab.3 Classification statistics of data type and the number of user’s comment

表4 LSTM模型、貝葉斯模型和BERT模型對比結果表Tab.4 Results of the comparison of LSTM, Bayesian and BERT model

貝葉斯模型和BERT模型的訓練結果的精準率、召回率,F1和準確率均低于LSTM模型的訓練結果。就準確率而言,LSTM的訓練模型準確率為0.83,貝葉斯的訓練模型準確率為0.68,BERT模型的訓練模型準確率為0.75。LSTM的訓練模型召回率為0.84,貝葉斯的訓練模型召回率為0.66,BERT模型的訓練模型召回率為0.69。LSTM的訓練模型F1值為0.83,貝葉斯的訓練模型F1值為0.69,BERT模型的訓練模型F1值為0.78。由此可以看出,LSTM模型的訓練效果要優于以上兩種方法。

5 結語

隨著大數據時代的到來,情感分析在文本數據處理中有著越來越重要的社會價值和商業價值,挖掘這些信息對于商家和用戶都有很重要的實際意義?;贚STM模型、貝葉斯模型、Bert模型三種方法進行文本情感分析,綜合實驗得出,LSTM模型在文本情感分析中的效果優于另外兩種模型,情感分析模型將會越來越廣泛地應用于人們的生活中,對這些數據進行分析具有社會意義。

猜你喜歡
分類文本情感
分類算一算
如何在情感中自我成長,保持獨立
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
情感
在808DA上文本顯示的改善
分類討論求坐標
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
如何在情感中自我成長,保持獨立
數據分析中的分類討論
教你一招:數的分類
主站蜘蛛池模板: 欧美成人一级| 欧美成人午夜在线全部免费| 亚洲中文字幕国产av| 日韩视频免费| 亚洲成人精品久久| 日本午夜视频在线观看| 97国产精品视频人人做人人爱| 日韩高清一区 | 日韩在线观看网站| 在线五月婷婷| 毛片网站观看| 91丝袜在线观看| 成人在线天堂| 国产肉感大码AV无码| 2022国产无码在线| 啪啪免费视频一区二区| 国产又爽又黄无遮挡免费观看| 亚洲91在线精品| 亚洲大尺码专区影院| 国产黑丝一区| 精品一区二区三区自慰喷水| 国产精品亚洲片在线va| 亚洲男人的天堂久久香蕉网| 久久久久夜色精品波多野结衣| 一级毛片基地| 99免费视频观看| 一级做a爰片久久毛片毛片| 国产精品成人一区二区不卡| 亚洲精品va| 色婷婷亚洲十月十月色天| 日韩AV无码一区| 高清免费毛片| 国产理论精品| 久青草国产高清在线视频| 99视频在线看| 国产精品99久久久| 91啦中文字幕| 亚洲男人天堂久久| 久热精品免费| 欧美成人综合视频| 国产激情无码一区二区APP| 国产欧美视频综合二区| 亚洲一级毛片免费观看| 天天综合网亚洲网站| 婷婷五月在线视频| 无码 在线 在线| 亚洲一级色| 日韩色图区| 中文字幕乱码中文乱码51精品| 亚洲视屏在线观看| 91久久青青草原精品国产| 欧美视频在线播放观看免费福利资源| 亚洲男人的天堂久久精品| 亚洲综合色婷婷| 精品亚洲国产成人AV| 亚洲区视频在线观看| 五月婷婷亚洲综合| 亚洲不卡网| 日韩精品无码免费一区二区三区 | 国产男人天堂| 99久久精品视香蕉蕉| 亚洲美女视频一区| 亚洲午夜福利精品无码| 亚洲天堂成人在线观看| 国产日韩欧美精品区性色| 国产一区二区免费播放| 综合亚洲网| 国产精品区视频中文字幕| 日韩国产精品无码一区二区三区 | 国产无码制服丝袜| 亚洲国语自产一区第二页| 国产伦片中文免费观看| 手机永久AV在线播放| jizz亚洲高清在线观看| 一级毛片免费观看不卡视频| 国内老司机精品视频在线播出| 国产成人久久777777| 伊人久久久久久久| 狠狠色成人综合首页| 91成人免费观看在线观看| 人妖无码第一页| 成年免费在线观看|