999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于CsBiLSTM的中文影評情感分析

2023-04-06 14:04:10趙賽仙張元琴周順江覃勇孫大旭龔維印
電腦知識與技術 2023年5期

趙賽仙 張元琴 周順江 覃勇 孫大旭 龔維印

關鍵詞:CBiLSTM;影評;情感分析

近年來,隨著多媒體技術的飛速發展和智能設備的普及,每天都會產生源源不斷的互聯網數據,很多用戶會在社交平臺上發布大量的影視作品評論[1-2]。比如購物評價、QQ音樂、短視頻評論等。許多帶有用戶情感的文本將作為研究用戶情感、立場和觀點的依據?,F在很多用戶一邊觀看一邊進行綜合評分,一些用戶在影視下方發出的評論常常被忽略,這種現象達不到一個很好的參考價值。影視投資人不僅要知道用戶評價的情感走向,還應當將用戶的情感變化和諸多影響用戶評價的因素考慮到其中[3]。

情感分析旨在對帶有情感色彩的主觀性文本進行分析、處理、歸納、推理的過程,其常應用于消費決策、輿情分析、電子商務等領域,具有較高的商業應用價值[4]。本文由情感分類算法為切入點介紹了當前流行的情感分析方法,進而提出了基于CsBiLSTM的情感分類方法。采用情感分析方法,可以通過主觀描述來自動判斷自然語言文本的積極和消極的情緒傾向,并得出相應的結論。

1 相關工作

1.1 數據預處理

首先通過爬蟲技術獲取實驗數據;然后獲取數據中的星級和具體的評論內容,將三星級的內容去除,將一、二星級標注為-1,四、五星級標注為1作為實驗數據的標簽;最后利用正則表達式去除評論中存在的西文字體,再采用Jieba分詞工具進行分詞處理。

1.2 詞嵌入向量

文本信息無法直接輸入進行特征提取,需要將文本轉換為具體的向量進行表示,從而方便計算機的處理[5]。早期使用的one-hot編碼方式中,詞與詞之間相互獨立,忽略了詞與詞之間的邏輯性以及無法區分詞的相似性。為了較好地克服傳統詞向量存的不足,本文使用分布式進行連續性表示,將文本中的詞從高維空間映射到低維空間。本文詞向量使用Word2Vec訓練詞向量。

開源詞向量工具包Word2Vec于2013被Google推出[6]。Mikolov團隊因神經網絡模型采用兩個非線性變換,網絡參數較多,訓練速度延遲且不利用于大語料的特點而簡化了它,并實現了Word2Vec詞向量模型。它具有簡易、卓效的優點,從而十分適用于從龐大及巨型語料中獲取高精度的詞向量表示。Word2Vec 主要包含CBOW 和Skip-gram 組成[7],具體如圖1所示。

CBOW模型用一個隱層預測中心詞t,即通過中心詞附近的n 個詞預測中心詞t的概率。如“我”“很”“喜歡”“這部”“電影”,就是通過周圍詞“我”“很”“這部”“電影”預測中心詞“喜歡”;Skip-gram模型用一個隱含層預測周圍詞,即通過中心詞t預測周圍n 個詞的概率,如“這部”“電影”“演員”“演技”“不行”,就是通過中心詞“演員”預測周圍詞“這部”“電影”“演技”“不行”。本文使用Skip-gram模型訓練維度為50的詞向量。

2 模型介紹

本文的實驗模型包括輸入層、嵌入層、卷積神經網絡、雙向長短期記憶網絡、K-最近鄰,具體的模型如圖2所示。

2.1 卷積神經網絡

卷積神經網絡主要用于圖像識別、語音識別、自然語言處理等領域[8]。Kim于2014年首次將卷積神經網絡用于自然語言處理[9]。卷積神經網絡(Convolu?tional Neural Network,CNN) 是具有深度結構的前饋神經網絡,主要包括卷積計算,其網絡模型基本結構有輸入層、卷積層、池化層、全連接層和輸出層[10]。CNN模型的架構圖如圖3所示。

輸入層:在圖像處理領域,為0~255之間具體的像素。在本文中將句子或者文本表示成向量矩陣。

卷積層:通過局部連接和權值共享完成卷積運算。在深度神經網絡中,卷積層中每個單元都有一個獨立的權值,因此需要對整個網絡進行控制以實現最優的網絡結構。本文通過不同尺寸的卷積核進行卷積,提取輸入數據中深層次的特征。

池化層:主要對卷積層輸出的結果進一步提取特征,在保留最大特征的同時,降低特征的維度。

全連接層:主要根據概率值對所提取的特征進行分類,然后輸出最終的情感分析結果。

2.2 LSTM 和BiLSTM

LSTM 是循環神經網絡的變形。循環神經網絡(Recurrent Neural Network,RNN) 對具有序列特性的數據非常有效,能夠挖掘數據中的時序信息以及語義信息,能夠利用之前的信息影響后面信息的輸出,但是RNN 存在無法記憶長距離的信息、梯度消失等問題[11]。為解決以上問題,在RNN基礎上添加了“門控裝置”,即輸入門、遺忘門和輸出門,形成LSTM。

為進一步充分利用上下文的內容,將具有正向序列學習特征的LSTM模型進行變形,通過正反向序列提取上下文信息,綜合考慮上下文內容,得到雙向長短期記憶網絡模型BiLSTM,由此判斷每個樣本評論的情感傾向[12],具體如圖4所示。

BiLSTM模型具體的學習流程如下:

1) xt - 1,xt,xt + 1 是輸入的具體的詞,經過詞嵌入將輸入的詞轉換為固定維度的詞向量。

2) 輸入的詞經過詞嵌入后轉換為固定維度的詞向量,然后輸入BiLSTM模型,經過正向傳播和反向傳播訓練得到詞向量,將正向傳播獲取的特征和反向傳播獲取的特征進行融合,有效地提取數據的特征。

3) 將獲取的數據特征通過分類器進行預測分類,判斷影評數據的情感傾向,即該影評的情感是積極還是消極。

3 實驗方案和結果

3.1 實驗數據

本文通過網絡爬蟲技術獲取豆瓣網站共計50部電影影評作為實驗數據,經過處理共獲取影評數據共3萬條,其中訓練數據2.4萬條,測試數據0.6萬條。按照星級將實驗數據歸為積極和消極兩類,積極類用1表示,消極類用-1表示。

3.2 評價指標

本實驗評價分類結果的好壞用準確率(Accu?racy) 、精確率、召回率和F1 作為指標。Positive表示積極評論,Negative表示消極評論,影評分析混淆矩陣如表1所示。

其中,準確率表示影評分析中被分對的樣本與所有樣本的數的比;精確率表示影評分析中被識別為積極類的樣本中,確實為積極類別的比例;召回率表示在所有積極類別樣本中,被正確識別為積極類別的比例;F1表示通過精確率和召回率對影評的綜合分析。

3.3 實驗設置

本實驗在Windows10上,使用Python編程語言,基于Anaconda環境,利用深度學習框架TensorFlow2.0完成整個實驗代買的編寫。通過Word2Vec中skipgram訓練維度為50的詞向量進行詞嵌入。在CsBiL?STM中,具體的實驗參數設置如下:首先使用卷積層中使用32個卷積核,尺寸大小為2,3,4的窗口進行卷積;其次使用窗口大小為3,移動步長為1的最大池化方式進行池化;再其次將多尺寸卷積核獲取的特征進行融合;最后將融合的特征使用雙向LSTM進一步提取影評數據特征。

3.4 實驗結果及分析

為了證明本實驗模型的有效性,將CsBiLSTM模型與CNN、LSTM、BiLSTM進行對比實驗,輸出層使用sigmoid進行分析,通過準確率進行評價,實驗結果如表2所示。

通過CsBiLSTM模型提取影評數據特征,輸出層使用K-最近鄰算法進行影評分析,為保證實驗結果的有效性,將實驗數據進行5折交叉驗證,同時通過網格搜索尋找最佳參數,并與CNN、LSTM、BiLSTM進行對比,最后通過準確率、精確率、召回率和F1 進行評價,實驗結果如表3所示。

從表2和表3可以分析得出,CsBiLSTM融合模型在特征提取方面優于單一的CNN、LSTM、BiLSTM。輸出層使用sigmoid和K-最近鄰進行情感分析,其K-最近鄰整體優于sigmoid。同時也能得到BiLSTM能夠充分利用前向和后向的特征進行分類,充分體現出其網絡在時序信息方面具有的獨特性。

4 結束語

融合多尺寸CNN 和BiLSTM 得到的模型CsBiL?STM模型用于中文影評分析優于單一的網絡模型,如CNN、LSTM、BiLSTM;同時也能夠解決CNN無法充分利用上下文信息的問題。但是在實驗的過程中,也體現出實驗存在的問題:第一,模型訓練時間長。盡管單一模型在準確率上低于CsBiLSTM,但是在消耗的時間上優于CsBiLSTM;第二,數據量偏少。實驗過程中使用的數據量少,模型訓練過程中存在學習不夠充分。在今后的工作中,除了解決以上兩個問題外,還需進一步加強算法模型優化以及數據預處理的研究。

主站蜘蛛池模板: 国产91精选在线观看| 亚洲首页在线观看| 欧美日韩一区二区在线免费观看| 国产日韩精品欧美一区灰| 真实国产乱子伦视频| 国产白浆视频| 国产产在线精品亚洲aavv| 国产精品蜜芽在线观看| 国产经典在线观看一区| 久草视频中文| 三上悠亚一区二区| 日本手机在线视频| 亚洲天堂日韩av电影| 蜜臀AV在线播放| 欧美精品三级在线| 伊人91在线| 亚洲Va中文字幕久久一区| 国产成人综合亚洲欧美在| 国产在线91在线电影| 亚洲黄网视频| 亚洲三级电影在线播放| 亚洲色婷婷一区二区| 狠狠操夜夜爽| 国产福利小视频高清在线观看| 亚洲精品无码AV电影在线播放| 成人福利在线视频| 五月丁香伊人啪啪手机免费观看| 色婷婷狠狠干| 国产亚洲精久久久久久久91| 欧美a在线视频| 欧美综合成人| 亚洲美女一区二区三区| 國產尤物AV尤物在線觀看| 久久综合成人| 九九热精品视频在线| 91系列在线观看| 香蕉视频在线观看www| 亚洲福利视频一区二区| 国产丝袜精品| 一区二区在线视频免费观看| 成人噜噜噜视频在线观看| 特级aaaaaaaaa毛片免费视频| 国产三级韩国三级理| 欧美第九页| 亚洲欧美色中文字幕| 欧美丝袜高跟鞋一区二区| 欧美成一级| 免费在线色| 国产日韩欧美精品区性色| 欧美人与动牲交a欧美精品| 亚洲综合片| 在线另类稀缺国产呦| 国产毛片基地| 狠狠久久综合伊人不卡| 欧美一级夜夜爽| 麻豆精品在线视频| 精品亚洲麻豆1区2区3区| 中文字幕色站| 精品国产网站| 国产激情无码一区二区三区免费| 国产成人无码Av在线播放无广告| 国产一国产一有一级毛片视频| 岛国精品一区免费视频在线观看| 性喷潮久久久久久久久| 欧美精品v| 九九热这里只有国产精品| 91丝袜在线观看| P尤物久久99国产综合精品| 天天综合网色中文字幕| 亚洲成a人在线观看| 国产日韩精品欧美一区灰| 91亚洲精选| 四虎影视永久在线精品| 国产极品美女在线观看| a级毛片免费看| 久久精品亚洲中文字幕乱码| 国产精品综合色区在线观看| 欧美日韩国产在线人| 麻豆精品久久久久久久99蜜桃| 色综合天天视频在线观看| 久久公开视频| 六月婷婷综合|