999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于python 的社交情感分析注意力模型

2021-03-01 08:45:20
智能計算機與應用 2021年12期
關鍵詞:單詞文本情感

薛 濤

(運城師范高等專科學校 數計系,山西 運城 044000)

0 引 言

人們通過社交平臺來表達感受、情緒和態度,社交平臺的帖子中通常包含豐富的信息,因此社交媒體成為熱門研究對象。其中,情感分析是最基本且關鍵的研究主題之一[1-3]。情感分析的目的是分析社交媒體的極性,以判斷人們對某些事件所持有的正面、負面或中性態度[4-5]。有研究者提出將社交媒體中的表情符號應用于情感極性預測,目前大多數現有的方法不僅依賴于手工特征,還分別考慮了表情符號和純文本的情感,但并沒有充分探索表情符號對文本情感極性的影響。表情符號在純文本的情感極性中起著重要作用,對于情感原本是中性的純文本,在純文本后添加開心或沮喪的表情會使帖子表達不同的情緒極性。

本研究提出了一種深度學習模型,結合表情符號對文本情感極性的影響以進行情感分析。該模型使用雙向長短期記憶模型來構建社交平臺帖子的表示,使用注意力模型計算每個單詞的權重。研究的主要貢獻有兩點:首先建立了帶有表情符號、包含超過1 萬條帖子的語料庫;其次,聯合訓練微博帖子中的表情符號和單詞,獲得包含其上下文信息的表情符號表示。

1 符號語料庫

大多數現有的情感分析語料庫僅包含一小部分帶有表情符號的內容,這些語料庫并不適用于基于表情符號的情感分析。因此,需要收集和注釋帶有表情符號的文本。

由新浪微博收集了250 000 條微博帖子,從中提取了85 000 條包含表情符號的帖子。根據每個表情符號的出現次數,對微博帖子進行排名,并選擇至少出現10 次的表情符號集。用表情符號分割每條微博帖子,選擇只包含一個表情符號的微博帖子,并過濾掉帖子中的URL、用戶名和主題標簽以清理數據,并選擇至少出現10 次的表情符號集。用表情符號分割每條微博帖子,并保留長度大于5 的微博帖子。在篩選出的35 000 條微博帖子中,隨機抽取了18 000 條微博帖子進行下一步標記,并使用Jieba 中文文本分詞工具進行分詞。

采用手工標注的方式來構建語料庫。情感極性分為正面、中性和負面,分別用0、1、2 表示。首先,僅根據文本來判斷每個帖子的極性,即從文本中刪除表情符號,僅使用每條微博帖子的純文本來確定帖子的極性;然后,結合文本和表情符號來確定每個帖子的極性。語料庫的極性結果見表1。

表1 語料庫的極性Tab.1 Corpus polarity %

由此可見,表情符號的出現會改變帖子的情感極性。表2 展示了情感極性變化的社交帖子情況。

表2 情感極性變化的情況Tab.2 Changes of emotional polarity

2 情感分析模型

本文提出的社交情感分析注意力模型結構如圖1 所示。

圖1 情感分析模型Fig.1 Sentiment analysis model

應用雙向長短記憶(Bi-directional Long Short Term Memory,Bi-LSTM)模型學習句子的表征,將表征作為特征對情感的極性進行分類。本文使用PyTorach 來實現該模型,PyTorach 是一個基于Python 的深度學習框架。模型初始化過程如下:

LSTM 能捕獲序列中的長距離依賴關系。一個LSTM模型由多個LSTM 單元組成,其中每個LSTM單元對神經網絡中的記憶進行建模。LSTM 單元包含的門結構允許LSTM 存儲和訪問隨時間變化的信息。給定一個包含詞wt的短文本,使用嵌入矩陣We將這些詞嵌入到向量xt=Wewt中,該向量的維度是d。Bi-LSTM 包含一個前向LSTM 以讀取從x1到xT的文本和一個后向LSTM 以讀取從xT到x1的文本,即:

Bi-LSTM 將每個詞wt映射到一對隱藏向量和中,那么一個詞可以表示為一對向量的串聯,即ht=。因此,得到[h0,…,hT],然后將其輸入到平均池化層以獲得句子的表示s。

為了表明表情符號對文本情感極性的影響,提出了一種基于表情符號的注意力機制。給定一個微博帖子,每個詞對情感極性的貢獻是不一樣的,表情符號的交互權重也不均等。EA 機制結合單詞和表情符號來衡量微博帖子中單詞的權重。

在微博帖子{w1,...,wT;E} 中,wi表示單詞,E表示表情符號。首先,wi和E都被轉換為向量表示,即xi和e。

聚合這些詞的表示以形成句子表示,句子表示s是隱藏狀態hi的加權和,即:

其中,權重ai用于衡量第i個詞的重要性,其計算方式為:

其中,函數f(·)表示單詞的重要性,函數f(·)的定義為:

其中,Wh、WE是可學習的參數;vT表示v的轉置;b是偏置。

串聯了3 種類型的特征,如下所示:

其中,和表示最后一步中前向和后向LSTM 的隱藏狀態。

訓練的目標是最小化交叉熵損失,在引入基于表情符號的注意力機制后,獲得了用于文本情感分析的特征lc。模型使用線性變換,將lc投影到C種類別的目標空間中:

之后,使用一個softmax 層來獲得微博帖子情感的概率分布:

其中,C是情感標簽的數量,pc是情感標簽c的預測概率。

softmax 層的python 實現如下所示:

設(d)是帖子的目標分布,pc(d)是預測的情緒分布,D是微博帖子的集合。訓練目標是最小化集合D中的(d)和pc(d)之間的交叉熵損失,則損失函數定義為:

3 實驗評估

為了獲得單詞和表情符號的嵌入表示,使用word2vec.3 的SkipGram模式,對由350 萬條微博組成的大規模語料庫上訓練單詞和表情符號嵌入。

實驗中使用5 重交叉驗證。原始數據被隨機分成5 個相等的部分,其中4 個部分用于訓練,第5 部分用于測試。從4 個訓練部分中隨機選擇一個部分作為開發集來調整超參數。分類結果通過準確度來衡量。準確度定義為T/N,其中T表示預測的與真實情緒評級相同的情緒評級數量,N表示微博的總數量。由于多分類中類不平衡問題,還使用了宏觀精度來進行更公平的比較。

將詞嵌入和表情符號嵌入的維度設置為200。LSTM 單元中隱藏狀態和單元狀態的維度設置為100。在訓練期間,使用Adadelta 作為優化方法。訓練的批次大小為16,動量為0.9,初始學習率α為0.01。

為了評估本模型的性能,將其與E-only[6]、SVM、LSTM 和Bi-LSTM 等算法進行了比較。其中,E-only 是僅使用表情符號來判斷情感的極性,Bi-LSTM 將微博帖子的文本和表情符號作為Bi-LSTM模型的輸入進行情感分析,實驗對比了各個模型的精度、召回率、F-度量和準確度,表3 給出了所有模型進行情感分析的實驗結果。由于類不平衡問題,算法在中性極性的性能要遠低于其它極性。

實驗結果從表3 的結果可見,由于模型利用了包括文本、表情符號特征,以及表情符號對文本的影響,本文模型表現最佳。這表明基于表情符號的注意力,可以有效地捕捉表情符號對文本情感極性的影響。此外,LSTM 優于SVM,表明與具有稀疏指標特征的離散模型相比,神經網絡模型能更好地提取文本和表情符號特征。

表3 實驗結果對比Tab.3 Comparison of experimental results

Bi-LSTM模型與本文模型對不同情感極性的準確率比較,結果見表4。從中可以看出,在情感變化方面,本文模型在大多數情況下優于Bi-LSTM模型。

表4 極性變化的準確度對比Tab.4 Accuracy comparison of polarity changes

4 結束語

本研究設計并實現了基于注意力模型的情感分析模型。該模型考慮了表情符號對文本情感極性的影響。與現有的模型相比,本模型實現了較好的性能。未來的工作將在以下兩個方向上進一步研究表情符號對短文本情感極性的影響。首先,將研究擴展到其它類型的短文本。其次,將采用其它神經網絡模型以探索表情符號對文本的影響。

猜你喜歡
單詞文本情感
如何在情感中自我成長,保持獨立
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
單詞連一連
情感
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
如何在情感中自我成長,保持獨立
看圖填單詞
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
主站蜘蛛池模板: 亚洲日韩精品无码专区| 国产v精品成人免费视频71pao| 无码丝袜人妻| 国产精品一区二区久久精品无码| 色婷婷电影网| 欧洲高清无码在线| 亚洲成人一区二区| 尤物精品视频一区二区三区| 精品人妻一区无码视频| 99在线视频免费| 国产剧情国内精品原创| 国产91av在线| 日本亚洲国产一区二区三区| AV不卡在线永久免费观看| 国产亚洲欧美在线中文bt天堂| 欧美亚洲国产精品第一页| 国产无码制服丝袜| 国产午夜无码专区喷水| 一本久道久综合久久鬼色| 国产精品大白天新婚身材| 91色国产在线| 婷婷综合色| 中文字幕第4页| 最新国产精品第1页| 亚洲国产成人精品青青草原| 国产麻豆另类AV| 精品国产欧美精品v| 无码免费视频| 亚洲成人网在线播放| 91在线播放免费不卡无毒| 欧美福利在线观看| JIZZ亚洲国产| 四虎影视库国产精品一区| 日韩av无码精品专区| 四虎永久免费地址在线网站| 欧美日韩v| www.亚洲色图.com| 国产精品漂亮美女在线观看| 成人午夜网址| 国产成人艳妇AA视频在线| 好吊日免费视频| 国产黄色免费看| 女人18毛片久久| 99999久久久久久亚洲| 2048国产精品原创综合在线| 久无码久无码av无码| 蝴蝶伊人久久中文娱乐网| 亚洲视频一区| 国产亚洲精久久久久久无码AV| 丁香婷婷综合激情| 欧美三级视频网站| 人人看人人鲁狠狠高清| 国产又粗又猛又爽视频| 国产精品女主播| 真实国产精品vr专区| 国产极品美女在线播放| 国产亚洲精品97AA片在线播放| 亚洲精品视频免费观看| 成人在线视频一区| 老司机午夜精品网站在线观看| 91精品国产自产在线观看| 青草午夜精品视频在线观看| 精品久久蜜桃| 亚洲一区免费看| 国产丝袜一区二区三区视频免下载| 免费又爽又刺激高潮网址| 亚洲婷婷丁香| 第九色区aⅴ天堂久久香| 人妻精品久久无码区| 精品剧情v国产在线观看| 国产精品福利在线观看无码卡| 久久伊人操| 在线亚洲精品自拍| 国产国语一级毛片在线视频| 色综合中文综合网| 三上悠亚一区二区| 国产成人91精品免费网址在线| 日韩第一页在线| 中国黄色一级视频| 国产在线一区视频| 久久人体视频| 中文字幕2区|