摘要:對于各行各業來說,使用情感分析技術挖掘中文文本數據,并通過中文文本查找情感信息非常重要。因此,情感分析已成為自然語言處理領域最為活躍的部分之一。本文針對基于深度學習的中文情感分析模型進行了基本研究,以CNN為重點分析對象,分別對多通道和多注意力CNN的情感分析模型進行了深入探索。
關鍵詞:深度學習;中文情感分析;CNN
引言
隨著網絡信息技術的飛快發展,社交網絡已成為人們生活必不可少的一部分。通過網絡平臺,人們可以更加自由地表達意見,并產生了大量帶有情感信息的中文數據。近年來,深度學習在自然語言處理領域得到了更加廣泛的應用,基于深度學習的中文情感分析取得了良好的效果。
一、情感分析模型--CNN
2006年,Hinton首次提出了深度學習的概念,而卷積神經網絡(CNN)是深度學習的模型之一。該模型最初主要是用于圖像識別和視覺開發,特別是在圖像識別領域,CNN的應用帶來了質的飛躍[1]。一九九八年,有著“CNN之父”之稱的YannLeCun教授在其論文中提出了LeNet-5模型,這是CNN首次在數字識別中得到了成功應用。CNN創建了一種監督學習算法,通過減少空間的相對關系來減少參數的數量,從而提高模型訓練性能。從本質上來看,CNN使用數學中的卷積概念通過池化層以及卷積層從文本中提取特征。因此,它主要是由卷積層和池化層組成。
(一)卷積層
卷積層是CNN的關鍵部分,主要是由節點組成,每個節點的輸入由上一層神經網絡中的一塊組成。對于大小不同的窗口,其過濾器通常是卷積層的一部分,并且大小取決于實際操作。過濾器是用于識別特征的識別器。通過使用相同的過濾器以減少參數的數量。過濾器也被稱為卷積核,是卷積層的核心部分。卷積過程可以理解為使用過濾器掃描整個圖矩陣并獲得新的矩陣,卷積層會更深入地分析神經網絡的每個小塊,并獲得更多的抽象特征。
(二)池化層
它的作用主要是通過減少參數來篩選特征,也可以視為是一種刪除參數的過程,并留下主要參數計算數量。卷積將導致大量的特征圖數據龐大,訓練數據也不足,從而導致過度擬合的問題。卷積層的主要特征之一是特征的不變性,例如圖像是一只小動物,在壓縮之后依然可以看出是一只小動物。在壓縮過程中,僅僅刪除了與小動物無關的信息。第二,特征尺寸減小。如果圖片具有過多的信息和特征,下一步則需要簡化其復雜性,刪除不相關的部分信息,并保留最重要的特征。
二、多通道CNN的情感分析模型
基于CNN的情感分類模型可以充分挖掘中文的情感特征信息,接收詞匯向量輸入,并通過不同大小的卷積核提取出輸入中文的豐富特征。在完成中文情感分析模型的過程中,由于中文文本中包含的信息有限,為了提取更豐富的情感特征,一些研究將這種詞向量和獨特的情感特征信息作為CNN輸入,在文本中挖掘隱藏的情感特征[2]。盡管該方法增加了情感特征,并取得了比傳統方法更好的效果,但該方法在情感特征使用上通常取決于人工情感詞典,無法充分利用其他方法中的特征信息。為了解決這些問題,基于多通道CNN的情感分析模型已被廣泛使用。該模型采用詞性向量來表達中文中的情感詞,可以在訓練過程中學習到更多細微的情感特征。通過介紹詞匯的位置特征,可以表達出詞匯在中文文本中的重要性。最后,通過多通道接收不同特征的組合信息,挖掘中文中豐富的特征信息。
三、多注意力CNN的情感分析模型
通過調整注意力矩陣,可以在訓練過程中更加注意某些信息。例如,在特定目標的情感分析過程中,網絡模型可以通過在訓練過程中通過注意力特征映射,來密切關注特定目標句子的情感信息,從而正確識別不同目標的情感特征。為了更加關注情感信息分析的特定目標,有效識別目標特征,基于多注意力CNN的情感分析模型的提出顯得非常重要。通過將注意力機制與接收并行輸入的CNN相互結合,模型的訓練速度與順序神經網絡相比較更快。同時,基于多注意力CNN的情感分析模型增加了一些詞性關注機制,以另一種方式更加關注特定目標的情感信息,從而更好地利用句子中特定目標的特征信息。
(一)注意力機制
在情感分析模型的特定任務中,結合注意力機制的深度網絡模型可以通過調整注意力矩陣,識別同一句子中不同目標的信息。該機制最初主要是應用于圖像處理,這使得神經網絡在處理數據時能夠處理到一些重要的信息。2014年,mnih等人提出將注意力機制在圖像分類任務中加以應用,證明了該機制在圖像處理領域的有效性,并使神經網絡與該機制的結合成為深度學習領域的研究熱點。
(二)多注意力卷積神經網絡
本文將介紹如何通過CNN輸入層中的三種注意力機制將其與不同類型的注意機制結合起來,主要包括以下幾個部分:
(1)輸入矩陣。存儲了三種不同注意力機制的矩陣信息;
(2)操作層。針對三種不同的注意力矩陣,使用不同的操作來構造輸入文本的特征表示,這使得模型在訓練過程中從不同形式更加關注特定目標;
(3)卷積層。為了簡化網絡模型,使用卷積層提取不同注意機制信息的特征,通過對多個窗口和卷積核的卷積運算,可以獲得更加豐富的輸入特征;
(4)池化層。對于通過不同卷積運算獲得的輸入信息的局部特征,分別進行池化處理,挖掘不同注意力機制中最重要的情感特征;
(5)合并層。從上一層次中提取的重要信息用作合并層的輸入,以形成文本的深度特征向量表示,合并層的輸出向量可以用作完整連接層的輸入;
四、結束語
近年來,深度學習已在自然語言處理領域得到了越來越廣泛的應用,并取得了良好效果。中文情感分析模型是自然語言處理領域的研究熱點之一,通過在中文中提取出情感信息加以應用,對許多行業都具有重要意義。該領域的許多專家已經進行了深入研究,本文只是基于他們的理論進行了初步探索,仍有許多需要改進的地方,未來還將對基于深度學習的中文情感分析進行深入學習和研究。
參考文獻
[1]楊丹,張夢,朱毅.基于深度學習的中文情感分析研究[J].電腦知識與技術學術版,2019(7X):188-190.
[2]金相宇.基于深度學習的中文短文本情感分析[D].沈陽工業大學
[3] 范濤, 吳鵬, 曹琪. 基于深度學習的多模態融合網民情感識別研究[J]. 信息資源管理學報, 2020(1):39-48.
[4] 羅元, 王薄宇, 陳旭. 基于深度學習的目標檢測技術的研究綜述[J]. 半導體光電, 2020, 41(1).
[5] 余傳明, 李浩男, 王曼怡,等. 基于深度學習的知識表示研究:網絡視角*[J]. 數據分析與知識發現, 2020, 4(1).
作者簡介:賈鵬(1995-),男,漢族,山西省呂梁市人,碩士,單位:西華大學計算機與軟件工程學院,研究方向:情感分析