◆孫丹丹 鄭瑞坤
(湖北工業(yè)大學 湖北 432200)
近年來,網絡輿情的影響力不斷擴大,特別是一些重大突發(fā)事件發(fā)生后,網絡輿情快速發(fā)酵,能夠形成強大的社會力量。因而,網絡輿情的有效引導與否,既事關現(xiàn)場應急處置的成功,也關系到社會穩(wěn)定與和諧[1]。
對于網絡輿情的情感分析,早期研究多是通過情感詞典匹配的方法或是基于傳統(tǒng)機器學習算法[2]。情感詞典法有較強的通用性,實現(xiàn)簡單,但情感詞典有較高的要求,需要專家花費較大工作量構建具有針對性的高質量詞典。Tan[3]等通過情感詞典方法,構建新聞文章的情感分析器,對新聞的標題和內容賦予不同權重來分析蘊含的情感,進而探究其對分析結果的影響效應。而傳統(tǒng)機器學習算法需要人工構造十分復雜的特征,利用樸素貝葉斯、支持向量機等分類器實現(xiàn)有監(jiān)督學習,再分析文本中蘊含的情感[4]。Pang等[5]運用了三種常見的機器學習算法來分析文本的情感傾向,對比研究結果發(fā)現(xiàn)支持向量機(SVM)的準確率以及查全率均高于另外兩種算法。
目前,深度學習應用更加廣泛,文本情感分析研究領域逐漸采用深度學習分析方法。深度學習通過模擬人腦神經系統(tǒng)來構造網絡模型對文本進行學習,從原始數(shù)據(jù)中自動提取特征,無需手工設計特征,面對海量數(shù)據(jù)的處理,在建模、遷移、優(yōu)化等方面比機器學習的優(yōu)勢更為明顯。Kim[6]最早提出將CNN用于文本情感分析,在預訓練的詞向量上使用不同大小卷積核的CNN提取特征,對句子級的分類較機器學習有顯著優(yōu)勢。……