張尚乾 劉知一
(中國電影科學技術研究所(中央宣傳部電影技術質量檢測所),北京 100086)
隨著社交媒體平臺的興起以及廣泛使用,針對社交網絡文本數據的自然語言處理 (NLP)已成為當前研究熱點。在電影方面,越來越多的人在電影論壇或影視網站上發表自己的評價及觀點,這些評價及觀點蘊含著對影片、演職人員、電影產業、電影市場的情緒、認知、態度、情感及行為傾向。一般來說,網絡口碑對消費者的觀影選擇具有顯著影響,口碑評價越高,其票房收入越高。因此,對電影評價的情感分析,有助于了解觀眾的情感傾向,及時獲取觀眾的觀點和態度,對于電影輿情控制、刺激潛在消費者觀影等都有非常重要的意義。
本文對中文影評進行了本體特征和情感特征分析,并在此基礎上實現了影評文本級和特征級的情感分析。
文本情感分析又稱意見挖掘,簡單而言,是對帶有情感色彩的主觀性文本進行分析、處理、歸納和推理的過程。文本級情感分析目的是判斷文本層面的整體情感傾向,但評論文本的整體情感傾向可能與評價文本中的本體特征的情感傾向有差異。特征級情感分類是細粒度情感分類任務,該任務的目標是對于給定的短文本中出現的本體特征,推測出相應本體特征對應的情感極性,如正面、中立和負面。
情感分析方法主要包括基于詞典的方法、基于機器學習分類的方法、基于深度學習的方法。……