【摘要】 通過自建電影《流浪地球》的網絡影評語料庫,設計了基于詞典的情感分析算法,隨機抽取豆瓣600條網絡影評展開情感分析,并借助態度系統對情感詞進行標注。結果發現,觀眾對技術和主題滿意度高,對情節、表演及語言滿意度低。
【關鍵詞】 情感分析;網絡影評;態度系統
【中圖分類號】J905? ? ? ? ? 【文獻標識碼】A? ? ? ? ? 【文章編號】2096-8264(2021)02-0104-02
基金項目:江蘇省研究生科研創新計劃“基于評價理論與Python情感分析的中美德電影跨文化協同研究”(項目編號:KYCX20_1046)資助項目的階段性成果。
隨著互聯網的飛速發展,網絡成為人們日常交際的熱點領域,影評也隨之網絡化。各階層民眾通過對電影進行描述和評價,來表達自身的美學認知和價值期許。美國傳播學者Herbert Schiller(1982)指出:“電影、廣播、電視、書籍、新聞等隨處可見的文化產品或服務,不僅提供消息和娛樂,同時也是傳播社會價值或政治觀點的工具,最終它們會對社會和精神結構產生深刻的影響。”然而,目前國產電影跨文化研究尚存在宏觀研究有余、微觀研究不足等諸多問題。因此本文通過對影片《流浪地球》的豆瓣網絡影評進行特征提取和情感分析,并采用態度系統對情感詞進行標注,考察觀眾對影片從整體到局部的滿意度,以此為自然語言處理、話語分析等相關研究提供幫助和啟示。
一、國產電影研究現狀
國外學者對中國電影的研究建立在跨文化的視角上,他們運用西方的電影理論、電影批評理論考察中國電影反映的政治、經濟、文化等問題,并對中國電影在外傳播與接受狀況進行研究,相關成果有Chris Berry、George Semsel等分析了中國電影的藝術性;Paul Clark、Nick Browne、Poshek Fu等對中國電影的政治元素進行解讀;Stephanie Donald、Tonglin Lu等對中國電影的現代性及在西方的接受程度研究等。
21世紀初,隨著國家廣播電影電視總局廣播影視“走出去工程”正式啟動,國產電影的跨文化研究隨之興起,相關事例有戴元光、邵培仁、項欣、李小麗等對國產電影的跨文化傳播策略進行了探討;姚朝文、葛玉清、儲常勝等對特定類型的國產電影傳播進行了研究等。然而以影評為研究對象的學者較少,相關研究有尚宏通過23篇中美日專業影評對比中美日三國的文化差異;李亦中、趙菲運用NLTK自然語言處理對《紐約時報》影評進行分析,對中國電影在美國的口碑與傳播進行了歷時性研究。綜上,目前影評相關研究存在研究數量少、語料稀薄、理論運用不足等問題。因此,本研究將自然語言處理技術及評價理論延伸至電影文化領域,通過對網絡影評的情感態度進行挖掘,考察觀眾對影片的接受情況。
二、研究方法
(一)數據收集及預處理
1.語料收集。采用隨機抽取的方式于豆瓣網站抽取影片《流浪地球》的網絡影評,保留用戶名和評分,剔除無關項后得到影評600條共199176字,構建小型網絡影評語料庫。
2.分句及去停用詞。首先,對語料進行分句處理,得到4947條分句;其次,采用百度停用詞表對語料進行去停用詞處理,并利用Python進行過濾,得到中文影評共計144397字詞;最后,利用結巴分詞對語料進行分詞。
3.特征提取。分別提取詞頻數量前200的詞進行分類得到特征項。在特征提取方面主要根據名詞和名詞詞組出現的頻率進行提取[1]。最后利用特征項對語料進行歸類。
(二)情感分析框架
情感分析,又稱主客觀分析,以挖掘文本信息中用戶表達的情感極性為目標。常見的情感分析技術有基于情感詞典的無監督分類方法和基于機器學習的有監督分類方法。基于情感詞典的方法主要根據情感詞庫來匹配計算評論的情感傾向,而基于機器學習的方法通過人工設計代表評論文本的特征,然后抽取評論特征并表示成文本向量,對文本進行分類(樊振等 2018)。本研究采用基于詞典的情感分析方法對文本進行情感分析。
(三)態度分析框架
評價理論是關于評價的,即語篇中所協商的各種態度、所涉及的情感的強度以及表明價值和與讀者形成聯盟的各種方式[4]。評價理論包括三大系統:態度、介入、級差,其中態度系統是中心[3]。態度系統又可進一步劃分為情感、判斷和鑒賞三個子系統。情感系統關注積極或消極感情的表達;判斷系統根據倫理、道德和社會規約評論人的行為;鑒賞系統涉及對符號和自然現象的評價,依據的是特定領域內評價的方式和標準[4]。態度有正面和負面、顯性和隱性之分,態度的好壞顯隱與否,取決于表達態度的語言意義[2]。
本研究基于情感詞典導出情感詞表,運用態度系統對情感詞進行標注,然后利用Antconc 3.4對特征詞左右緊鄰的語境搭配詞進行凸顯檢索,左右窗口大小設為3,按詞頻排序。通過情感詞結合語境分析,對特征項情感進行挖掘。
三、結果與討論
根據情感分析的結果顯示,影評共有2966條正傾向語句和1981負傾向語句,可見正負傾向語句數差距明顯,說明觀眾對影片總體滿意度高。同時,影評正傾向語句的占比隨評分增加而升高,負傾向語句的占比呈中間高兩邊低的趨勢。其中,正傾向語句在四分和五分段高于負傾向語句占比,在其他分段都低于負傾向語句占比。說明三分以上分段觀眾滿意度高,三分以下分段觀眾滿意度低。在影評詞頻最高的150個情感詞中,情感類情感詞共43個,判斷類53個,鑒賞類54個說明觀眾以客觀性描述和評判為主。
通過對高頻詞進行篩選及分類,得到占比前五位的特征為情節(21%)、主題(18%)、人物(11%)、技術(10%)、表演(5%)。可以看出,觀眾對“情節”和“主題”層面關注度高,而對“表演”層面關注度較低。說明相較于影片的演繹,觀眾更注重視影片內容。情感分析結果顯示,正面語句共1614條,負面語句共1734條,總體上負面語句數略高于正面語句數,且正面情感主要集中在“主題”和“技術”層面,負面情感主要集中在“情節”和“人物”層面。情感詞表中正面情感詞543個,負面情感詞509個。在態度類別上,鑒賞類情感詞數量最多,情感類情感詞數量最少。
情節方面,負傾向語句數遠高于正傾向語句數,情感詞以負面判斷和正負面鑒賞為主。評論大致集中在“故事”“邏輯”和“科學設定”三個方面。觀眾認為影片故事“單薄”“倉促”,但總體“連貫”“有創意”,邏輯上“混亂”“不合理”且“不容推敲”,科學設定更是“不嚴謹”“漏洞百出”。
主題方面,正傾向語句數遠高于負傾向語句數,情感詞以正面鑒賞和正負面判斷為主。評論主要體現在“人類”“希望”“英雄”和“家園”四個方面。首先,觀眾從影片中感受到了人類的“渺小”,絕望之處的“希望”。其次,中方觀眾認為地球是人類的“家園”,與人類“不可分割”。最后,中方觀眾“感動”于萬千平民英雄,“震撼”于人類最后時刻的“團結”,對中國人能拯救世界感到“自豪”。
人物方面,負傾向語句數遠高于正傾向語句數,情感詞以負面判斷和負面鑒賞為主。評論主要體現在“人物塑造”“人物刻畫”和“人物情感”三個方面。中方觀眾認為人物塑造“單薄”“混亂”,人物關系缺乏說明;人物刻畫“隨意”“片面”;人物情感“簡陋”“泄氣”。具體人物方面,觀眾提及最多的為“劉啟”“韓朵朵”和“劉培強”。對于劉啟,中方觀眾認為其“叛逆”“任性”、稱姥爺為“老東西”讓人不適;對于韓朵朵,觀眾認為其“沒用”“強行煽情”,關鍵時刻的演講更顯“啰嗦”“尷尬”,讓人“著急”;對于劉培強,觀眾認為其為救兒子棄全人類的未來于不顧、作為軍人不服從指令,是“自私”“不負責任”的表現。
技術方面,正傾向語句數遠高于負傾向語句數,情感詞以正面情感和正面鑒賞為主。評論大多聚焦“特效”“畫面”和“場景”三個層面。觀眾認為特效“好”“棒”,場景“震撼”“恢弘”,畫面“考究”“精致”,技術上甚至是“不輸”好萊塢的。
表演方面,負傾向語句數略高于正傾向語句數,情感詞在態度系統下的分布較為均勻。評論大致集中在“演技”和“演員”兩個方面。觀眾認為片中老戲骨的演技還是“在線”的,但年輕演員演技“尷尬”,觀眾容易“出戲”。觀眾顯示出對吳京、吳孟達的高關注度,對于吳京,中方觀眾觀點不一,有部分觀眾認為作為投資人,他的眼光不錯,但演技上有些“過力”,塑造的形象還停留在電影《戰狼》層面。對于吳孟達,中方觀眾認為“超出預期”,一反以往的喜劇形象,唯一的不足是戲份太少,可見觀眾對其的喜愛。
四、結論
本研究分析發現,影評評分的正負傾向和觀眾態度的正負傾向呈現不協調性,由此可見,觀眾評分具有隨機性、任意性。從特征分布上看,觀眾對影片情節、主題關注度最高,說明觀眾更加注重影片內容。在中國工業技術日益提升的今天,影片創作者不僅要加強技術上的投入,也應當注重對影片內容和人物的打磨。
參考文獻:
[1]唐曉波,蘭玉婷.基于特征本體的微博產品評論情感分析[J].圖書情報工作,2016,60(16):121-127.
[2]王振華,張慶彬.基于語料庫的中外大學校訓意義研究——“評價系統”視角[J].外語教學,2013,34(06): 7-12.
[3]司顯柱,徐婷婷.從評價理論看報紙社論的意識形態[J].當代外語研究,2011(11):17-20.
[4]Martin, J. R., P. P. R. White. The Language of Evaluation: Appraisal in English. New York: Palgrave Macmillan, 2005.
作者簡介:
鄧燕燕,女,漢族,江蘇南京人,碩士研究生,南京工業大學外國語言文學學院,研究方向:德語語言學、跨文化交際。