吳敏


摘 要:本文通過三個步驟對網絡熱點的評論文本進行文本情感極性分析。首先是情感詞匯的選擇提取,本文的文本情感分析是從《知網》情感詞典選取關鍵詞;其次是將詞語的情感極性進行計算;最后是通過情感極性值來確認網絡熱點的輿情走向是正面還是負面偏多。網絡監管部門可以根據網絡熱點的輿情分析來進行實時監控和管理。
關鍵詞:文本情感分析;網絡熱點;輿情分析
一、網絡熱點輿情分析
輿情作為現代社會中體現民意的重要途徑,越來越成為各國關注的焦點。輿情不僅反映民意,同時也影響民意。在互聯網高度發達的今天,社會輿情不可避免的會在互聯網空間有所反應[1]。隨著互聯網時代的到來,對輿情的監測與研究逐步實現了動態化、實時化[2]。
對熱點網絡輿情進行文本挖掘及各演化階段的情感傾向判斷,從根本上解釋演化的原因及規律,從而為相關部門有效監控網絡輿情的發展、引導網民情感傳播提供理論支持,具有比較深刻的研究意義[3]。
二、評論文本的情感極性分析
按照處理文本的力度不同,情感分析可分為詞語級、短語級、句子級、篇章級幾個研究層次[4]。網絡熱點的評論主要是詞語級和短語級文本,通常在進行文本情感傾向分析時,無論是句子級還是篇章級的數據都依賴于情感詞典。所以,情感分析判斷的準確性直接依賴于情感詞典的好壞。在很多評論中,不同的情感程度也會出現不同的結果。因此,在選取情感詞典的同時還需要對程度副詞的情感強弱做定量計算。本文的情感詞典建立在現有的《知網》的情感分析用語詞集上,利用現有情感詞典的極性分類,統計情感詞典中出現的每個程度副詞的情感強度值,將這個數據結合情感詞的組詞匹配特點,進行加權統計計算現有情感詞典中每個極性詞的情感強度。
(1)提取否定副詞
否定詞是副詞的一種,它這一類表示否定意義的詞語,在文本中具有獨特的語法意義和影響,在情感傾向分析中,否定詞具有轉折性的意義,因此處理轉折詞匯非常重要。研究表明,當句子中褒義詞語被否定副詞修飾時,那么整句話的意思就會完全相反,轉化為貶義情感。本文通過從《知網》詞典選取具有否定意義的詞語組成了一個常用否定詞表,主要有(不,不是,不得,不讓,不能,不應該,沒,沒有,無,未,未必)。在評論中,通過關鍵詞匹配方法,檢測是否存在否定詞,從文本內容中提出否定詞,如果單次匹配中存在一個否定詞,則情感傾向取反,如果存在兩個否定詞,則保留本身的極性,如果存在三個否定詞,則情感傾向再取反,以此類推。
(2)提取程度副詞
程度副詞,是對一個形容詞或者副詞在程度上加以限定或修飾的副詞。一般位置在被修飾的形容詞或者副詞之前,用漢語舉例:“尤其”,“非常”,“特別”,“有點”,“不怎么”等等,至于語氣和感覺是由后面的情感詞決定,程度副詞只是說明它的情感強烈度。本文通過《知網》中的程度級別詞語集,并對其進行整理篩減,最后將其分為5級,分別為極量、高量、中量、低量、超低量。如下表2-1是常用程度副詞分類集合。
不同程度副詞表達的情感強度是不一樣的,在每個等級都有相對應的取值。根據程度副詞和情感詞匯的匹配得出情感詞的極性,最終得出整條評價的情感傾向。不同程度副詞的取值如表2-2表示:
(3)提取情感詞
在評論文本中存在許多情感詞匯,大多數詞語都具有明確的情感傾向,也存在一部分詞語很難辨別其所屬的情感類。在本文中,我們把情感詞匯作為一個模糊的對象,對于其中一些關鍵詞,比如“漂亮”和“糟糕”,它們具有非常明確的情感,屬于情感核心詞匯。但是有些詞匯針對不同熱點所表達的情感可能是大不相同的。本文主要通過基于詞典的方法結合評論語境數據獲取情感詞匯,如表2-3所示:
(4)情感極性加權統計算法
本文分析情感極性算法來自于文獻[12]中的算法,情感分析模塊中情感極性研究的是句子級別的情感分析技術,通過評論預處理以及分詞技術,得出評論中的個別情感詞匯,如果句子匹配中存在程度副詞修飾情感詞,那么該情感詞匯的情感極性的計算公式如下所示:
經過(2.1)-(2,4)的處理,最終獲得情感極性,該極性為整條評論的情感極性。從而為用戶提供正負面識別的用戶輿情服務。
三、結論
本文通過對輿情進行實時的情感極性分析的信息監測,也可以對熱點進行監測和預警,實時掌握輿情,從而能夠在必要時,對輿情導向做一個控制,進而維護社會的穩定。
參考文獻
[1]楊志國.基于WEB 挖掘和文本分析的動態網絡輿情預警研究[D] .武漢:武漢理工大學計算機科學與技術學院,2014 .
[2]羅怡薇,張科偉.基于文本挖掘的網絡熱點輿情分析[J].內蒙古科技與經濟.2018,(21):18,101.
[3]李黎.基于文本挖掘的網絡輿情情感傾向及演化分析[D] .湘潭:湘潭大學,2017 .
[4]來亮,錢屹.文本情感分析綜述[J].計算機光盤軟件與應用,2012,15(18):74-75.
[5]楊彪.基于電子商務的評價文本情感極性等級分析[D].重慶:重慶交通大學,2014