陳 力 黃樹成
(江蘇科技大學計算機學院 鎮江 212003)
伴隨著互聯網體量的快速擴張,互聯網技術也在飛速發展,在給人們的生活帶來便利的同時,也改變著人們的生活習慣。越來越多的人會在社交平臺上,針對某一事件發表自己的態度和看法,或者在網絡購物平臺上分享自己對某個產品或者服務的使用體驗。這些網絡評論里蘊含著網民的觀點、態度、情感信息等。分析其中隱含的信息,挖掘出評論者的情感傾向[1],可以為政府了解民眾對于某一政策的滿意程度提供數據支撐,為消費者是否產生購買行為提供信息參考,還能對企業改進產品或者服務起到指導作用。
由于網絡發展迅速,當前的語言文化日新月異,出現了很多新興詞匯,并且隨著網絡文化的不斷發展,還會不斷產生更多新事物。傳統情感詞典中包含了大量常用詞語,具有一定的普適性。但是對于近年來網絡上出現的新詞匯,情感詞典中都沒有涉及,因此想要使用情感詞典的方法進行情感傾向的判別,還需要在傳統詞典的基礎上進行擴展。
為了提升情感詞典的擴展效果。本文將SO-PMI 和Fast Unfolding 算法結合,提出FU-PMI算法。1)使用TF-IDF 改進傳統SO-PMI 選取種子詞的方法。2)結合PMI 和FU 算法的特點,提出FU-PMI 算法。 3)分別使用SO-PMI 算法和FU-PMI 算法擴展的詞典進行情感傾向性分析,比較他們的效果。經實驗結果證明,相較于傳統的SO-PMI 算法,本文提出的算法可以有效地提高情感詞典的擴展效果。
基于情感詞典方法是將構建好的情感詞典作為判別工具,通過對原始語料的處理(分詞、去停用詞等)后得到的數據在情感詞典中遍歷,根據設定的規則給予不同詞語單獨的權重,最后計算出它們的得分,最后根據得分對它們進行分類?!?br>