熱孜瓦姑麗.吾斯曼 艾孜爾古麗.玉素甫

摘要:情感分析就是對輿論的現狀及其變化趨勢進行研究的技術。其次介紹了近幾年來的國內漢語,藏語和哈薩克語等部分語言的情感分析研究現狀進展,最后重點介紹了維吾爾語近幾年來的情感分析研究使用的方法和處理的算法。
關鍵詞:情感分析;算法;處理方法
中圖分類號:TP393
文獻標識碼:A
文章編號:1009-3044(2020)04-0178-02
1 概述
由于黨和政府非常重視少數民族與語言研究的同步發展。維吾爾語情感詞的獲取并創建情感詞典是識別文本情感傾向性和情感分析的基礎,給網絡輿情分析和網絡內容安全提供基礎性資源[1]。本文主要是對近幾年國內情感分析技術的發展和現狀總結的基礎上,對已有的維吾爾語情感分析技術研究成果進行整理總結。
2 國內情感分析技術進展
2.1 漢語情感分析技術進展
2014年,梁軍等人提出了基于深度學習的微博情感分析方法使用于遞歸神經網絡進行情感分類[2]。2015年李婷婷等人提出了基于SVM和CRF多特征組合的微博情感分析方法,通過多組實驗使情感分析效果更優。2017年劉臣等人利用特征與情感詞在位置上的鄰近關系,提取情感詞并組成特征一觀點對,通過點互信息方法進行情感傾向分析。2018年張璐等人提出基于情感計算的網絡社區輿情分析預警技術研究,結合文本的情感特征,應用自然語言處理技術實現文本的預處理,實驗結果表明此研究為網絡社區的輿情分析預警提供了有力的支持川。
2.2 藏語情感分析技術進展
2015年杜雪峰等分別提出了基于規則的藏文句子的情感傾向性分析方法和基于統計的藏文句子的情感傾向性分析方法,兩個方法的F值分別達到了68.9%和82.8%[3]。2018年,閏曉東等提出了本文提出的基于情感詞典的藏語文本句子情感分類方法在一定程度上可以對藏文句子進行情感分類。其中,中性類別的召回率達到95.76%[4]。
2..3哈薩克語情感分析技術進展;
2011年新疆大學的王曉莉古里拉.阿東別克等人提出一種機器識別哈薩克語句情感的模型,使用條件隨機場cRF's(collditional RaJldom Fields)對哈薩克語句中的情感關鍵詞進行機器識別,在此基礎上結合語句邏輯結構分析,能初步判斷出哈薩克語句的喜、怒、哀、俱情感傾向,拓寬了哈薩克語言計算機處理的范圍[5]。2015年新疆財經大學的孫瑞娜等人提出了情感詞匯自動獲取機制。實驗表明,哈薩克語情感詞匯自動獲取正確率達到74.2%,該方法是有效的。
3 在中國現代維吾爾語情感分析方法進展
3.1 現代維吾爾語情感分析方法進展
2012年黃俊等提出基于自動標注的維吾爾語情感詞分析句子情感的方法,最終得到句子的情感類型。李響等提出基于深度學習的維吾爾語文本情感分析方法,完成基于深層語義和句法信息的維吾爾語名詞短語指代消解任務。2017年吾守爾·斯拉木等結合維吾爾語文本的特點,建立維吾爾文情感語料標注規范,利用Python語言構建集數據采集與標注為一體的情感標注平臺,最后構建在輿情分析和輿情監控中可以應用的維吾爾文情感語料庫。實驗結果表明,提高情感語料庫的質量,情感語料庫可以用于輿情分析任務。2018年熱西旦木·吐爾洪太詞典與機器學習方法相結合的維吾爾語文本情感分析的方法,此方法的正確率比單獨使用機器學習方法提高了9.13%比詞典方法提高了1.82%。2019年帕麗且.木合塔爾等提出了維吾爾語情感語音合成采用韻律邊界預測方法,實驗結果證明,本文提出的方法情感分類F1值比SVM-bigram方法提升了9.32%[8]。表1所示在中國現代維吾爾語情感分析方法特征情況。
3.2 現代維吾爾語情感分析算法進展
年梅等提出了利用中文極性情感詞典HowNet,選擇并翻譯為維吾爾語詞匯,借助于維吾爾語同義近義詞詞典,最后設計了基于維吾爾語極性情感詞和權值相結合的加權句子情感極性判定算法,證明了本算法進行維吾爾語句子褒貶情感性分析基本是有效地。李冬白等提出基于深度學習的維吾爾語語句隱式情感分類算法,通過softmax分類器完成維吾爾語語句分類[6]。劉若蘭等提出候選情感詞識別算法,實驗結果表明,與擴展前的情感詞庫相比,使用互聯網文本語料擴展后的情感詞庫后進行維吾爾語句子傾向性測評的準確率和召回率均有明顯提高。李敏等提出采用深度學習算法進行基于深層語義的維吾爾語句子級情感分析任務,根據維吾爾語語言特性,考慮詞性、情感詞、轉折連詞,否定成分等對情感傾向性的影響,從詞匯和句式兩個抽象層次共提取了8項情感特征,利用棧式自編碼算法無監督的學習文本的深層語義特征[7]。
參考文獻:
[1]瑪爾哈巴·艾賽提,艾孜爾古麗,玉素甫.艾白都拉.基于語法
的維吾爾語情感詞匯自動獲取[J].中文信息學報,2017,31(1):126-132,139.,
[2]梁軍,柴玉梅,原慧斌,等.基于深度學習的微博情感分析[J].中文信息學報,2014,28(5):155-161.
[3]杜雪峰.藏文句子傾向性分析研究[D].北京:中央民族大學,2015.
[4]閆曉東,黃濤.基于情感詞典的藏語文本句子情感分類[J].中文信息學報,2018,32(2):75-80.
[5]王曉莉,古里拉.阿東別克.哈薩克語語句情感識別研究初探[J].計算機應用與軟件,2011,28(8):20-23.
[6]李冬白,田生偉,禹龍,等.深度學習的維吾爾語語句隱式情感分類[J].計算機工程與設計,2016,37(9):2577-2581.
[7]李敏.基于深度學習的維吾爾語文本情感分析[D].烏魯木齊:新疆大學,2017.
[8]帕麗旦.木合塔爾,買買提阿依甫,楊文忠,等.基于BiRNN的維吾爾語情感韻律短語注意力模型[J].電子科技大學學報,2019,48(1):88-95.
[通聯編輯:光文玲]