翟東海 ,侯佳林 ,劉月
(西南交通大學信息科學與技術學院,四川 成都 611756)
文本情感分析是利用計算機技術對“人們關于產品、服務、事件等實體的評論”等文本進行分析處理以獲得其表達的主觀情感信息的過程.其主要包括:情感信息分類、情感信息抽取、情感分析技術應用等[1-3].傳統的情感分析方法包括支持向量機、條件隨機場、信息熵等,且均采用詞袋模型.如文獻[4]采用SVM (support vector machine)對句子進行情感識別及分類.但這種淺層模型在處理海量數據時通常存在著數據稀疏性以及數據維度高等問題.Geoffrey Hinton 等[5-6]于2006年提出的深度學習模型為解決這些問題提供了新思路.當前,在文本情感分析任務上應用較多的神經網絡模型有卷積神經網絡(CNN)、基于序列的模型(RNN)和樹型結構模型(RAE)等.如文獻[7]采用CNN 進行情感極性分類;文獻[8]采用雙向序列模型(BLSTM)進行中文文本分類研究.因樹形結構模型(如深度學習中的遞歸自編碼算法)在文本特征提取、情感分析中表現優異,受到了學者們的廣泛關注,如文獻[9-11]都是遞歸自編碼算法的典型應用范例.
神經網絡模型雖然能夠極大程度地學習到文本內容所隱含的語義信息,顯著提高分類的準確率,但深度神經網絡在訓練時耗時、收斂慢的問題也逐漸受到了研究者們的關注.文獻[12]通過開發新的計算框架DistBelief 來實現大規模神經網絡的訓練;文獻[13]中使用GPU 來訓練深度玻爾茲曼機,但GPU因受內存所限,數據量大時效果也不太理想.
隨著并行計……