999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于BiGRU 和注意力機制的多標簽文本分類模型

2020-03-05 06:06:34饒竹一張云翔
現(xiàn)代計算機 2020年1期
關鍵詞:分類機制文本

饒竹一,張云翔

(深圳供電局有限公司,深圳518001)

0 引言

情感識別是自然語言處理重要課題之一。在互聯(lián)網(wǎng)高度發(fā)達的今天,人們通過微博、新聞網(wǎng)站、論壇等線上發(fā)表言論。這些言論的發(fā)表,篇幅不定,詞匯量不限且沒有嚴格的語法規(guī)則,具有較強的主觀傾向。其中,負面言論是急需關注的重要課題,若無法正確對言論情感進行識別,就無法及時阻止網(wǎng)絡暴力的發(fā)生,防范危害到個人乃至企業(yè)信譽的行為。同時,正確的言論情感識別能夠幫助政府了解民眾意見,企業(yè)聆聽用戶聲音。在這樣的背景下,電網(wǎng)相關的網(wǎng)絡文本情感識別就具有很高的研究意義。

文本的情感識別主要基于兩種方法:情感極性詞典和傳統(tǒng)機器學習方法,其中包括對情感資源的構建、語句分割、特征信息提取、質(zhì)量分析等[1]。網(wǎng)絡時代的到來促進許多新詞匯的誕生,對基于情感極性詞典的情感分類模型有著很大的影響,現(xiàn)有的情感極性詞典有限,且模型無法有效識別新近產(chǎn)生的單詞或流行詞。Manek 和Shenoy 使用傳統(tǒng)的機器學習算法來分析評論的情感。他們主要從準確率以及F 值上比較樸素貝葉斯,ME 和SVM 的性能。結果表明,支持向量機具有最好的分類效果,隨著深度學習研究的發(fā)展,深度神經(jīng)網(wǎng)絡在自然語言處理中有著出色的表現(xiàn)[2]。Kim 使用卷積神經(jīng)網(wǎng)絡(CNN)解決情感識別問題,取得了良好的效果[3]。Santos 使用深度卷積神經(jīng)網(wǎng)絡來分析文本包含的情感,Irsoy 證明長短期記憶網(wǎng)絡(LSTM)作為一種遞歸神經(jīng)網(wǎng)絡模型,也是一種解決文本情感識別的有效方法[4]。Bahdanau 將最初應用于機器翻譯的注意力模型用于NLP 中[5]。Qu 和Wang 提出了一種基于分層注意網(wǎng)絡的情感分析模型,較傳統(tǒng)遞歸神經(jīng)網(wǎng)絡效果有著較大的改善[6]。田生偉等人將雙向LSTM 與注意力機制相結合,在維吾爾語時序事件上的識別取得了不錯的效果[7]。張玉環(huán)等人則將GRU 與LSTM 相結合,使得文本情感分類模型能在短時間內(nèi)達到較高的準確率[8]。成璐使用注意力機制和BiLSTM 構建的的神經(jīng)網(wǎng)絡模型,對用戶評論文本進行情感分析,使用Bi-LSTM 提取詞向量中的文本特征,再放入注意力機制層突出文本分類中的重點信息[9]。

針對上述問題,提出了一種基于BiGRU 和注意力機制的多標簽文本分類模型。BiGRU 模型是基于BiLSTM 模型的改進,將LSTM 模塊替換為GRU,在保證分類準確度的情況下大大提高了網(wǎng)絡的訓練速度。注意力機制的使用使得神經(jīng)網(wǎng)絡可以聚焦于對分類效果有提升的重要信息,相比LSTM 進一步提高了分類的準確度。除此之外,我們使用了預訓練的詞向量和遷移學習技術,進一步縮短了訓練時間并獲得了更好的詞向量表示,可以用于電網(wǎng)相關的網(wǎng)絡文本情感識別。

1 算法實現(xiàn)

1.1 雙向長短時記憶網(wǎng)絡

BiLSTM 是普通RNN 的一種延伸[10],RNN 與普通神經(jīng)網(wǎng)絡區(qū)別在于神經(jīng)元不僅接受當前時刻的輸入,同時也接受前一個神經(jīng)元的輸出,這就解決了文本中需要考慮前文信息的問題。實際應用中,僅僅考慮前文的信息是不夠的,前文也需要添加下文的信息,為了解決這一問題,雙向RNN(BiRNN)誕生了。BiRNN 在普通RNN 基礎上添加了反向運算,即將輸入的序列反轉后再計算一遍輸出,最后的結果是正向RNN 與反向RNN 結果的堆疊。理論上BiRNN 可以考慮到上下文的信息,但實際應用中發(fā)現(xiàn)BiRNN 很難處理具有長期依賴關系的信息,一個簡單的例子是在英文句子生成時,如果句子很長,在生成謂語動詞時,RNN 無法記住主語的單復數(shù)形式并選擇合適的謂語動詞。為了解決這一問題,LSTM 引入了門控機制,包括遺忘門(forget gate)、輸入門(input gate)和輸出門(output gate)。其中,遺忘門用于控制前一時刻輸入信息通過的比例,具體的計算方式如下:其中,y 表示輸出向量,xt∈Rd是t 時刻的d 維輸入向量,W 是權重矩陣,b 是偏置向量,hf∈Rd和hb∈Rd分布表示LSTM 前向和后向的輸出向量。

1.2 雙向門控循環(huán)神經(jīng)網(wǎng)絡

雙向門控循環(huán)神經(jīng)網(wǎng)絡(BiGRU)可以看做雙向長短時記憶網(wǎng)絡(BiLSTM)的一種拓展,將BiLSTM 中的LSTM 模塊替換為GRU[11]。GRU 將LSTM 中隱藏狀態(tài)和細胞狀態(tài)合并成一種狀態(tài),因此顯著縮短了訓練時間,在大型語料文本的訓練速度上有顯著的提升。更明確地說,GRU 讀取詞嵌入向量t_i 以及隱藏層狀態(tài)向量h_(i-1)后,經(jīng)過門控計算產(chǎn)生輸出向量c_i 和隱藏層狀態(tài)向量h_i,具體計算方法參考下列公式:

其中,z ∈Rd,r ∈Rd分別表示接受d 維向量的輸入門與重置門,{Wz,Wr,W,Vz,vr,V}表示權重矩陣,{bz,br,b}為偏置向量,⊙表示矩陣點乘。

1.3 注意力機制

注意力機制首先在計算機視覺中提出,它受到人類視覺處理過程的啟發(fā),即人腦時不會處理全部視覺信息,而是聚焦于特定的部分。這一機制已經(jīng)被廣泛應用于多種領域,包括圖像標題生成、文本分類、語音識別和機器翻譯[12]。

在神經(jīng)網(wǎng)絡中,注意力機制可以被視為一種資源分配方案,對重要的信息分配更多的注意力或者計算資源,這有利于解決信息超載問題。在實踐中,注意力機制通常可以分為兩種:一種是自上而下的聚焦式注意力,通常是有意識的并且是任務相關的,主動聚焦于某一對象。另一種是自下而上的無意識注意力,這類注意力和任務無關,主要由外界驅(qū)動,又稱為基于顯著性(Saliency-based)的注意力。例如,在卷積神經(jīng)網(wǎng)絡(CNN)和LATM 中,池化(Pooling)和門控機制可以被視為基于顯著性的注意力機制。

神經(jīng)網(wǎng)絡的輸入數(shù)據(jù)使用向量表示,我們用[x1,…,xN]表示任務相關的輸入向量,為了給特定的數(shù)據(jù)更多的權重,注意力機制引入了查詢向量q(Query Vector),通過打分函數(shù)計查詢向量和輸入向量直接的相關性,同時引入了一個注意力變量t ∈[1,N]代表選擇的索引位置。具體計算方式如下:

這里,αi是注意力分布,是注意力打分函數(shù)。注意力打分函數(shù)可以有多種定義方式,在本文中,我們采用基于縮放點積的自注意力模型,縮放點積定義如下:

d 表示輸入向量的維度。縮放點積模型是基于點積模型的一種改進,區(qū)別在于縮放點積模型除以向量維度d 的平方根。當d 很大時,點積模型的值會出現(xiàn)較大的方差,因此導致Softmax 的梯度變小,縮放點積模型的提出解決了這一問題。

2 實驗

2.1 數(shù)據(jù)集介紹

實驗采用著名數(shù)據(jù)競賽Kaggle 上的數(shù)據(jù)集測試模型,該數(shù)據(jù)集由維基百科上的評論構成,標簽均由人工標注,共定義了6 類標簽,分別是“toxic”、“severe_toxic”、“obscene”、“threat”、“insult”和“identity_hate”。每個評論可能有多個標簽,也可能沒有標簽,模型需要給出每個評論在6 類標簽上的概率,因此這是一個多標簽文本分類問題。所有類別在數(shù)據(jù)集上的分布如圖1所示。

圖1 評論種類以及數(shù)量

2.2 實驗設計

在實驗中我們的網(wǎng)絡架構設計如圖2。

圖2 網(wǎng)絡架構

其中,輸入層包含200 個神經(jīng)元,即每個評論取前200 個字符,不足200 的話則自動補全。Embedding層,attention 層和BiGRU 神經(jīng)元數(shù)目分別為100、128和256,輸出層為6 個神經(jīng)元組成的全連接層,計算每個評論在6 類標簽上的概率。我們使用Embedding 層作為一種遷移學習技術加載預訓練的詞向量,以此縮短訓練時間并獲得針對評論數(shù)據(jù)的更好表示。Attention 層用來訓練對特定的詞向量給予更高權重以提高分類的準確率,輸出層則將常見的Softmax 替換為全連接層,每個神經(jīng)元均輸出一個[0,1]范圍內(nèi)數(shù)值代表特定類別的分類準確度。

為了讓神經(jīng)網(wǎng)絡充分學習到文本的特征,我們采用了預訓練詞向量和自注意力機制。在實驗中,我們使用了GloVe 詞向量[13],基于共現(xiàn)矩陣分解實現(xiàn),每個詞使用100 維向量表示,向量之間的距離越短,表示兩個詞的相似度越高。該詞向量集合使用了60 億單字(Token)語料庫訓練,共包含400K 的字符,由斯坦福大學的研究團隊提供。自注意力模型引入了Q、K 和V三個查詢向量序列,采用縮放點積作為打分函數(shù),可以“動態(tài)”地生成不同連接的權重,可以用來處理變長的信息序列。我們將數(shù)據(jù)集分割為訓練集與驗證集,其中驗證集評論數(shù)目占20%,訓練集數(shù)目占80%。

實驗平臺的具體配置如下:

操作系統(tǒng):Windows 10

CPU:Intel i7-6700

RAM:32G

深度學習框架:TensorFlow 1.13.1

開發(fā)工具:Visual Studio Code

編程語言:Python 3.6

3 實驗結果與分析

3.1 實驗結果

Adam 是一種基于隨機梯度下降(SGD)的一階優(yōu)化算法,與SGD 不同在于SGD 在訓練過程中學習率不會改變,而Adam 通過計算梯度的一階和二階矩估計動態(tài)改變學習率,是一種自適應學習率優(yōu)化算法,同時結合了AdaGrad 和RMSProp 兩種算法的優(yōu)點。Adam優(yōu)化算法被用于訓練神經(jīng)網(wǎng)絡,實驗結果顯示Adam算法效果卓越,如圖3 所示,使用Adam 算法后在訓練集和測試集上的loss 均能夠降低到0.05 左右。

圖3 訓練集和測試集損失

在實驗中,我們設置batch 大小為128,通過4 個epoch 后算法已經(jīng)接近收斂并在測試集上獲得了超過98%的準確率,如圖4 所示。

3.2 實驗結果分析

綜合來說,采用了預訓練詞向量和BiGRU 后大大縮短了訓練神經(jīng)網(wǎng)絡所需時間,在本次實驗中并未采用GPU 加速計算,CPU 耗時在10min 左右。同時embedding 層和自注意力機制的使用提高了分類的準確度,相比基線模型BiLSTM 有2%的準確度的提升。Bi-GRU 與自注意力機制的融合在標桿數(shù)據(jù)集上的測試結果顯示我們的模型適合執(zhí)行多標簽文本分類任務,可以在電網(wǎng)文本信息中進行應用與部署。

4 結語

本文給出了一種基于BiGRU 和注意力機制的多標簽文本分類模型。相較于BiLSTM 模型,在使用更少的訓練時間下取得了同樣高的準確率;通過使用注意力機制讓神經(jīng)網(wǎng)絡可以聚焦于對分類效果有提升的重要信息;除此之外,預訓練的詞向量和遷移學習技術,進一步縮短了訓練時間并獲得了更好的詞向量表示。實驗結果顯示模型在公開數(shù)據(jù)集上有著良好的表現(xiàn),同時適用于包括電網(wǎng)相關的網(wǎng)絡文本情感識別等應用場景。

猜你喜歡
分類機制文本
分類算一算
在808DA上文本顯示的改善
分類討論求坐標
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
自制力是一種很好的篩選機制
文苑(2018年21期)2018-11-09 01:23:06
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
破除舊機制要分步推進
注重機制的相互配合
主站蜘蛛池模板: 精品无码国产自产野外拍在线| 伊人中文网| 99视频在线免费| 欧美国产综合色视频| 亚洲免费毛片| 国产午夜福利亚洲第一| 美女一区二区在线观看| 国产91视频免费观看| 国产免费精彩视频| 一级香蕉视频在线观看| 精品三级网站| 午夜不卡福利| 国产精品毛片一区视频播| 亚洲aaa视频| 国产精品私拍99pans大尺度| 国产女主播一区| 亚洲欧洲美色一区二区三区| 国产成人永久免费视频| 婷婷五月在线| 欧洲熟妇精品视频| 国产青榴视频| 久久精品午夜视频| 99在线国产| 日本尹人综合香蕉在线观看| 亚洲精品爱草草视频在线| 亚洲精品第一页不卡| 久久精品丝袜| 欧美特黄一级大黄录像| 日本一区高清| 亚洲AV无码乱码在线观看代蜜桃 | 精品在线免费播放| 伊人久热这里只有精品视频99| 人妻中文久热无码丝袜| 精品一區二區久久久久久久網站| 亚洲国产成人麻豆精品| 一本无码在线观看| 国产美女主播一级成人毛片| 亚洲动漫h| 国产亚洲男人的天堂在线观看 | 色综合久久88| 亚洲三级成人| 动漫精品中文字幕无码| 在线观看国产一区二区三区99| 99资源在线| 亚洲国产日韩欧美在线| 亚洲综合狠狠| 曰AV在线无码| 波多野结衣视频网站| 日本三级黄在线观看| 精品福利一区二区免费视频| 国产在线91在线电影| а∨天堂一区中文字幕| 无码国产偷倩在线播放老年人| 欧美另类视频一区二区三区| a毛片在线播放| 成人免费黄色小视频| 青青青视频91在线 | 亚洲成人免费看| 黄色a一级视频| 欧美精品亚洲二区| 中国国产A一级毛片| 最新国产精品鲁鲁免费视频| 亚洲AⅤ综合在线欧美一区| 亚洲一区色| 一本大道东京热无码av | 亚洲成a人片在线观看88| 国内99精品激情视频精品| 精品人妻无码中字系列| 国产无码精品在线播放| 国产尹人香蕉综合在线电影 | 中文字幕资源站| 亚洲第一网站男人都懂| 91在线视频福利| 少妇精品久久久一区二区三区| a级毛片网| www.精品国产| 成人毛片在线播放| 2020国产精品视频| 久久精品无码专区免费| 啦啦啦网站在线观看a毛片| 国产无遮挡猛进猛出免费软件| 999国内精品久久免费视频|