999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于兩層BiLSTM的問題回答技術研究

2020-06-04 12:55:32滕柯
數字技術與應用 2020年3期

滕柯

摘要:針對答案選擇任務,在基于注意力機制的雙向長短時記憶(BiLSTM)的基礎上,探索了兩層BiLSTM網絡的應用。我們在2016NLPCC DBQA任務數據集上進行實驗,此模型MRR可以達到75.51%。兩層網絡的效果優于單層網絡,證明了兩層網絡的有效性。

關鍵詞:答案選擇;注意力機制;多層網絡;雙向長短時記憶網絡

中圖分類號:TP311 文獻標識碼:A 文章編號:1007-9416(2020)03-0095-02

0 引言

互聯網時代的快速發展,每天都有大量的互聯網數據產生與傳遞。怎么高效且精準地從大量且雜亂無章的數據中查找到回答用戶所提出問題的信息成為如今研究的熱點。自動問答系統的便利之處在于根據用戶所提出的問題從大量數據中反饋最為匹配的答案。答案選擇任務是自動問答系統中的重要組成部分。近年來,深度學習技術發展迅速,其在自然語言處理領域的運用也十分廣泛。神經網絡的出現簡化了答案選擇任務初始階段的特征抽取環節,使得答案選擇任務不再需要人工抽取特征。循環神經網絡(RNN)是一種專門用來處理序列的神經網絡,因此其非常適合用于文本任務。不過因為可能會導致梯度消失和梯度爆炸等問題,研究人員對其結構進行改進提出了長短時記憶網絡(LSTM)[1]。同時,Melamud[2]發現高層的LSTM的輸出可以更好的表示單詞的含義,綜合多層的信息效果可能會很好。

面對中文答案選擇任務,此前很多研究都是基于單層BiLSTM網絡的答案選擇模型,使用單層BiLSTM提取到的都是表層的特征,為了能夠到提取更深層的特征,我們探索使用兩層神經網絡來進行特征提取。本文搭建了基于注意力機制的兩層雙向長短時記憶網絡的答案選擇模型,探索了兩層BiLSTM對于特征提取的優勢,并取得了較好的實驗效果。

1 模型構建

本模型一共分為三個模塊:向量化模塊、深度網絡模塊以及相似度評分模塊。模型結構圖如圖1所示。

向量化模塊:本任務的源數據都是文本形式,而深度網絡是處理不了文本的,在把源數據送入神經網絡之前,我們需要把問題和答案文本轉化為向量形式,且意思相近的詞需要被映射到向量空間相近的位置。在本模型中,我們所用的向量是用Word2Vec模型下的Skip-Gram模式訓練得到的,訓練語料使用的是中文維基百科。

深度網絡模塊:此模塊的輸入時向量化模塊的輸出也就是文本的向量表示。我們將文本向量送入深度網絡中,通過網絡提取深層語義信息,得到問題和答案的突出特征,獲得特征向量。在本模型中,深度網絡模塊指的是兩層雙向長短時記憶網絡的組合,具體結構如圖2所示。

特征向量的公式如下:

Oq=Oq1*0.8+Oq2*0.2

Oa=Oa1*0.8+Oa2*0.2

相似度評分模塊:本模塊的輸入是深度網絡模塊的輸出,我們將深度網絡輸出的特征向量Oq和Oa進行相似度匹配,衡量兩個文本之間的相似性。本論文采用的相似度度量算法是余弦相似度。公式如下:

score(q,a)=cosine(Oq,Oa)=

socre(q,a)是問題和答案的語義相似度評分,Oq和Oa代表的是問題和答案的特征向量。

在模型進行訓練的時候我們還需要選擇損失函數,在本模型中我們選擇鉸鏈損失函數來進行訓練優化,具體公式如下:

L=max(0,M-cosine(Oq,Oa+)+cosine(Oq,Oa-))

其中,Oq表示問題向量,Oa+表示正確答案的向量,Oa-表示錯誤答案的向量。M是一個是為了優化目標函數而設定的常數。

2 模型參數

經過實驗,損失函數中的常數M我們設為0.1。雙向長短時記憶網絡中的隱藏層單元數我們選擇的是300。詞向量的維度我們設為50,句子長度設為100。深度學習網絡的學習率決定著損失函數能否收斂到局部最小值以及何時收斂到最小值。當學習率過小時,模型收斂的非常慢。當學習率過大時,可能無法收斂。因此,一個合適的學習率可以使得模型可以在合適的時間內收斂到局部最小值。我們發現設置學習率設置為0.2實驗效果最好。

3 實驗

在2016 NLPCC DBQA數據集上,我們對改進的答案選擇模型進行了評估,選用評測指標MRR。單層BiLSTM模型ACC為75.12%,而使用我們改進的兩層BiLSTM模型效果可以達到75.51%,驗證了模型改進的可行性和有效性。

4 結語

我們在本文中探索了兩層biLSTM網絡在答案選擇任務中的應用。實驗采用公開數據集以及常用評價標準,加強了實驗的說服力。通過實驗效果對比,驗證了兩層網絡在特征提取時的有效性。

參考文獻

[1] Hochreiter S,Schmidhuber J.Long Short-Term Memory[J]. Neural Computation,1997,9(8):1735-1780.

[2] Melamud O,Goldberger J,Dagan I.context2vec:Learning generic context embedding with bidirectional lstm[C].Proceedings of The 20th SIGNLL Conference on Computational Natural Language Learning,2016:51-61.

Abstract:For the answer selection task, the application of multi-layer network is explored on the basis of BiLSTM. We conducted experiments on the 2016NLPCC DBQA task data set, and the MRR of this model can reach 75.51%. The effect of multi-layer network is better than that of single-layer network, which proves the effectiveness of multi-layer network.

Key words:answer slection; attention; two layer network; BiLSTM

主站蜘蛛池模板: 欧美丝袜高跟鞋一区二区| 四虎影视库国产精品一区| 午夜综合网| 国产高清又黄又嫩的免费视频网站| 亚洲无码A视频在线| 国产一区二区丝袜高跟鞋| 亚洲欧美自拍视频| 国产真实乱子伦视频播放| 色噜噜综合网| 免费国产一级 片内射老| 国产精品污视频| 欧美精品在线免费| 国产成人亚洲综合a∨婷婷| 国产精品无码AⅤ在线观看播放| 91福利免费| 国产自在线拍| 午夜日b视频| 成年片色大黄全免费网站久久| 成人午夜视频免费看欧美| 日韩国产综合精选| 噜噜噜综合亚洲| 亚洲无码91视频| 日韩一级二级三级| 国产屁屁影院| 国产精品三级专区| 日韩小视频在线观看| 五月天婷婷网亚洲综合在线| 日本免费精品| 亚洲熟女偷拍| 国产aaaaa一级毛片| 专干老肥熟女视频网站| 成人午夜天| a级高清毛片| 一级不卡毛片| 中文纯内无码H| 国产女人综合久久精品视| 五月婷婷欧美| 欧美精品二区| 久久久久久久97| 国产成人综合欧美精品久久 | 国产精品极品美女自在线| 一级毛片中文字幕| 亚洲国产91人成在线| 美女裸体18禁网站| 日本精品中文字幕在线不卡| 综合久久久久久久综合网| 性欧美久久| 免费jjzz在在线播放国产| 国产爽妇精品| 波多野结衣一二三| 六月婷婷精品视频在线观看| 国产白浆在线| 精品福利视频网| 亚洲区视频在线观看| 亚洲欧洲AV一区二区三区| 九九这里只有精品视频| 亚洲 欧美 日韩综合一区| 最新国产午夜精品视频成人| 国产又爽又黄无遮挡免费观看| 18禁色诱爆乳网站| 久久久久夜色精品波多野结衣| 91美女视频在线| 老司国产精品视频| 日本91视频| 五月天综合网亚洲综合天堂网| 在线观看国产黄色| 毛片在线播放a| 亚洲精品视频免费| 亚洲精品大秀视频| 四虎综合网| 国产成人精品一区二区免费看京| 在线视频亚洲欧美| 免费在线看黄网址| 欧洲av毛片| 在线国产你懂的| 九色免费视频| 在线免费亚洲无码视频| 国产偷国产偷在线高清| 久久夜色精品国产嚕嚕亚洲av| 亚洲男人的天堂在线| 美女被狂躁www在线观看| 中日韩欧亚无码视频|