999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于度量學習的意圖識別和槽填充方法

2021-12-01 05:26:52衣景龍趙鐵軍
智能計算機與應用 2021年8期
關鍵詞:方法模型

衣景龍,趙鐵軍

(1 哈爾濱工業大學 計算機科學與技術學院,哈爾濱 150001;2 哈爾濱工業大學 機器智能與翻譯實驗室,哈爾濱 150001)

0 引言

近年來,深度學習方法被廣泛應用于計算機視覺以及人機對話等人工智能的多個領域[1],并極大地推動了這些領域的發展。但目前的深度學習方法都需要大量的標注訓練數據,而在工業界應用的過程中,很難獲得大規模標注好的數據。以任務型對話系統為例,在系統研發時很難獲得大量的用戶對話語料,若獲取了大量的對話數據,也面臨著人工標注成本高昂的窘境。同時,像任務型對話系統等類似的線上應用如百度的小度[2],用戶的需求往往變化比較頻繁,會導致數據標注和模型訓練反復進行。因此,小樣本場景下對自然語言理解技術的研究,成為本課題的重中之重。在目前的人機對話系統研究中,意圖識別和槽填充任務的效果往往是影響人機對話系統性能的關鍵。小樣本場景下的意圖識別和槽填充任務面臨著許多挑戰:由于樣本量不足,模型往往難以學到足夠的語言知識;現有的基于原型向量的小樣本下的分類方法,往往會損失信息。另外,還涉及到意圖識別和槽識別任務如何結合等問題。

目前,小樣本場景中的自然語言理解方法已經取得了不錯的進展,文獻[3]中提出了基于原型向量計算的非參學習的閾值調整方法用于小樣本下的多意圖分類,取得了較好的實驗效果。阿里巴巴團隊提出基于BERT 的預訓練聯合識別模型[4],用BERT 動態表征詞的多義性,解決一詞多義的問題,在ATIS 數據集上意圖識別的準確率達到了97.5%,槽填充的F1 值達到了96.1%的結果。本文提出了加入預訓練語言模型Fine-tune 方法和膠囊網絡動態計算原型向量的方法,有效改善了小樣本場景下的自然語言理解效果。

1 Fine-tune 方法

以BERT 為代表的預訓練模型[5]是在海量數據上訓練得到的,雖然含有大量的先驗語言知識,可以在小樣本場景下提高小樣本學習的性能,但當應用于不同的數據集時,往往需要微調,來使表征向量更為貼合新數據集的語義。

由于BERT 的預訓練過程與本文的模型訓練過程不一致,BERT 中CLS向量雖然被視為句子的表示向量,但其在訓練過程中,卻是用來對句子對之前是否是順序關系做判斷,這與本文在訓練過程中對句子進行分類過程并不一致。當面臨多任務時,預訓練過程與訓練過程不一致導致的誤差會被放大。對此,本研究對模型進行了微調,在BERT 后,鏈接兩個全連接輸出層,一個接在CLS向量之后,用以進行意圖分類,一個接在token向量之后用以進行槽填充。具體實現過程如下:

(1)在海量數據集(wiki)上訓練出BERT 模型(也可直接調用已經訓練好的)。

(2)在改進的BERT 后加一個全連接層,其參數隨機初始化生成,直接調用CLS向量和各個詞向量進行意圖和槽的分類,進行Fine tune。

(3)丟棄第二步中的全連接層,將現在的BERT作為新的模型的編碼器,后面接入小樣本的意圖識別和槽填充模型。

整體模型框架如圖1 所示。

圖1 預訓練過程圖Fig.1 Pre-training process

在本文中,源模型采用哈爾濱工業大學社會信息與檢索團隊預訓練的中文語言模型,將該模型進行改進,在其后直接加一個全連接層進行分類,依次來彌合小樣本數據與源預訓練數據的分布誤差后,舍棄掉全連接層,在其后加入小樣本訓練模型,用于原型向量的計算和匹配分類。因為在Fine tune 方法中可能會存在“災難性遺忘”問題,因此在訓練時可以固定BERT 編碼器的參數,只訓練小樣本模型。當選擇Fine tune 編碼器時,還采用了學習率預熱方法warm up,即在訓練開始時使用一個較小的學習率,訓練了一定的epoch 或者step 之后,再修改為原來設置的學習率來進行學習。這是因為最開始的時候,若學習率較大,模型可能不穩定,通過warm up的方式,可以在一定程度上避免模型震蕩。

2 基于度量學習方法的意圖識別和槽填充

通過BERT 編碼器,提取出句子和字的表示向量,在Support Set 中將不同的意圖標簽和槽標簽所對應的向量通過取平均等方式作為原型向量ci,同時利用BERT 編碼器獲取Ouery Set 中語句和字的表示向量與原型向量計算相似度,通過最近鄰的思想來確定每個語句的意圖標簽和每個字的槽標簽。

最初求原型向量的做法是對每個意圖或槽所對應的向量直接取平均[6],但在每個句子中可能存在一些與意圖無關的干擾信息,如果直接加和或者取平均的方式很容易導致這些與意圖或者槽無關的干擾信息累加,影響最終的效果。因此,本課題采用了膠囊網絡的方式,去除從樣本表示計算類別過程中的無關信息[7]。其模型架構如圖2 所示。

圖2 模型架構圖Fig.2 Model architecture diagram

將支撐集的樣本通過BERT 編碼表示為向量之后,將這些表示向量視為輸入的膠囊,輸出的膠囊視為類別的語義特征表示,從輸入膠囊到輸出膠囊的過程中采取動態路由算法。

首先是對所有的句子(字)表示向量接一個前饋神經網絡,這等同于做了一次矩陣轉化,其意義在于從樣本表示的語義空間轉換到類比表示的語義空間。

式中,eij表示類別i中第j個樣本的句子(詞)向量表示,是轉換后的表示。然后采用動態路由算法來過濾無關信息,提取類別的表示特征。在每次路由迭代的過程中,將其權重因子輸入到softmax函數,確保其加和為1。

其中,bi為連接系數,初始化為0,等同于在最開始的時候采用平均化的操作。每一類的類別向量,是其轉后候選類向量的加權之和。

為了保證每個類的向量模長不超過1,使用一個非線性的squash函數來對其進行處理。

每次迭代結束后,通過路由協議來調整不同膠囊之間的連接權重。如果產生類別表示的向量ci與該樣本的候選向量在向量空間中較為相近,則增大該連接權重,否則減小該連接權重。

在本文模型中,經過實驗,迭代次數設置為3次。

3 實驗

3.1 實驗數據

本文的實驗數據為小樣本數據集,數據來源主要有兩個途徑:一是SMP2020 中文人機對話技術評測(ECDT)TASK1;此外,少部分數據來源于SNIP 等公開數據集上進行翻譯,設計腳本,抽取出小樣本所需要的樣本組織形式。數據規模為:

(1)訓練集:查詢城市、APP 問答、詢問價格、翻譯、查詢天氣、航班預訂等在內的45 個領域。

(2)開發集:單詞查詢、垃圾分類、笑話、假期、溫度查詢5 個領域。

(3)測試集:時間規劃、講故事、虛擬查詢、星座問答、戲劇問答等在內的9 個領域。共計:6 694 個句子,143 個意圖及205 個槽位。

格式如下:

其中,text 是要查詢的文本;domain 是領域;intent 是文本意圖;slots 是文本中存在的詞槽。本課題抽取了3-shot 和5-shot 的數據集進行研究。

3.2 實驗結果

對于小樣本意圖分類任務,采用準確率(Accuracy)作為評價指標。對于小樣本語義槽填充任務,采用F1- score作為評價指標,當預測槽位的一個槽和其值組合與標準答案的一個槽和槽值組合完全一致,視為一個正確預測。用句子準確率作為二者聯合訓練的評價指標。只要當該句子的意圖識別和槽填充全部正確時,該樣本才算一個正確樣本。

實驗結果見表1~表3。

表1 在3-shot 數據集上聯合學習實驗結果Tab.1 Joint learning experiment results on 3-shot dataset

表2 意圖識別實驗結果Tab.2 Intent detection experimental results

表3 槽填充實驗結果Tab.3 Slot filling experimental results

由表1 可知,當意圖識別和槽填充任務聯合訓練時,Fine-tune 的方法對槽識別任務效果提升明顯。而膠囊網絡的引入,雖然提高了意圖識別的效果,但也造成了槽填充任務的效果下降。針對此,本文單獨以膠囊網絡對槽填充和意圖識別的影響做了消融實驗。

由表2 和表3 可以看出,膠囊網絡對意圖識別實驗有明顯的提升作用,但是在槽填充任務上并沒有獲得提升效果。其原因可能是對于細粒度的詞級分類而言,并沒有太多的無關信息,而膠囊網絡的引入反而使最終的原型向量與對應的類別中特征平緩的單詞更為相像,反而引入了誤差和偏置;而對意圖識別任務而言,其粒度是句子級,可能由于表述習慣不同,或者無關單詞較多等原因,含有較多的與意圖類別無關的干擾信息,此時引入膠囊網絡,可以起到一個很好的消除干擾信息的作用。

4 結束語

本文對人機對話中的小樣本學習場景下的意圖識別和槽填充展開了研究,采用了基于度量學習(Metric based)的方法[8]。度量學習方法通過計算query set 中的樣本與support set 中樣本的距離,尋找距離最近的類別樣本作為分類標簽,同時將兩個任務聯合進行訓練,用以提升模型的效果。從實驗結果中可以得出,本文的Fine-tune 方法對意圖識別和槽填充任務都有一定的幫助和提升,膠囊網絡在意圖識別中也起到了不錯的效果,可以幫助去除一部分無關信息,但對槽填充任務的幫助不明顯。因此下一步可以繼續研究在詞級別的原型向量計算上是否有更好的改進方法,能更準確的表征槽的類別向量,同時在Metric based 的小樣本學習方法中可以看出,主要的改進方向有兩個:一是對樣本語義表征向量的計算;二是對原型向量的計算,這對以后的研究也是一個好的啟發。

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
學習方法
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 午夜丁香婷婷| 国产91透明丝袜美腿在线| 亚洲欧洲自拍拍偷午夜色| 久久精品中文无码资源站| 亚洲国产看片基地久久1024| 国产精品高清国产三级囯产AV| 欧美精品啪啪一区二区三区| 真实国产乱子伦高清| 71pao成人国产永久免费视频| 国产av色站网站| 色欲国产一区二区日韩欧美| 欧美性久久久久| 九九热精品视频在线| 99热这里只有免费国产精品| 国产精品思思热在线| 亚洲专区一区二区在线观看| 91福利一区二区三区| 国内精品久久久久久久久久影视| 伊伊人成亚洲综合人网7777| 香蕉国产精品视频| 91福利国产成人精品导航| 国产乱人乱偷精品视频a人人澡| 99国产在线视频| 亚洲a级在线观看| 亚洲无线观看| 国产白浆一区二区三区视频在线| 热这里只有精品国产热门精品| 成人福利在线免费观看| 国产精品私拍99pans大尺度| 欧美午夜网| 亚洲美女一级毛片| 波多野结衣在线se| 一本久道久综合久久鬼色| 国产亚洲欧美在线视频| 亚洲欧洲自拍拍偷午夜色无码| 91精品专区国产盗摄| 毛片免费网址| 毛片在线看网站| 国产精品女在线观看| 色婷婷国产精品视频| 日本一本在线视频| 国产黄在线免费观看| 狠狠干综合| 青青草原国产免费av观看| 亚洲欧美一区二区三区图片| 欧美性精品不卡在线观看| 一级在线毛片| 国产男女XX00免费观看| 日本精品一在线观看视频| 亚洲国产清纯| 伊人91在线| 久久综合九色综合97婷婷| h视频在线播放| 女人爽到高潮免费视频大全| jizz国产视频| 欧美精品一区在线看| 国产麻豆福利av在线播放| 免费A∨中文乱码专区| 性喷潮久久久久久久久| 一本一本大道香蕉久在线播放| 国产美女无遮挡免费视频网站| 久久精品欧美一区二区| 亚洲成人黄色网址| 亚洲永久免费网站| 99久久免费精品特色大片| 欧美日韩国产在线人成app| 欧美午夜久久| 欧美天天干| 久久香蕉国产线看观看亚洲片| 91在线日韩在线播放| 激情综合图区| 国产特一级毛片| 福利视频一区| 在线亚洲精品福利网址导航| 日韩亚洲综合在线| 国产视频欧美| 精品国产香蕉在线播出| 白丝美女办公室高潮喷水视频| 欧美中日韩在线| 国产一级在线播放| 国产呦视频免费视频在线观看| 中文字幕亚洲综久久2021|