999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于雙重深度遷移學習的機械領域命名實體識別

2022-10-10 09:25:40臧凌玉張應中羅曉芳
計算機應用與軟件 2022年9期
關鍵詞:深度模型

臧凌玉 張應中 羅曉芳

(大連理工大學機械工程學院 遼寧 大連 116024)

0 引 言

在機械工程領域存在大量的非結構化或半結構化的知識文本,如專利、說明書、期刊和書籍等,這些文本包含豐富的領域專家知識和專業技術知識。自然語言處理能夠通過理解和挖掘文本知識從而獲取專業知識。命名實體識別是指識別文本中具有特定含義的實體(例如人名、地名、機構名和專有名詞等),是自然語言處理基礎性工作,是正確理解文本的基礎[1]。它是信息抽取、文本分類、關系抽取、知識圖譜、搜索引擎、機器翻譯和自動問答等應用領域的基礎性工作[2-7]。

機械工程領域包括機械設計、制造和工程材料等多個學科,涉及大量的概念、術語和專有名詞,這些名詞以自然語言方式表示在文本中。特別是機械專利文本,其包含了新的技術和原理,體現了領域的最新信息。對機械專利文本進行命名實體識別,及時發現最新的技術和應用,將有利于確定技術發展趨勢。例如,劉宇飛等[8]應用命名實體識別技術識別數控系統新興技術,陳秋瑗等[9]利用其實現機械設計領域新詞發現等。

目前,命名實體識別常用的方法有基于規則和詞典的方法、基于傳統統計機器學習的方法和基于深度學習的方法等[10-13]。其中,由于深度學習能夠從原始數據中自動獲取特征,提升數據的處理能力和識別的準確性,因而被廣泛應用于命名實體識別中[14-18]。由于深度學習方法需要大量的樣本數據,基于深度學習的命名實體識別研究主要集中于具有成熟數據集的通用領域和生物醫學等幾個特定領域,而機械工程領域涉及范圍寬,且目前沒有成熟的標注數據集,因此極大地限制了命名實體識別方法在機械工程領域中的應用。

遷移學習能夠利用已獲取的源域知識改善目標任務,所以將遷移學習引入命名實體識別中,可以有效地解決模型由于數據集少而導致的識別能力不足的問題[19]。Devlin等[20]提出了基于遷移學習的BERT(Bidirectional Encoder Representations from Transformers)模型,刷新了包括命名實體識別在內的11種NLP測試成績。楊飄等[21]將BERT作為預訓練語言模型,并將其與BiLSTM-CRF模型相結合解決中文命名實體識別問題,結果表明在命名實體識別任務中,結合后的模型性能有較大提升。由此可知,BERT遷移學習模型作為預訓練語言模型遷移,能夠提高模型識別的準確性。

本文針對機械工程領域命名實體識別中成熟標注數據集少的問題,以及更好地提高識別精度,提出一種基于雙重深度遷移學習的中文命名實體識別方法。該方法應用BERT模型對文本語義進行遷移的基礎上,進一步利用模型遷移的方法對命名實體識別模型的預訓練參數實施整體遷移,建立了雙重深度遷移學習模型—DT-BLC模型,從而更好地實現命名實體識別具體任務知識的遷移,提升了機械工程領域命名實體識別的準確性,有效地解決了深度學習在機械工程領域中由于數據量少而導致的學習能力不足的問題。然后以齒輪專利為例,運用雙重遷移學習模型分別對每一年的齒輪發明專利文獻進行命名實體,運用統計學的方法分析齒輪的研究重點和最新發展趨勢。

1 雙重遷移學習模型

雙重遷移學習模型框架如圖1所示,由兩部分組成:基于BERT的單重深度遷移學習和基于整體模型的遷移學習。先將源域數據集輸入到BERT+BiLSTM-CRF模型中獲得預訓練參數,之后將預訓練參數輸入到訓練模型中,并對訓練模型進行參數凍結建立凍結的訓練模型,接下來將目標域數據集輸入到凍結的訓練模型進行訓練,訓練好的模型便成為命名實體識別器,最后輸入目標域測試數據集就能獲得識別結果。

圖1 雙重遷移學習模型框架

1.1 基于BERT的第一次遷移學習

基于BERT的遷移學習由BERT預訓練語言模型、BiLSTM-CRF模型組成。在模型中利用BERT預訓練的模型參數進行模型遷移,將維基百科語料的語義關系遷移到機械工程領域,實現了模型的第一次遷移學習。

BERT的一個重要的應用就是作為預訓練語言模型,與其他語言表示模型相比,BERT預訓練模型可以將經過大規模語料所學習的網絡結構為目標學習任務提供豐富的先驗知識,并將語義知識遷移到具體的模型訓練當中,進而能夠提高模型的泛化能力和魯棒性,同時可以減少大量的人工標注工作,尤其適用于處理數據量比較少的自然語言任務。

條件隨機場(CRF)是一種概率無向圖模型,它通過計算某個序列中的聯合優化概率,進而優化整個序列的標簽序列。CRF概率計算式為:

(1)

在這一部分中,模型先將輸入文本通過BERT預訓練語言模型獲得語義表示,得到句子中的每個字的向量表示后,再將字向量輸入到BiLSTM中進行序列特征的自動提取,最后通過CRF層輸出概率最大的標簽序列。

1.2 基于整體模型的第二次遷移學習

基于整體模型的遷移學習是建立在模型遷移方法的基礎上,并在目標數據進行訓練時對深度學習神經網絡的幾層權重因子進行了凍結,實現了模型的第二次遷移學習。

模型遷移方法建立在成熟的深度學習神經網絡模型的基礎上,首先利用大量高質量的源數據對神經網絡模型進行相關訓練,并通過調參后得到可靠的模型。然后用此模型對目標數據集進行訓練,訓練時可以選擇遷移部分或全部參數。最后通過深度學習神經網絡結構的自適應性對模型進行微調。由于模型的可靠性已經得到了檢驗,提前得到了底層的模型結構和參數,為目標領域的訓練提供了很好的初始化,節省了目標領域的訓練時間,降低了調參難度,同時也提升了目標領域的建模效果。

在模型中,假設所有權重因子為vars,則權重因子可以分為兩部分:

vars=vars0+v

(2)

式中:vars0代表源域和目標域共享部分;v代表對目標域的特定處理。在模型訓練時,將所有需要更新計算的權重因子v相應名稱加入庫中,vars0從預訓練模塊中繼承參數,實現參數共享。更新時,僅訓練更新庫中的權重因子v,沒有加入庫中的權重因子vars0在訓練過程中只進行調用,不進行更新,將vars0權重因子進行凍結。將模型的部分權重因子進行凍結能夠充分利用預訓練模型的先驗知識,且模型的訓練更新參數減少將大大縮短模型每一步的訓練時間。

在這一部分中,模型首先將源數據(MSRA數據集)輸入到預訓練模塊中進行預訓練,在預訓練過程中不斷用Adam優化器對參數進行優化,直至達到Pre_epoch參數值;接下來將預訓練模塊計算出的全部參數(即預訓練參數)輸入到訓練模塊中,對訓練模塊的參數進行初始化;然后對訓練模塊的權重因子vars0進行凍結,建立凍結的訓練模塊,之后將目標訓練數據(機械工程領域數據集)輸入到凍結的訓練模塊中進行訓練;最終得到機械工程領域的命名實體識別器。將需要進行命名實體識別的目標域測試數據輸入到命名實體識別器中,即可得到命名實體識別結果。

2 識別實驗

2.1 實驗數據集

由于機械工程領域沒有成熟的標注數據集,目標域數據集采用手工標注的機械工程領域相關文本,數據集采用BIO標注,類別分別為材料、熱處理和零件名稱。目標域訓練集有938個標記語句,目標域測試集有163個句子。

源數據集(即預訓練數據集)為微軟亞洲研究院的MSRA部分數據集,數據集采用BIO標注,實體類別分別為:人名、地名和組織機構名。源數據集有19 717個標記語句。

2.2 評價指標

在測試時,只有當識別的實體邊界和實體的類型完全準確時,實體才算識別正確。命名實體識別的常用的評估指標有精確率(P)、召回率(R)和F1值。因此本文用這三個指標來判斷命名實體識別系統的識別效果,指標的計算方法為:

(3)

式中:TP表示模型識別正確的個數;FP表示模型識別錯誤的實體個數;FN表示文本中實體未識別到的個數。

2.3 模型比較

實驗首先對雙重深度遷移學習模型DT-BLC與常用模型BERT+BI-LSTM-CRF在相同參數條件下的F1值、運算速度進行比較,研究雙重遷移學習對模型的改進效果,然后改變模型DT-BLC中對源域的預訓練epoch(Per_epoch)參數,探究Per_epoch參數對雙重深度遷移學習模型的影響。

模型BERT+BiLSTM-CRF和模型DT-BLC進行比較,參數設置如表1所示。

表1 模型的比較參數

對于模型DT-BLC,Pre_epoch參數分別設置為0.1、0.15、0.2、0.25、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、1.1、1.2、1.3、1.4、1.5。

最后為了驗證實驗的有效性,將模型與BiLSTM-CRF模型和Lattice-LSTM-CRF模型的識別結果進行比較。

3 實驗與結果分析

3.1 雙重遷移學習模型識別效果

命名實體識別系統常用的評估指標有精確率、召回率和F1值,NER是復雜的任務單靠一個指標很難做評判,因此采用綜合指標F1對識別效果做判斷。

DT-BLC模型和BERT+BiLSTM-CRF模型的F1值隨迭代epoch的變化如圖2所示。可以看出,在訓練過程中,與BERT+BiLSTM-CRF模型相比,應用了雙重遷移學習方法的DT-BLC模型的F1值更高,且DT-BLC模型在訓練到17個epoch時,其訓練F1已達到90%,BERT+BiLSTM-CRF模型在訓練到40個epoch才達到90%,能夠在更短的時間達到比較高的F1值。所以基于整體模型的遷移學習能達到提升模型的識別效果和縮短訓練時間的效果。

圖2 DT-BLC模型和BERT+BiLSTM-CRF模型的F1值隨迭代epoch的變化

3.2 雙重深度遷移學習模型訓練速度分析

雙重深度遷移學習模型DT-BLC在訓練目標數據時,對一部分深度學習神經網絡權值因子進行了凍結,使模型訓練過程中更新的參數更少。對DT-BLC模型和BERT+BiLSTM-CRF模型訓練時間進行對比,實驗結果如圖3所示。

(a) DT-BLC模型和BERT+BiLSTM-CRF模型運行時間隨迭代epoch的變化

(b) DT-BLC模型和BERT+BiLSTM-CRF模型訓練速度隨迭代epoch的變化圖3 模型的訓練速度分析

可以看出,與模型BERT+BiLSTM-CRF相比,運算相同迭代epoch時,模型DT-BLC所需時間明顯減少,運算速度加快。表明雙重遷移學習模型在模型遷移的基礎上對訓練模型的部分權重因子進行的凍結,能夠在保證識別效果的同時,使每次的epoch所需要的時間更短,大大縮短了訓練時間,提升了模型訓練效率。

3.3 預處理對遷移學習模型的影響

Pre_epoch參數指的是在基于整體模型的遷移學習中,預訓練模型對源數據集訓練的epoch,Pre_epoch的值越大代表對源數據集訓練的迭代步數和訓練時間越久。通過DT-BLC模型的精確率、召回率和F1隨Pre_epoch參數的變化來研究基于整體模型的遷移學習對DT-BLC模型識別效果的影響,如圖4所示。

圖4 DT-BLC模型的精確率、召回率、F1值隨Pre_epoch的變化

可以看出,當Pre_epoch為0.1(即Pre_epoch非常小)時,基于整體模型的遷移學習對模型起到抑制的作用,DT-BLC模型的精確率、召回率、F1值均為0;隨著Pre_epoch的增加,DT-BLC模型的精確率、召回率、F1值迅速增加,當Pre_epoch為0.3時,DT-BLC模型的識別效果達到一個比較大的值;而后隨著Pre_epoch的增加,DT-BLC模型精確率、召回率、F1值在一個較小的范圍內波動。由此可知,Pre_epoch參數在值比較小時,其值變化對DT-BLC模型的識別影響比較大,在Pre_epoch參數值超過0.15后,其值的增加對模型識別影響較小,且很小的Pre_epoch參數就能對模型產生遷移優化的效果。

3.4 不同的模型識別效果對比

與BiLSTM-CRF模型和Lattice-LSTM-CRF模型識別效果的比較結果如表2所示。

表2 不同模型識別效果比較(%)

將DT-BLC模型與BiLSTM-CRF模型、Lattice-LSTM-CRF模型和BERT+BiLSTM-CRF模型進行對比,發現DT-BLC模型的精確率、召回率和F1值均高于其他三個模型,且基于雙重深度遷移學習的DT-BLC模型,與BERT+BiLSTM-CRF模型相比,精確率高出5.01百分點,召回率高出4.84百分點,F1值高出4.93百分點。由此證明基于雙重深度遷移學習的DT-BLC模型能夠通過兩次遷移的方法,利用通用領域命名實體識別任務的參數提供先驗知識,進而提升機械工程領域的命名實體識別效果。

4 DT-BLC模型應用于齒輪專利分析

齒輪是機械領域重要的基礎性零件,其每年都有大量的專利申請受理,其對加工技術和加工機床的要求也不斷提高。因此,本文以分析齒輪專利文獻為例,分別獲取2010年至2018年的齒輪相關發明專利數據的摘要,組建面向機械領域的齒輪專利實驗數據文本(數據文本中有權發明專利摘要共計28 707條),然后運用DT-BLC模型對專利文本進行實體識別,通過識別結果對齒輪專利開展如下兩個方面的分析。

4.1 齒輪實體類別比例分析

運用DT-BLC模型分別對每一年的齒輪發明專利文獻進行命名實體識別,然后分別針對識別到的齒輪材料、加工工藝和零部件三類實體類別,統計其在每年齒輪發明專利中所占的比例,以分析齒輪技術類別的發展趨勢。

齒輪發明專利各個實體類別比例隨著年份的變化趨勢如圖5所示。可以看出,每年齒輪發明專利文獻識別到的三個技術類別實體在實體總數中的比例基本不變,且零部件實體遠遠高于材料實體和加工工藝實體,其所占比例大約在97.5%。這是因為在實體識別的過程中,將機械產品、裝置名稱、零件和部件名稱均歸類為零部件類別,且齒輪是零件,專利研究多集中于將其與其他零件相結合組成部件或機械產品中。

圖5 實體比率隨年份變化

由此可得,齒輪的發明專利集中于將零件運用到機械產品,對其新材料在齒輪中的應用以及新的加工方法在齒輪中的應用相對較少,不過近年來材料實體的比例有所提升。

4.2 齒輪材料實體類別發展分析

隨著新材料的不斷發現,齒輪制造過程中越來越注重材料的選擇,使其具有更長的工作壽命和能夠應用于更復雜的工況條件。因此,本文運用統計學方法對DT-BLC模型識別到的齒輪材料實體進行數據挖掘,分析齒輪材料應用的研究方向和發展趨勢。

如圖6所示,對齒輪專利文獻進行命名實體識別后,識別到的材料實體最多是金屬和塑料,然后是齒輪油。由此說明在齒輪材料的研究中還是以金屬為主,而塑料也是研究重點,而齒輪油作為齒輪潤滑必不可少的材料也引起了相關學者的重點關注。對兩種重要的金屬材料不銹鋼和鋁合金進行對比發現,不銹鋼作為齒輪材料應用更加廣泛。同時運用新詞發現來探究齒輪材料新的發展方向。在DT-BLC模型識別到的材料實體中,2017年發現的在2010年至2016年未出現的材料實體可以分為三類。一類是應用于齒輪的新材料:耐磨自潤滑尼龍、碳纖維復合材料、玻纖增強尼龍、燒結鐵合金、鎳包碳化鎢;一類是齒輪材料應用于新材料制備,即齒輪的新應用,包括PET塑料、芳綸Ⅲ樹脂、聚丙烯酰胺;一類是應用于齒輪潤滑的齒輪油新材料,如:全合成超載荷抗磨極壓工業齒輪油、無硫磷有機鉬減摩劑、聚α烯烴基油。這些識別到的新詞反映了齒輪新的研究方向,對其進行發現能夠把握齒輪發展的趨勢,使企業及時跟進最新發展動態。

圖6 材料實體隨年份變化趨勢

5 結 語

本文針對機械工程領域,提出一種基于雙重遷移學習的中文命名實體識別方法,建立了DT-BLC模型,并對其性能進行了分析。同時,將DT-BLC模型應用于齒輪專利的研究與發展趨勢分析。研究結果表明:

(1) 與其他模型相比,雙重深度遷移學習模型DT-BLC的精確率、召回率和F1值均得到提升。

(2) 隨著Pre_epoch參數的增加,雙重深度遷移學習模型DT-BLC的識別效果迅速提升,并且穩定在一定范圍內。

(3) 通過對DT-BLC模型識別后的齒輪專利實體進行分析,得出齒輪發明專利多集中于將零件運用到機械產品,同時齒輪材料依然以金屬為主,不過近年來新材料的研發也得到較多關注。

猜你喜歡
深度模型
一半模型
深度理解一元一次方程
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
深度觀察
深度觀察
深度觀察
深度觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 免费视频在线2021入口| 试看120秒男女啪啪免费| 日本高清在线看免费观看| 视频在线观看一区二区| 欧美无遮挡国产欧美另类| 日韩精品成人在线| 国产精品无码久久久久AV| 波多野结衣在线一区二区| 欧美成人一区午夜福利在线| 少妇人妻无码首页| 国产成人无码播放| 91精品国产自产91精品资源| 一级不卡毛片| 国产一级精品毛片基地| 欧美色视频网站| 青草视频久久| 五月婷婷欧美| 亚洲精品午夜无码电影网| 久久精品国产在热久久2019| 亚洲无码日韩一区| 欧美成人精品一区二区| 国产91无毒不卡在线观看| 在线看片免费人成视久网下载| 福利视频99| 国产一二三区视频| 国产区成人精品视频| 国产成人亚洲无码淙合青草| 午夜福利免费视频| 国产亚洲精久久久久久无码AV | 日韩AV无码免费一二三区| 精品无码一区二区在线观看| 亚洲精品不卡午夜精品| 國產尤物AV尤物在線觀看| 精品人妻一区二区三区蜜桃AⅤ| 精品国产一区二区三区在线观看| 亚洲日本在线免费观看| 国产精品999在线| 美女啪啪无遮挡| 亚洲欧洲日韩综合色天使| 日韩 欧美 国产 精品 综合| 欧美日韩北条麻妃一区二区| 91在线无码精品秘九色APP| 国产黄网站在线观看| 久草国产在线观看| 久久综合伊人77777| 色欲色欲久久综合网| 麻豆AV网站免费进入| 五月丁香在线视频| 999国内精品视频免费| 久久99国产综合精品女同| 在线看AV天堂| 亚洲女同一区二区| 黄色三级毛片网站| 日本在线免费网站| 新SSS无码手机在线观看| 午夜精品久久久久久久无码软件| 伊人丁香五月天久久综合 | 99热这里只有精品2| 成人在线不卡视频| 欧美三级自拍| 亚洲第一视频免费在线| 色综合热无码热国产| 国产成人无码AV在线播放动漫| 又粗又大又爽又紧免费视频| 久久精品人妻中文视频| 毛片网站观看| 成人夜夜嗨| 美女被操91视频| 国产一区二区视频在线| 欧美亚洲另类在线观看| 成年看免费观看视频拍拍| 不卡色老大久久综合网| 久久午夜夜伦鲁鲁片不卡| 露脸真实国语乱在线观看| 亚洲日韩高清无码| 色婷婷综合激情视频免费看| 国产精品久久久久久久久久久久| 久久 午夜福利 张柏芝| 亚洲免费播放| 波多野结衣一区二区三视频| 久久久成年黄色视频| 亚洲av中文无码乱人伦在线r|