999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

細粒度實體分類的研究進展

2023-07-17 07:28:22劉波
科技資訊 2023年11期
關鍵詞:深度學習

劉波

摘??要:細粒度實體分類是自然語言處理中一項重要的基礎任務,實體的類別信息為實體鏈接、關系抽取、事件抽取等下游任務提供幫助。近年來,基于深度學習的細粒度實體分類研究成為熱點,該文從處理數(shù)據(jù)噪聲、對類別層級建模、少樣本學習和其他一些方法進行了綜述性介紹,此外介紹了常見的數(shù)據(jù)集和評測方法,并對未來的研究方向進行了展望。

關鍵詞:自然語言處理??細粒度實體分類??深度學習??信息抽取

中圖分類號:TP391.1??????????文獻標識碼:A

Research?Progress?of?Fine-Grained?Entity?Classification

LIU?Bo

(School?of?Mathematics?and?Statistics,?Hanshan?Normal?University,?Chaozhou,?Guangdong?Province,?521041?China)

Abstract:?Fine-grained?entity?classification?is?an?important?basic?task?in?natural?language?processing,?and?the?category?information?of?entities?provides?help?for?downstream?tasks?such?as?entity?linking,?relation?extraction?and?event?extraction.?In?recent?years,?the?research?on?fine-grained?entity?classification?based?on?deep?learning?has?become?a?hot?topic.?This?paper?gives?an?overview?of?dealing?with?data?noise,?category-level?modeling,?few-sample?learning?and?some?other?methods,?introduces?common?datasets?and?evaluation?methods,?and?prospects?future?research?directions.

Key?Words:?Natural?language?processing;?Fine-grained?entity?classification;?Deep?learning;?Information?extraction

細粒度實體分類任務是給定一個實體和包含這個實體的上下文預測這個實體可能的類別集合。如表1所示,文本為“?Bennett?said?the?city-owned?arena?lacked?the?amenities?to?support?an?NBA?franchise?and?moved?the?team?to?Oklahoma?City?after?failing?to?secure?a?new?arena?here”,任務是識別出給定的實體“NBA”的類別為“organization”?和?“organization/sports_league”。它是很多自然語言處理領域重要的基礎工作。細粒度實體分類任務的一個特點就是實體的類別更加細致,如類別有“actor”“sports_team”“car”“power_station”等[1]。常用的細粒度實體分類數(shù)據(jù)集的類別數(shù)量在50-100個左右[2,3]。而且大部分的數(shù)據(jù)集的類別有層級關系,如粗粒度類別和細粒度類別,如表?1(a)的實體只有粗粒度類別,“/person”,?表?1(b)的實體類別有粗粒度類別“/organization”和細粒度類別“organization/sports_league”。

細粒度實體分類為信息抽取下游任務提供幫助,如在關系抽取中實體的類別信息能夠提升關系抽取任務的效果[4]。實體的類別對實體之間的關系有很強的指示性,比如說如果知道頭尾實體類別分別是公司和人物,那么實體對之間的關系很可能是建立者這樣的關系。另外,實體類別信息也有助于實體消歧。在實體消歧任務中,已經(jīng)獲得了所有的候選實體集。如果知道其指代的知識庫中實體應當具有的類別,那么就能從候選實體集中確定應該鏈接的實體是哪一個。

1基于深度學習的方法

在早期的工作中SHIMAOKA?S等人[5]提出了基于注意力機制的模型,通過編碼器得到實體的表示和上下文的表示,然后通過一個全連接網(wǎng)絡進行預測。XIN?J等人[6]提出了KNET模型,使用了語義注意力、實體注意力、知識注意力。實體使用知識圖譜中的實體表示。近年來隨著預訓練語言模型的發(fā)展,?LIN?Y等人[7]使用了預訓練語言模型ELMO和BERT進行實體和上下文的表示,而不是在之前的工作中使用的固定的詞嵌入。模型不是獨立預測每一種類別,而是預測一個低維向量,該向量由潛在類別特征編碼,并以這種潛在表示重建類別向量。以上模型使用了注意力機制、預訓練語言模型等方法。

2??處理數(shù)據(jù)噪聲

針對遠程監(jiān)督產(chǎn)生的數(shù)據(jù)噪聲問題。XU?B等人[8]提出了類似投票的方法,將數(shù)據(jù)集分成兩部分,用其中一部分數(shù)據(jù)訓練多個分類器,并用這些分類器對另一部分數(shù)據(jù)打標簽,若這些分類器都預測某個類別是錯誤的,則將其從數(shù)據(jù)中刪除,此方法比較簡單但效果有限。XU?P等人[9]提出的模型將訓練數(shù)據(jù)集劃分成純凈集合和噪聲集合,對于純凈集合和降噪集合分別建模設置不同的目標函數(shù)提高效果。XIN?J等人[10]提出使用語言模型來降噪的方法。思想是把文本中的實體替換成類別,正確的類別要比錯誤的類別得到更加通順的句子。通過語言模型的作用,可以讓模型自動去關注那些符合上下文語境的類別。

3??針對類別層級的方法

針對類別的層級關系,?CHEN?B等人[11]提出了層次損失標準化的方法,根據(jù)類別在分類樹中的相關性具有不同程度的懲罰,修正預測的概率。XU?B等人[8]將一個實體的所有的上下文和類別匯集起來,然后在類別融合的過程中使用整數(shù)規(guī)劃的方法,將層級關系顯式地寫成整數(shù)規(guī)劃中的約束,實現(xiàn)類別融合過程中關于層級結構的檢查。ONOE?Y等人[12]使用盒嵌入來捕獲潛在類別的層次結構,即模型不需要已知數(shù)據(jù)集的類別結構。模型將類別和實體嵌入同一個盒子空間,可以通過盒子的關系確定他們之間的層級關系,用盒子的體積表示概率,可以用來衡量計算一個實體是否屬于某個類別的概率。

4?最新的研究

最近人們試圖通過使用更豐富、超細粒度的類別集來擴展細粒度實體類別。DAI?H等人[13]提出使用掩碼語言模型來獲取超細實體分類的訓練數(shù)據(jù)。模型將上下文中的實體輸入到掩碼語言模型中,以便預測實體的上下文相關的超詞,它可以用作實體類別標簽。借助這些自動生成的標簽,超細粒度實體分類模型的性能可以顯著提高。DING?N等人[14]研究了提示學習在有監(jiān)督、少樣本和零次學習中細粒度實體分類的應用。模型通過構建實體的語言表達器和模板,并進行掩碼語言建模,提出了一個簡單而有效的提示學習方法。

5?數(shù)據(jù)集和評估指標

5.1??數(shù)據(jù)集

5.1.1?FIGER

數(shù)據(jù)集從維基百科的文章和新聞報道中取樣,在這些文本中的實體被映像到來自Freebase的113個類別中。數(shù)據(jù)集有47個粗粒度類別,66個細粒度類別[1]。

5.1.2?BBN

數(shù)據(jù)集的類別層級有兩級,標記了《華爾街日報》的Penn?Treebank語料庫(LDC95T7)中的一部分作為BBN實體分類語料庫。數(shù)據(jù)集有17個粗粒度類別,39個細粒度類別[3]。

5.1.3?OntoNotes

數(shù)據(jù)集從OntoNotes語料庫中抽取句子,并使用類別層級結構中的89種類別對實體進行標注。此數(shù)據(jù)集的類別有3個層級:一級類別4個、二級類別44個和三級類別41個[15]。

5.2?評估指標

細粒度實體分類任務采用嚴格的準確率(Strict?Accuracy,Acc)、宏平均F1值(Macro-F1?score,MaF1)和微平均F1值(Micro-F1?score,MiF1)進行評估。對于輸入,設預測的類別集合為,設數(shù)據(jù)集的標注類別集為。嚴格的準確率是滿足的實例的比率。宏平均F1值是計算所有樣本的召回率和精度的平均值,然后再計算F1值。而微平均F1值是計算所有樣本的真陽性、假陰性和假陽性總數(shù),然后計算F1值。3個指標的具體計算公式如下。

6?結語

綜上所述,在細粒度實體分類任務中,研究者主要從處理數(shù)據(jù)噪聲和類別的層級關系建模,以及掩碼語言模型、提示學習或更好的嵌入方法等。隨著實體分類任務研究的進一步深入,未來有待進一步研究的方向有少樣本和零樣本學習問題,如何處理新的類別,以及如何結合具體的任務如關系抽取、實體鏈接等進行細粒度實體分類。

參考文獻

[1] LING?X,?WELD?D?S.Fine-grained?entity?recognition[C]//Twenty-Sixth?AAAI?Conference?on?Artificial?Intelligence.2012:94-100.[2]?Ren?X,He?W,Qu?M,et?al.Afet:?Automatic?fine-grained?entity?typing?by?hierarchical?partial-label?embedding[C]//Proceedings?of?the?2016?conference?on?empirical?methods?in?natural?language?processing.2016:1369-1378.

[3] WEISCHEDEL?R,BRUNSTEIN?A.BBN?Pronoun?Coreference?and?Entity?Type?Corpus[EB/OL].[2005-09-20].https://doi.org/10.35111/9fx9-gz10.

[4] VASHISHTH?S,JOSHI?R,PRAYAGA?S?S,et?al.RESIDE:?Improving?Distantly-Supervised?Neural?Relation?Extraction?using?Side?Information[C]//Proceedings?of?the?2018?Conference?on?Empirical?Methods?in?Natural?Language?Processing.2018:1257-1266.

[5] SHIMAOKA?S,?STENETORP?P,?INUI?K,?et?al.?Neural?Architectures?for?Fine-grained?Entity?Type?Classification[C]//Association?for?Computational?Linguistics.In?Proceedings?of?the?15th?Conference?of?the?European?Chapter?of?the?Association?for?Computational?Linguistics.?2017:1271–1280.

[6] XIN?J,ZHU?H,HAN?X,et?al.Put?It?Back:Entity?Typing?with?Language?Model?Enhancement[C]//Proceedings?of?the?2018?Conference?on?Empirical?Methods?in?Natural?Language?Processing.2018:993-998.

[7] LIN?Y,?JI?H.An?Attentive?Fine-Grained?Entity?Typing?Model?with?Latent?Type?Representation[C]//Proceedings?of?the?2019?Conference?on?Empirical?Methods?in?Natural?Language?Processing?and?the?9th?International?Joint?Conference?on?Natural?Language?Processing.2019:6197-6202.

[8] XU?B,?LUO?Z,HUANG?L,et?al.METIC:?Multi-Instance?Entity?Typing?from?Corpus[C]//Proceedings?of?the?27th?ACM?International?Conference?on?Information?and?Knowledge?Management.2018:?903-912.

[9] XU?P,?BARBOSA?D.?Neural?Fine-Grained?Entity?Type?Classification?with?Hierarchy-Aware?Loss[C]//Association?for?Computational?Linguistics.?In?Proceedings?of?the?2018?Conference?of?the?North?American?Chapter?of?the?Association?for?Computational?Linguistics:?Human?Language?Technologies,?Volume?1.2018:16–25.

[10] XIN?J,LIN?Y,LIU?Z,et?al.Improving?neural?fine-grained?entity?typing?with?knowledge?attention[C]//Thirty-second?AAAI?conference?on?artificial?intelligence.2018.

[11] CHEN?B,GU?X,HU?Y,et?al.Improving?Distantly-supervised?Entity?Typing?with?Compact?Latent?Space?Clustering[C]//Proceedings?of?the?2019?Conference?of?the?North?American?Chapter?of?the?Association?for?Computational?Linguistics.2019:2862-2872.

[12] ONOE?Y,BORATKO?M,MCCALLUM?A,et?al.Modeling?Fine-Grained?Entity?Types?with?Box?Embeddings[C]//Proceedings?of?the?59th?Annual?Meeting?of?the?Association?for?Computational?Linguistics?and?the?11th?International?Joint?Conference?on?Natural?Language?Processing.2021:2051-2064.

[13] DAI?H,SONG?Y,WANG?H.Ultra-Fine?Entity?Typing?with?Weak?Supervision?from?a?Masked?Language?Model[C]//Proceedings?of?the?59th?Annual?Meeting?of?the?Association?for?Computational?Linguistics?and?the?11th?International?Joint?Conference?on?Natural?Language?Processing.2021:1790-1799.

[14] DING?N,CHEN?Y,HAN?X,et?al.Prompt-Learning?for?Fine-Grained?Entity?Typing[J].Association?for?Computational?Linguistics.In?Findings?of?the?Association?for?Computational?Linguistics:EMNLP?2022:6888–6901.

[15] GILLICK?D,LAZIC?N,GANCHEV?K,et?al.Context-Dependent?Fine-Grained?Entity?Type?Tagging[EB/OL].?https://dblp:?Context-Dependent?Fine-Grained?Entity?Type?Tagging.

猜你喜歡
深度學習
從合坐走向合學:淺議新學習模式的構建
面向大數(shù)據(jù)遠程開放實驗平臺構建研究
基于自動智能分類器的圖書館亂架圖書檢測
搭建深度學習的三級階梯
有體驗的學習才是有意義的學習
電子商務中基于深度學習的虛假交易識別研究
利用網(wǎng)絡技術促進學生深度學習的幾大策略
考試周刊(2016年94期)2016-12-12 12:15:04
MOOC與翻轉課堂融合的深度學習場域建構
大數(shù)據(jù)技術在反恐怖主義中的應用展望
深度學習算法應用于巖石圖像處理的可行性研究
軟件導刊(2016年9期)2016-11-07 22:20:49
主站蜘蛛池模板: 亚洲午夜福利在线| 免费又黄又爽又猛大片午夜| 无码视频国产精品一区二区| 成年网址网站在线观看| 狠狠色综合网| 欧美啪啪精品| 在线日韩日本国产亚洲| 婷婷色中文| 国产精品亚洲精品爽爽| 免费观看男人免费桶女人视频| 欧美激情二区三区| 免费观看亚洲人成网站| av天堂最新版在线| 久久永久视频| 一区二区三区精品视频在线观看| 亚洲美女一级毛片| 99视频精品在线观看| 一区二区三区毛片无码| 高潮爽到爆的喷水女主播视频 | 亚洲欧美不卡| 91区国产福利在线观看午夜| 蜜臀av性久久久久蜜臀aⅴ麻豆| 老司国产精品视频91| 日韩视频福利| 午夜小视频在线| 无码福利日韩神码福利片| 97狠狠操| 久久久久国产精品熟女影院| 91国内在线观看| www中文字幕在线观看| 亚洲欧美日本国产综合在线| 久热re国产手机在线观看| 国产精品分类视频分类一区| 在线精品视频成人网| 国产精品分类视频分类一区| 国产鲁鲁视频在线观看| 久久国产精品影院| 波多野结衣二区| 一边摸一边做爽的视频17国产| 亚洲区第一页| 成人免费一区二区三区| 国产极品粉嫩小泬免费看| 久久香蕉国产线| 丁香五月婷婷激情基地| 久久久精品无码一区二区三区| 欧美一区二区丝袜高跟鞋| 久久久噜噜噜久久中文字幕色伊伊 | 国产精品成人观看视频国产| 国产视频只有无码精品| 欧美影院久久| 中文字幕永久在线看| 国产精品白浆在线播放| 精品无码一区二区三区在线视频| 国产美女一级毛片| 国产真实乱人视频| 亚洲人成网站色7777| 久久免费视频播放| 久久永久精品免费视频| 免费毛片视频| 久久永久精品免费视频| 欧美午夜精品| 91精品国产自产91精品资源| 在线中文字幕网| 麻豆国产精品一二三在线观看| 新SSS无码手机在线观看| 久久夜色撩人精品国产| 无码'专区第一页| 亚洲欧美另类视频| 看看一级毛片| 亚洲aaa视频| 伊人色天堂| 国产精品大白天新婚身材| 精品伊人久久久久7777人| 日韩区欧美区| 亚洲精品777| 国产av剧情无码精品色午夜| 欧美成人免费午夜全| 99成人在线观看| 波多野结衣爽到高潮漏水大喷| 91系列在线观看| 免费视频在线2021入口| 日本一区二区不卡视频|