999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

知識圖譜構建研究綜述

2025-06-19 00:00:00楊延云胡軍
現代信息科技 2025年8期
關鍵詞:方法模型

中圖分類號:TP391 文獻標識碼:A 文章編號:2096-4706(2025)08-0117-10

Abstract:As a structured semantic knowledge base,the Knowledge Graph plays a key role in many fields such as informationretrval,intellgntquestionasweringandcommendationsystems.Thisapeviews tetheecorecopoents of KnowledgeGraphconstruction,informationextraction,knowledgefusion,andknowledgerasoning.Informationetraction technologyhasdevelopedfromrule-basedmethods toMachineLearing model,andthentoDepLeaingmodel.Itiscurently evolvingtowardsajoint EntityRelationshipExtractionmodel thatreduces erorpropagationandimprovesaccuracy.Inthepart ofknowledgefusion,thestrategiesofentitylinkingandkowledge mergingarediscussed,andtheproblemofentityrecogition is solved byentitydisambiguationand entity alignment.The sectionon knowledge reasoning analyzes the reasoning methods basedonrules,epresentationlearningandDeepLeaming,anditsaplcationinnewknowledge discoveryanderorinformation corection.Finallytehallengesinteonstuctionprocessaepontedout,andsuggestiosforutureesearchditiosare proposed to promote the development of knowledge graph research and application.

Keywords: Knowledge Graph; information extraction; knowledge fusion; knowledge reasoning; Deep Learning

0 引言

20世紀90年代,計算機網絡在世界各地得到普及,網絡信息資源日漸豐富,信息數據呈現規模海量、類型繁多和快速增長等特征。為方便網絡中的數據得到更好地共享和使用,90年代末,萬維網之父TimBerners-Lee提出“語義網”的概念。“語義網”描述了萬維網中資源、數據之間的關系,通過給萬維網上的文檔添加能夠被計算機所理解的語義“元數據”,形成標準化,從而使整個互聯網成為一個通用的信息交換媒介。2012年,Google公司基于“語義網”提出知識圖譜的概念,其以實體(客觀世界的概念)和關系(兩個實體間的關聯)為基礎,通過有向圖的方式展現了實體間的關系。圖1是一個小型知識圖譜:其中《飛馳人生2》是一個電影實體,韓寒是一個導演實體,沈騰是一個演員實體,韓寒和《飛馳人生2》之間的關系是執導,沈騰和《飛馳人生2》之間的關系是出演。知識圖譜對事物間“關系”地注重提高了搜索引擎對用戶搜索意圖的理解,使其返回的結果更符合用戶的需求。之后,隨著人工智能技術的蓬勃發展,人工智能對知識的需求愈發龐大且不斷增長,促進了國內外各種通用或領域知識圖譜的發展應用,比較有代表性的有微軟提出的概率性概念知識圖譜Probase[1],基于維基百科的多領域知識圖譜DBpedia[2],國內開放知識圖譜OpenKG[3]等。

為使人和計算機能更好地理解和應用知識,相關研究者針對知識圖譜的構建開展了大量研究,研究的重心圍繞著知識圖譜構建過程中的信息抽取、知識融合、知識推理三部分。現對這三個部分的研究進行介紹并加以綜述,并簡要分析知識圖譜目前的挑戰和未來的研究方向,為其下一步的研究提供參考。圖2為知識圖譜的體系架構。

圖1小型知識圖譜

1信息抽取

知識圖譜的本質是一個知識網絡,其基本組成單元是由(實體1、關系、實體2)組成的三元組,通過三元組可以描述現實世界中的復雜關系。因此,從海量非結構化、半結構化數據中,提取出結構化三元組的信息抽取技術可謂至關重要。信息抽取包含命名實體識別和實體關系抽取兩個子任務。

1. 1 命名實體識別

命名實體識別指的是從文本中識別出具有特定意義的實體,如人名、地名、時間、數字等。在文本“春節檔熱映的電影《飛馳人生2》由韓寒執導”中,“飛馳人生2”和“韓寒”就是實體,實體“飛馳人生2”的類型是“電影”,實體“韓寒”的類型是“導演”。對命名實體識別的研究主要經歷了基于規則的方法、基于機器學習的方法和基于深度學習的方法三個階段。

1.1.1 基于規則的命名實體識別方法

早期的命名實體識別方法需先針對目標實體通過人工構建規則,再根據規則從文本中尋找匹配的內容來識別實體。例如文獻[4]提出的DL-CoTrain方法,通過預先規定規則集合,再根據語料對該集合進行訓練迭代,以得到更多的規則,最后將規則用于對命名實體的識別。文獻[5]采用基于規則的方式對結構較規范的數詞和時間詞進行命名實體識別,并取得了較好的效果。

基于規則的命名實體識別方法依托于前期規則的構建,在特定語料上能得到較高的識別效果,但規則非常依賴領域知識。當跨領域應用時,預定義的規則難以生效,而通過人工重新制定規則成本過高且難以覆蓋所有情況。因此,想要通過人工指定的有限規則去識別近乎無限的命名實體,其可行性不高。

1.1.2基于機器學習的命名實體識別方法

為克服人工構建規則有限的問題,有研究者提出基于機器學習的方法。該類方法利用機器學習算法模型實現命名實體識別,一般通過學習特征向量并進行分類,但需要大量的標注數據。文獻[6]采用支持向量機(SupportVectorMachine,SVM)模型進行命名實體研究,并取得了較好的效果。文獻[7]基于條件隨機場(ConditionalRandomFields,CRF)對音樂領域進行命名實體識別研究,并通過實驗,結果表明CRF在音樂領域的命名實體識別中,準確率與支持向量機(SVM)模型和最大熵(Maximum Entropy,ME)模型相比具有一定的優勢。文獻[8]通過CRF條件隨機場模型建立了一種航天命名實體識別的方法,并取得了較高的準確率。文獻[9]通過若干個隱馬爾科夫(HiddenMarkovModels,HMM)模型串聯對法律文本進行多層次實體識別。文獻[10]基于Hadoop平臺進行HMM模型的參數訓練,并驗證了該模型相比于CRF模型的參數訓練效率的優劣。

機器學習方法對命名實體識別的早期研究針對的大多是英文文本,為提高這些模型對中文文本命名實體識別的效果,有研究者根據漢語文本的語法、特點等對模型進行了改進。如層疊隱馬爾可夫模型[11-12]、層疊條件隨機場模型[13-14]等。另有研究者將機器學習模型與規則等方法結合起來,期望能夠提高命名實體識別的效果。如文獻[15]結合CRF和ME,采用兩階段方法識別中文命名實體,有效降低了模型計算的復雜度。文獻[16]提出一種結合SVM和主動學習策略的命名實體識別方法,該方法通過SVM識別切分標注過語料中的中文機構名,并通過主動學習策略減少了人工標注成本。文獻[17]提出一種結合SVM和基于規則的方法應用于生物實體識別,該方法運用基于轉換的錯誤驅動學習方法修正SVM模型的測試結果,提高了對生物實體識別的效果。文獻[18]和文獻[19]將CRF與規則相結合,分別應用在工程領域和地理領域,并取得了較好的命名實體識別效果。

1.1.3基于深度學習的命名實體識別方法

傳統的命名實體識別方法中,基于規則的方法依賴人工構建規則系統,難以覆蓋所有語言領域。基于機器學習的方法需要大量的人工標注數據,且依賴特征工程和模型參數設計。而深度學習技術可以自動學習特征,對新的領域和語言也能更好地處理。深度學習在命名實體識別中的應用,一般是通過將詞向量作為特征輸入到模型中[20],使用詞向量來表示詞語,相比人工選擇特征的方式能夠獲得更多的語義信息。除詞向量的應用外,注意力機制(Attention)[21-22]、BERT(Bidirectional EncoderRepresentations from Transformers)[23-24]、長短期記憶網絡(Long Short-Term Memory,LSTM)[25-26]、卷積神經網絡(Convolutional Neural Networks, CNN)[27]、GRU(Gated Recurrent Unit)[28-29]等深度學習技術也成功用于命名實體識別研究中。

但上述深度學習模型在處理命名實體識別任務時各有長短。例如,注意力機制(Attention)可以更好地捕捉文本中的重要信息,但訓練時間較長。CNN能夠有效提取文本的局部特征,但在處理長距離依賴和文本的全局上下文信息方面不如RNN(RecursiveNeuralNetwork)模型。LSTM對長文本的處理能力較強,但存在梯度問題。BERT可以處理異構數據,但訓練時間較長,且對于低頻詞匯的處理能力較弱。GRU可以有效地抑制梯度消失或爆炸,但不能完全解決梯度消失問題。對此,有研究者嘗試將多種深度學習方法結合應用于命名實體識別研究。文獻[30]提出一種基于注意力機制的卷積神經網絡模型,在不依賴詞匯資源的情況下取得了較好的效果。文獻[31]通過BERT獲取文本特征,并利用BiLSTM(Bi-directionalLongShort-TermMemory,BiLSTM)神經網絡獲取序列化文本的上下文特征,再通過CRF進行序列解碼標注以提取實體。最后通過實驗驗證了該方法的有效性。文獻[32]提出一種結合雙向GRU和雙重注意力機制的中文電子病歷醫療實體關系識別方法。該方法采用雙向GRU學習字的上下文信息,通過注意力機制提高對關系識別起決定作用的字的權重,并從句子中獲取可增強識別性能的特征。通過與BiLSTM-Attention模型進行對比實驗,該方法取得了更好的效果。文獻[33]提出一種基于Attention機制的深度學習方法。該方法先后利用雙向長短期記憶網絡和Attention機制獲得詞在整篇文本中的上下文表示,之后通過CRF得到文本的標簽序列。通過對比實驗驗證了相比現有研究模型,該方法提高了在同篇文本中實體識別的一致性。文獻[34]通過殘差結構促進深度神經網絡的梯度傳播,從而使卷積神經網絡可以擁有更深的架構。文獻[35]提出一種結合CNN、BiGRU(Bidirectional GatedRecurrentUnit)和自注意力(Self-Attention)機制的方法,其模型具有較強的特征提取能力。文獻[36]提出一種結合CNN和Self-Attention機制的方法,并提出一種反思機制來處理模型中潛在的詞匯沖突問題。

1.2 關系抽取

關系抽取作為信息抽取的重要子任務,可以在命名實體識別的基礎上,自動識別實體之間的語義關系,并將其轉化為關系三元組的形式。在文本“春節檔熱映的電影《飛馳人生2》由韓寒執導”中,實體“飛馳人生2”和“韓寒”存在著“執導”關系。

根據對人工標注數據的依賴程度,實體關系抽取方法可分為有監督、半監督、無監督三種。近年來,基于深度學習的關系抽取方法也受到了相關研究者的青睞。

1.2.1 有監督的關系抽取方法

基于特征向量的關系抽取方法一般先從句中提取詞性、句法、語法等特征,并以此設計顯式特征向量,再結合機器學習算法來構造關系抽取模型。該類方法在關系抽取領域取得了不錯的效果,但較為依賴特征工程。文獻[37-44]都使用了基于特征向量的關系抽取方法。

基于核函數的方法通過隱式計算特征向量的內積,以隱性特征映射代替顯性特征映射。該方法可以直接利用核函數比較關系實例之間的結構相似性。但在處理大規模語料時,運算速度上存在一定的缺陷。文獻[45-50]都使用了基于核函數的關系抽取方法。

1.2.2 半監督的關系抽取方法

半監督的關系抽取方法只需少量人工標記數據作為種子,結合學習算法對大量無標記數據進行訓練,即可得到關系抽取模型。該方法在一定程度上降低了有監督的關系抽取方法需人工標注數據的成本。自文獻[51]首次將自舉技術Bootstrapping應用在關系抽取領域并構建出DIPRE系統后,自舉法成為半監督關系抽取的常用方法之一。文獻[52]在文獻[51]的基礎上對關系的描述方法進行改進,提出了Snowball方法。文獻[53]利用自舉法,根據語料庫中詞語的特征提取實體關系指示詞,并取得了較好的效果。

半監督的方法雖然降低了關系抽取對于人工標注數據的依賴性,但是對最初種子集的選取要求較高,且迭代過程中的噪聲問題也是該方法的一大弊端

1.2.3 無監督的關系抽取方法

無監督的關系抽取方法是基于聚類思想實現的。該方法先根據相似性將實體進行聚類,再用合適的詞語對聚類集合進行關系標注。這種自底向上的關系抽取方法無須預定義關系類型,不依賴人工標注語料,因此可以在多領域中得到應用。但無監督的關系抽取方法缺乏人工標注數據和語料庫,其準確性可能受到影響。自文獻[54]首次提出無監督的實體關系抽取方法以來,該類方法已成為關系抽取的常用方法之一。如文獻[55-61]都使用了無監督的實體關系抽取方法。

1.2.4基于深度學習的關系抽取

深度學習方法相比于傳統機器學習方法,具有特征提取和自動學習的優勢,因此研究者們大量開展了基于深度學習的關系抽取方法研究。該類方法可分為基于單一神經網絡的關系抽取方法、基于混合神經網絡的關系抽取方法和實體關系聯合抽取方法。其中,基于單一神經網絡的關系抽取方法主要涉及的神經網絡基本結構有CNN[62-64]、遞歸神經網絡(RNN)[65-67]、圖神經網絡(GraphConvolutionalNeuralNetworks,GCN)[68-70]等。

1.2.5基于混合神經網絡關系抽取方法

為了發揮各種神經網絡在關系抽取模型中的優勢并避免其缺點,基于混合神經網絡的關系抽取方法目前較為流行。例如,文獻[71]結合BiLSTM和CNN用于臨床關系提取,并取得了較好的效果。文獻[72]提出一種結合BiLSTM和Attention機制的多情感分類方法,該方法構建了五個分別對應幸福、憤怒、悲傷、恐懼和驚喜的情感分類器,并進行了情感預測實驗,分析了五個分類器的性能。文獻[32]提出一種結合BiGRU和雙重注意力機制的實體關系抽取方法,并通過實驗驗證了該方法能有效解決現有實體關系抽取方法中可能存在的標簽錯誤問題。文獻[73]提出了一種結合BERT、BiLSTM和Attention機制的關系抽取模型,并與最短路徑模型和注意力導向圖卷積神經網絡等模型進行對比實驗,結果驗證了該模型的合理性。文獻[74]提出一種結合BERT和BiGRU的中文專利文本自動分類方法,用以解決中文發明專利文本的文字描述專業性強等問題,并設計了多組對比實驗,驗證了該方法的有效性。

1.3實體關系聯合抽取方法

命名實體識別和關系抽取這兩個任務傳統上是采用流水線方法分兩步執行的,其在模型選擇上較為靈活。但由于實體識別和關系抽取這兩個模型相互獨立,實體抽取階段的識別錯誤、遺漏等問題會直接傳遞并影響到關系抽取階段的效果。針對上述問題,有研究者開展了實體關系聯合抽取的研究。文獻[75]首次將深度學習應用于實體關系聯合抽取任務,其采用端到端的深度學習模型對聯合任務進行建模。文獻[76]提出基于新序列標注的聯合抽取方法,首次將實體關系聯合抽取簡化為序列標注問題。文獻[77]先基于BiLSTM抽取序列特征,再利用GCN編碼依存分析圖中的先驗詞間關系信息,并對實體關系進行標注,最終生成實體關系三元組。文獻[78]針對實體識別引起的誤差傳播和聯合抽取模型中存在的實體重疊及關系重疊問題,提出了詞性注意力機制和融合先驗知識的實體關系分類器,并以此構建大學數字圖書館系統,用以抽取大學課本的實體關系三元組。

表1為本節所列的信息抽取相關方法及其優缺點對比。

表1信息抽取相關方法及優、缺點對比

2 知識融合

信息抽取任務為初步構建知識圖譜提供了數量可觀的結構化知識,但由于知識的多源異構性,不同知識源獲取到的知識可能存在沖突或重疊,導致信息抽取的結果中可能存在大量的冗余和錯誤。為最大程度地利用知識,滿足不同用戶的知識需求,研究者們開展了知識融合技術的相關研究。知識融合主要包括實體鏈接和知識合并兩部分。

2. 1 實體鏈接

知識圖譜中任何一個實體應該明確對應現實世界中的某個客觀事物。但在知識圖譜構建過程中,通過信息抽取得到的實體可能出現“同名異義”或“同義異名”的情況。“同名異義”指同一個名稱對應不同的客觀事物,例如名稱為“小米”的實體既可以指國產手機品牌,也可以指谷物。“同義異名”是指同一客觀事物對應不同的名稱,例如“南昌”“英雄城”和“洪城”都對應同一個客觀事物。根據上述兩種不同情況,實體鏈接又分為實體消歧和實體對齊。

2.1.1 實體消歧

為確保每一個實體都有明確的對應,采用實體消歧來實現。實體消歧方法的一般思路是通過結合上下文語境,并計算詞匯與實體之間的相似度來實現。文獻[79]利用維基百科的語義知識來衡量實體間的相似性,從而實現實體消歧。文獻[80]同時利用維基百科和英文詞庫WordNet作為背景知識,基于文本相似性和主題一致性提出了LINDEN模型進行實體消歧。文獻[81]根據候選實體和上下文單詞間可能存在的語義聯系,提出了Category2Vec模型來實現命名實體消歧。文獻[82]通過比較實體的時序特征和輸入實體上下文的時序特征進行實體消歧,該方法能夠在實體上下文信息不充分的情況下進行消歧。文獻[83]將實體上下文的語義相似度、實體屬性的背景相似度和主題詞的主題相似度結合起來刻畫實體,實現實體消歧,并通過實驗驗證,這種多元相似度融合方法相比于傳統實體消歧方法,具有更高的實體消歧準確率。文獻[84]針對傳統實體消歧方法在短文本上提取的特征較為缺乏的問題,提出一種基于實體主題關系的中文短文本圖模型消歧法,并通過實驗驗證該方法在短文本上取得了較優的實體消歧效果。

2.1.2 實體對齊

為判斷不同實體是否指向同一客觀事物,采用實體對齊的方式。文獻[85]使用向量空間模型和余弦相似度計算實體相似性,其運算速度較高,但準確率較低。文獻[86]基于嵌入的方法設計了DvGNet模型進行實體對齊。文獻[87]通過計算每個實體的三元組嵌入,再以此進行實體對齊,并提出了一種三元組嵌入計算方法用以感知知識圖譜中的關系類型。通過在公開數據集上進行實驗,驗證了該方法的有效性。文獻[88]提出一種自適應特征融合機制,根據不同模態數據質量動態融合實體結構信息和視覺信息,并設計了視覺特征處理模塊和三元組篩選模塊,分別用來提升視覺信息的有效利用率及緩解結構差異性。之后通過實驗驗證了其在多模態實體對齊任務上的性能優越。

2.2 知識合并

實體鏈接方法是從實體層面提升知識圖譜的知識質量。而知識合并方法是基于現有知識庫和知識圖譜來提升知識圖譜的質量,但現有知識庫或知識圖譜因設計需求或應用領域的不同,導致存在很多知識上的差異和重復。知識合并針對解決的就是上述問題。文獻[89]以兩個知識庫為輸入設計了一種知識融合算法PARIS,能同時對齊類別、實例、屬性和關系,但該算法需要人工參與,無法自動獲取知識并融合。文獻[90]先對多個知識圖譜的數據進行預處理以統一格式,其次建立知識圖譜的實體內容索引,再讀取每個實體的三元組數據并去除冗余,最后構建實體信息字典以合并多個知識圖譜。文獻[91]探索了概念層知識融合和語義層知識融合的實現路徑,并以高血壓疾病為例進行實驗,結果表明融合后的高血壓領域本體,其概念體系、本體內容和領域知識門類都得到了豐富。

表2為本節所列的知識融合相關方法及其優缺點對比。

表2知識融合相關方法及優、缺點對比

3 知識推理

知識推理技術在初步構建出知識圖譜的基礎上,可以進一步從已有知識中挖掘出隱含信息,并識別出錯誤知識。知識圖譜上的推理方法主要分為基于規則的推理方法、基于表示學習的推理方法和基于深度學習的推理方法。

3.1基于規則的推理方法

該類方法可借助現存的定理,或根據特定的場景自定義規則,來實現推理過程。例如,定義“媽媽的爸爸是外公”,已知“a是b的爸爸”,“b是c的媽媽”,則可以推出“a是c的外公”。基于規則的推理方法可解釋性強,因此在知識圖譜推理的早期研究中較為流行。文獻[92]基于一階謂詞邏輯方法預測知識圖中潛在的關系。文獻[93]設計了柑橘病蟲害領域的相關規則來實現知識推理。基于規則的推理方法因簡單、高效,適用于對小型知識圖譜進行推理,但在大型知識圖譜上的知識推理效果有限。

3.2基于表示學習的推理方法

該類方法的基本思想是將知識圖譜中的實體、關系等映射到向量空間中進行推理。文獻[94]將實體和向量聯系起來,并捕捉其中隱含的語義。文獻[95]基于時序特征提出一種時序知識圖譜鏈接預測模型。文獻[96]通過一個擁有三個虛部的超復數來表示知識圖譜中的實體和關系,并以此提出了QuatE模型。

3.3基于深度學習的推理方法

近年來,神經網絡被廣泛用于知識推理領域,相比于其他推理方法,在進行大規模數據抽取有用信息的任務中更有優勢。文獻[97]首次將膠囊網絡用于知識圖譜推理任務,采用預訓練的實體及關系特征表示進行推理,并提出了CapsE模型。文獻[98]結合LSTM和圖注意力機制,設計了AttnPath模型用于實體和關系推理任務。文獻[99]設計的InteractE模型使用循環卷積運算提取特征,并通過改變特征組合的方式來捕獲更多特征交互,并通過實驗證明,該模型具有較好的知識圖譜推理性能。文獻[100]采用分層注意力機制對鄰域信息和類型信息進行多維度感知,以此實現實體推理。文獻[101]利用RoBERTa-PubMed神經網絡、ConvE和HypER構建了一個大規模網絡系統SympGAN,用以提供用戶對癥狀、基因、疾病和藥物之間關系的數據庫訪問。

表3為本節所列的知識推理相關方法及其優缺點對比。

表3知識推理相關方法及優、缺點對比

綜上所述,通過信息抽取技術可從雜亂無章的數據中獲取實體、關系和屬性等信息;通過知識融合技術可消除實體、關系間的歧義,得到客觀的事實表達;最后通過知識推理技術可得到完整的知識圖譜。

4結論

知識圖譜作為知識工程的重要資源管理技術,可實現對數據資源的有效組織和高效利用。本文對知識圖譜構建過程中的信息抽取、知識融合和知識推理三個重要部分進行了系統綜述,其中深度學習技術貫穿于知識圖譜構建的各個環節,對于知識圖譜的應用和優化也有著重要作用。盡管知識圖譜已經取得較為豐富的研究成果,但其構建過程仍存在一些問題亟待解決:

第一,實體關系聯合抽取方法減少了實體識別和關系抽取分步進行可能帶來的錯誤信息和冗余信息,但也帶來了實體、關系重疊的新問題。且當前的實體關系聯合抽取模型主要是抽取三元組形式的實體關系,而實際應用中的語料庫中往往包含大量的多元信息。

第二,自然語言具有多源異構性,因此需確保知識融合能準確將“同名異義”的實體消歧并將“同義異名”的實體對齊,否則會導致知識圖譜中出現知識冗余或錯誤。但在知識融合相關研究中,針對理論方法的研究較多,實證研究較少。

第三,知識圖譜推理缺乏對時間、空間等動態特征的研究。而如醫學領域的疾病發展、農業領域的作物生長等知識易隨時間變化而變化。且基于深度學習的知識推理模型,因“黑箱效應”存在可解釋性差的問題,在如何衡量各種模型在可解釋性上的優劣也缺乏標準。

因此,本文認為在未來的研究工作重點可能主要在以下幾個方面:

第一,改進序列標注策略和三元組匹配規則,用以解決實體關系聯合抽取中的實體、關系重疊問題,并開展針對多元信息的實體關系聯合抽取方法的研究。

第二,針對不同規模的知識圖譜,開展知識融合的實證研究,以進一步驗證現有知識融合方法的有效性。

第三,從知識圖譜的可視化和時態信息的因果關聯等角度出發,增強知識推理的可解釋性。研究針對各種神經網絡模型的解釋機制,以準確反映模型的內部工作邏輯。使用增量學習、時間序列嵌入等方法加強知識圖譜的動態推理,提高其推理的深度。

參考文獻:

[1]WUWT,LIHS,WANGHX,etal.Probase:AProbabilistic Taxonomy for Text Understanding[C]//Proceedingsof the 2012 ACMSIGMOD International Conference onManagementofData.Scottsdale:ACM,2012:481-492.

[2]AUERS,BIZERC,KOBILAROVG,etal.DBpedia:ANucleus forAWeb of Open Data [C]//Proceedings of the 6thInternational The Semantic Web and 2nd Asian ConferenceonAsianSemanticWebConference.Busan:ACM,2007:722-735.

[3]GUPTA S,KENKRE S,TALUKDARP.CaRe:OpenKnowledgeGraphEmbeddings[C]//Proceedingsof the2019Conference on Empirical Methods in Natural Language Processingand the 9th International Joint Conference on Natural LanguageProcessing.Hong Kong: ACL,2019: 378-388.

[4] COLLINS M,SINGER Y. Unsupervised Models forNamed Entity Classification [C]//Proceedings of the Joint SIGDATConference on Empirical Methods in Natural Language Processingand Very Large Corpora.Hong Kong:ACL,1999:100-110.

[5]程志剛.基于規則和條件隨機場的中文命名實體識別方法研究[D].武漢:華中師范大學,2015.

[6] ISOZAKI H, KAZAWA H. Efficient Support VectorClassifiers for Named Entity Recognition [C]//Proceedings ofthe 19th International Conference on Computational Linguistics.

Taipei:ACL,2002,1:1-7.

[7]郝樂川.基于條件隨機場的音樂領域命名實體識別[D].哈爾濱:哈爾濱工業大學,2012.

[8]徐建忠,朱俊,趙瑞,等.基于CRF算法的航天命名實體識別[J].電子設計工程,2017,25(20):42-46.

[9]周曉輝.基于隱式馬爾科夫模型的法律命名實體識別模型的設計與應用[D].廣州:華南理工大學,2018.

[10]李世超.基于Hadoop平臺和隱馬爾可夫模型的生物醫學命名實體識別方法研究[D].咸陽:西北農林科技大學,2018.

[11]俞鴻魁,張華平,劉群,等.基于層疊隱馬爾可夫模型的中文命名實體識別[J].通信學報,2006,27(2):87-94.

[12] LI LS,MAO T,HUANGD G,et al. Hybrid Modelsfor Chinese Named Entity Recognition [C]/Proceedings of theFifth SIGHAN Workshop on Chinese Language Processing.Sydney:ACL,2006,:72-78.

[13] 周俊生,戴新宇,尹存燕,等.基于層疊條件隨機場模型的中文機構名自動識別[J].電子學報,2006(5):804-809.

[14]紅霞.基于層疊條件隨機場的中文機構名識別的研究[D].大連:大連理工大學,2010.

[15]毛新年,董遠,龐文博,等.一種基于條件隨機場和最大熵的兩階段識別中文命名實體方法(英文)[C]/第七屆中文信息處理國際會議.武漢:電子工業出版社,2007:445-459.

[16] 陳霄.基于支持向量機的中文組織機構名識別[D].上海:上海交通大學,2007.

[17]黃浩煒.SVM與基于轉換的錯誤驅動學習方法相結合的生物實體識別[D].長沙:國防科學技術大學,2008.

[18] 郭喜躍,周琴,陳前軍.基于CRF與規則的工程領域命名實體識別方法[J].軟件導刊,2014,13(11):28-30.

[19]何炎祥,羅楚威,胡彬堯.基于CRF和規則相結合的地理命名實體識別方法[J].計算機應用與軟件,2015,32(1):179-185+202.

[20]CHERRYC,GUO HY. The UnreasonableEffectiveness of Word Representations for Twiter Named EntityRecognition [C]//Proceedings of the 2015 Conference of theNorth American Chapter of the Association for ComputationalLinguistics: Human Language Technologies.Denver: ACL,2015: 735-745.

[21]陳琛,劉小云,方玉華.融合注意力機制的電子病歷命名實體識別[J].計算機技術與發展,2020,30(10):216-220.

[22]常君.基于注意力機制的命名實體識別研究[D].太原:太原理工大學,2022.

[23]封紅旗,孫楊,楊森,等.基于BERT的中文電子病歷命名實體識別[J].計算機工程與設計,2023,44(4):1220-1227.

[24]王為國.基于Bert的命名實體識別研究[D].廣州:廣州大學,2021.

[25] PENG N,DREDZE M. Improving Named EntityRecognition for Chinese Social Media With Word SegmentationRepresentation Learning [C]//Proceedings of the 54th AnnualMeeting of the Association for Computational Linguistics.Berlin:ACL,2016,2:149-155.

[26]尹光花,陳鵬.基于雙向LSTM模型的中文命名實體識別[J].信息技術與信息化,2021(10):44-46.

[27] DONG X S,QIANL J,GUANY,et al.A Multi-Class Classification Method Based on Deep Learning for NamedEntity Recognition in Electronic Medical Records [C]/016 NewYork Scientific Data Summit.New York:IEEE,2016:1-10.

[28] 李一斌,張歡歡.基于雙向GRU-CRF 的中文包裝產品實體識別[J].華東理工大學學報:自然科學版,2019,45(3):486-490.

[29] 吳超,王漢軍.基于GRU的電力調度領域命名實體識別方法[J].計算機系統應用,2020,29(8):185-191.

[30] ZHU Y,WANG G. CAN-NER: Convolutional AttentionNetwork for Chinese Named Entity Recognition [C]//Proceedings ofNAACL-HLT2019.Minneapolis:ACL,2019:3384-3393.

[31]王子牛,姜猛,高建瓴,等.基于BERT的中文命名實體識別方法[J].計算機科學,2019,46(S2):138-142.

[32] 張志昌,周侗,張瑞芳,等.融合雙向GRU與注意力機制的醫療實體關系識別[J].計算機工程,2020,46(6):296-302.

[33]楊培,楊志豪,羅凌,等.基于注意機制的化學藥物命名實體識別[J].計算機研究與發展,2018,55(7):1548-1556.

[34]張浩.基于深度學習的生物醫學實體關系抽取算法研究[D].長春:吉林大學,2020.

[35] ZHU Y,WANG G. CAN-NER: ConvolutionalAttention Network for Chinese Named Entity Recognition [C]/Proc of the 2019 Conference of the North American Chapter ofthe Association for Computational Linguistics:Human LanguageTechnologies.Minneapolis:ACL,2019:3384-3393.

[36] GUI T,MART,ZHANGQ,et al. CNN-basedChinese NER with Lexicon Rethinking [C]//Proceedings ofthe Twenty-Eighth International Joint Conference on ArtificialIntelligence.Macao:JCAI,2019:4982-4988.

[37]車萬翔,劉挺,李生.實體關系自動抽取[J].中文信息學報,2005,19(2):2-7.

[38] CULOTTA A,MCCALLUM A,BETZ J. IntegratingProbabilistic Extraction Models and Data Mining to DiscoverRelations and Patterns in Text [C]//Proceedings of the mainconference on Human Language Technology Conference of theNorth American Chapter of the Association of ComputationalLinguistics.New York:ACL,2006:296-303.

[39] JIANG JING, ZHAI CHENGXIANG. A SystematicExploration of the Feature Space for Relation Extraction [C]//Proceedings of NAACL HLT 2007.New York: ACL,2007:113-120.

[40] SUN X,DONG L H. Feature-Based Approachto Chinese Term Relation Extraction [C]//20o9 InternationalConference on Signal Processing Systems.Singapore Piscataway:IEEE,2009:410-414.

[41] TRATZ S,HOVY E. Isi: Automatic Classification ofRelations Between Nominals Using a Maximum Entropy Classifier[C]/Proceedings of the 5th International Workshop on SemanticEvaluation.Los Angeles:ACL,2010:222-225.

[42]郭喜躍,何婷婷,胡小華,等.基于句法語義特征的中文實體關系抽取[J].中文信息學報,2014,28(6):183-189.

[43]高俊平,張暉,趙旭劍,等.面向維基百科的領域知識演化關系抽取[J].計算機學報,2016,39(10):2088-2101.

[44] 甘麗新,萬常選,劉德喜,等.基于句法語義特征的中文實體關系抽取[J].計算機研究與發展,2016,53(2):284-302.

[45] ZHANG M, ZHANG J, SU J. Exploring SyntacticFeatures for Relation Extraction using a Convolution Tree Kernel [C]//Proceedings of the Main Conference on Human Language TechnologyConference of the North American Chapter of the Association of

Computational Linguistics.New York:ACL,288-295.

[46] ZHOU G D,QIAN L H,FAN J X. Tree Kemel-BasedSemantic Relation Extraction with Rich Syntactic and SemanticInformation[J].Information Sciences,2010,180(8):1313-1325.

[47] ZHANG XF,GAO ZQ,ZHU M. Kernel methodsand its application in Relation Extraction [C]// 2011 InternationalConference on Computer Science and Service System(CSSS).Nanjing:IEEE,2011:1362-1365.

[48]劉克彬.基于核函數中文關系自動抽取系統的實現[J].計算機研究與發展,2007,44(8):1406-1411.

[49] 陳鵬.基于多核融合的中文領域實體關系抽取研究[D].昆明:昆明理工大學,2014.

[50]郭劍毅,陳鵬,余正濤,等.基于多核融合的中文領域實體關系抽取[J].中文信息學報,2016,30(1):24-29.

[51] BRIN S. Extracting Patterns and Relations from theWorld Wide Web [J].Lecture Notes in Computer Science,1998,1590:172-183.

[52] AGICHTEIN E, GRAVANO L. Snowball: ExtractingRelations from Large Plain-Text Collections [C]//Proceedings ofthe Fifth ACMConference on Digital libraries.New York:ACMPress,2000:85-94.

[53] YU L,FENG L,LIU X L.A Bootstrapping BasedApproach for Open Geo-entity Relation Extraction [J].ActaGeodaetica et Cartographica Sinica,2016,45(5):616-622.

[54]HASEGAWA T,SEKINE S,GRISHMAN R.Discovering Relations among Named Entities from Large Corpora[C]/Proceedings of the 42nd Annual Meeting on Association forComputational Linguistics.Barcelona:ACL,20o4:415-422.

[55] DAVIDOVD,RAPPOPORT A,KOPPEL M. FullyUnsupervised Discovery of Concept-Specific Relationships byWebMining [C]//Proceedings of the 45th Annual Meeting of theAssociation of ComputationalLinguistics.Proceedings of the 45thAnnual Meeting of the Association of Computational Linguistics:ACL,2007:232-239.

[56] GONZALEZ E, TURMO J. Unsupervised RelationExtraction by Massive Clustering [C]//2009 Ninth IEEE InternationalConference onData Mining.Miami: IEEE,2009:782-787.

[57] YAN YL,OKAZAKI N,MATSUO Y,et al.Unsupervised Relation Extraction By Mining Wikipedia TextsUsing Information from the Web [C]//Proceedings of the JointConference of the 47th Annual Meeting of the ACL and the 4thInternational Joint Conference on Natural Language Processng ofthe AFNLP.Suntec:ACL,2009:1021-1029.

[58] BOLLEGALAD T,MATSUO Y,ISHIZUKA M.Measuring the Similarity Between Implicit Semantic Relations fromthe Web [C]//Proceedings of the 18th International Conference onWorld WideWeb.Madrid:ACM,2009:651-660.

[59]王晶.無監督的中文實體關系抽取研究[D].上海:華東師范大學,2012.

[60]孫勇亮.開放領域的中文實體無監督關系抽取[D].上海:華東師范大學,2014.

[61]施琦.無監督中文實體關系抽取研究[D].北京:中國地質大學(北京),2015.

[62] ZENGDJ,LIUK,LAISW,etal.RelationClassification via Convolutional Deep Neural Network [C]//Proceedings of COLING 2014, the 25th Intermational Conferenceon Computational Linguistics.Dublin:DCUamp; ACL,2014:2335-2344.

[63] NGUYEN TH,GRISHMAN R. Relation Extraction:Perspective from Convolutional Neural Networks [C]//Proceedingsof the 1st Workshop on Vector Space Modeling for NaturalLanguage Processing.Denver,2015:39-48.

[64] XUK,FENGY S,HUANGSF,et al. SemanticRelation Classification via Convolutional Neural Networkswith Simple Negative Sampling [C]//Proceedings of the 2015Conference on Empirical Methods in Natural Language Processing.Lisbon:ACL,2015:536-540.

[65] SOCHERR,PENNINGTONJ,HUANGEH,et al. Semi-Supervised Recursive Auto Encoders for PredictingSentiment Distributions [C]//Proceedings of the Conference on

Empirical Methods in Natural Language Processing.Edinburgh:

ACL,2011:151-161.

[66] HASHIMOTO K,MIWA M,TSURUOKAY,et al.Simple Customization of Recursive Neural Networks for SemanticRelation Classification [C]//Proceedings of the 2013 Conferenceon Empirical Methods in Natural Language Processing.Seattle:ACL,2013:1372-1376

[67] EBRAHIMI J,DOU D. Chain Based RNN for RelationClassification [C]//Proceedings of the 2015 Conference of theNorth American Chapter of the Association for ComputationalLinguistics: Human Language Technologies.Denver: ACL,2015:1244-1249.

[68] SCHLICHTKRULL M,KIPF T N,BLOEMP,etal.Modeling Relational Data with Graph Convolutional Networks[C]//Proceedings of the European Semantic Web Conference.Heraklion:Springer,2018:593-607.

[69] GUO Z J, ZHANG Y,LU W. Attention Guided GraphConvolutional Networks for Relation Extraction [C]/Proceedingsof the 57th Annual Meeting of the ACL.Florence:ACL,2019:241-251.

[70] SUN K, ZHANG R CG,MAO Y Y,et al. RelationExtraction with Convolutional Network over Learnable Syntax-Transport Graph [J].Proceedings of the AAAI Conference onArtificial Intelligence,2020,34(5):8928-8935.

[71] LI ZH,YANG ZH, SHENC,et al. IntegratingshortestDependency Path and Sentence Sequence into a Deep LearningFramework forRelationExtraction in Clinical Text[J/OL].BMCMedical Informatics and Decision Making,2019,19(1):1-8[2024-09-10].https://doi.0rg/10.1186/s12911-019-0736-9.

[72]王婷偉.基于Attention與BiLSTM模型的多情感分類方法研究[D].衡陽:南華大學,2020.

[73]徐瑞涓,高建瓴.基于BERT和注意力引導圖卷積網絡的關系抽取[J].智能計算機與應用,2023,13(2):204-209.

[74] 劉燕.基于BERT-BiGRU的中文專利文本自動分類[J].鄭州大學學報:理學版,2023,55(2):33-40.

[75] MIWA M,BANSAL M. End-to-end RelationExtraction using LSTMs on Sequences and Tree Structures [J/OL].arXiv:1601.00770 [cs.CL].[2024-08-26].https://doi.0rg/10.48550/arXiv.1601.00770.

[76] ZHENG S C,WANG F,BAO H Y,et al. JointExtraction of Entities and Relations Based on a Novel TaggingScheme [J/OL].arXiv:1706.05075 [cs.CL].[2024-08-23].https://doi.org/10.48550/arXiv.1706.05075.

[77]張軍蓮,張一帆,汪鳴泉,等.基于圖卷積神經網絡的中文實體關系聯合抽取[J].計算機工程,2021,47(12):103-111.

[78]何懷前.基于深度學習的實體關系聯合抽取方法研究與系統實現[D].上海:東華大學,2023.

[79] HAN X P,ZHAO J. Named Entity DisambiguationbyLeveraging Wikipedia Semantic Knowledge [C]//Proceedingsofthe 18th ACM Conference on Informationand KnowledgeManagement.HongKong:ACM,2009:215-224.

[80] SHEN W,WANG JY,LUO P,et al. Linden: LinkingNamed EntitieswithKnowledgeBaseVia SemanticKnowledge[C]/Proceedings of the 21st International Conference on WorldWide Web.Lyon:ACM,2012:449-458.

[81] ZHU G G,IGLESIAS C A. Exploiting SemanticSimilarity for Named EntityDisambiguation in Knowledge Graphs[J].Expert Systems with Applications,2018,101:8-24.

[82] AGARWAL P, STROTGEN J,DEL CORRO L,et al.diaNED: Time-Aware Named Entity Disambiguation forDiachronic Corpora [C]/Proceedings of the 56th Annual Meetingof the Association for Computational Linguistics.Melbourne:ACL,2018:686-693.

[83]石水倩,金晶,沈耕宇,等.基于多元相似度融合的中文命名實體消歧方法[J].數據分析與知識發現,2024,8(2):56-64.

[84] 馬瑛超,張曉濱.基于主題關系的中文短文本圖模型實體消歧[J].計算機工程與科學,2023,45(1):154-162.

[85] LI J Z,WANG ZC,ZHANG X,et al. Large ScaleInstance Matching Via Multiple Indexes and Candidate Selection[J].Knowledge-Based Systems,2013,50(9):112-120.

[86] JINY,WJI,Y SHI,et al,Meta-path Guided GraphAttention Network for Explainable Herb 5-5Recommendation[J].Health Information Science and Systems,Springer,2023.11(1): 5-5.

[87]李鳳英,黎家鵬.聯合三元組嵌入的實體對齊[J].計算機工程與應用,2023,59(24):70-77.

[88]郭浩,李欣奕,唐九陽,等.自適應特征融合的多模態實體對齊研究[J].自動化學報,2024,50(4):758-770.

[89]SUCHANEKFM,ABITEBOUL S,SENELLARTP.PARIS:Probabilistic Alignment of Relations, Instances,andSchema[J].Proceedings of the VLDB Endowment,2011,5(3):157-168.

[90]楊元鋒.面向問答的知識圖譜推理技術和合并技術研究[D].哈爾濱:哈爾濱工業大學,2020.

[91]周利琴.面向智慧健康的多源異構知識融合研究[D].武漢:武漢大學,2022.

[92] SCHOENMACKERS S, DAVIS J,ETZIONI O,et al.Learming First Order Horn Clauses from Web Text[C]//Proceedingsof the 2O10 Conference on Empirical Methods in Natural LanguageProcessing.Cambridge:ACL,2010:1088-1098.

[93]楊潔.基于本體的柑橘病蟲害知識建模及推理研究[D].武漢:華中師范大學,2014.

[94] NICKEL M,TRESPV,KRIEGEL HP.A Three-Way Model for Collctive Learning on Multi-Relational Data[C]//The 28th International Conference on Machine LearningThe International Conference on Machine Learning. Bellevue:Omnipress,2011:809-816.

[95]陳德華,殷蘇娜,樂嘉錦,等.一種面向臨床領域時序知識圖譜的鏈接預測模型[J].計算機研究與發展,2017,54(12):2687-2697.

[96] ZHANG S,TAYY,YAO LN,et al.QuaternionKnowledge Graph Embeddings [C]//Thirty-third Conferenceon Neural Information Processing Systems.Vancouver:CurranAssociates Inc,2019:2735-2745.

[97] NGUYEN DQ,VUT,NGUYEN TD,et al.A CapsuleNetwork-based Embedding Model for Knowledge Graph Completionand Search Personalization [J/OL].arXiv:1808.04122 [cs.CL].[2024-08-10].https://doi.org/10.48550/arXiv.1808.04122.

[98] WANGH,LISY,PANR,et al. IncorporatingGraph AttentionMechanisminto Knowledge GraphReasoningBased on DeepReinforcementLearning[C]//2019ConferenceonEmpirical Methods in Natural Language Processing and 9th International Joint Conference on Natural Language Processing (EMNLPIJCNLP).HongKong:ACL,2019:2623-2631.

[99]VASHISHTHS,SANYALS,NITINV,etal.InteractE:Improving Convolution-Based Knowledge GraphEmbeddingsbyIncreasingFeature Interactions[C]//ProceedingsoftheThirty-FourthAAAIConferenceonArtificialIntelligence.NewYork:AAAIPress,2020,34(3):3009-3016.

[100] WANGYZ,WANGHZ,HEJW,et al.TAGAT:Type-Aware Graph Attention Networks for Reasoning Over KnowledgeGraphs[J/OL].Knowledge-BasedSystems, 2021,233:107500[2024-08-05].https://doi.org/10.1016/ j.knosys.2021.107500.

[101]KEZHIL,KUOY,HAILONG S,etal.SympGAN: ASystematic KnowledgeIntegration System forSymptom-Gene Associations Network[J/OL].Knowledge-Based Systems, 2023,276:110752[2024-08-03].https://doi.0rg/10.1016/ j.knosys.2023.110752.

作者簡介:楊延云(1995.04—),女,漢族,河北張家口人,助教,碩士研究生,研究方向:自然語言處理、數據挖掘、軟件開發;胡軍(1996.09一),男,漢族,江西撫州人,助教,碩士研究生,研究方向:數據挖掘。

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
學習方法
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 国产精品亚洲一区二区三区z| 欧美精品啪啪一区二区三区| 欧美一区二区人人喊爽| 国产亚洲欧美日韩在线一区| 国产人前露出系列视频| 国产精品自在在线午夜| 欧美a在线看| 欧美影院久久| 青草精品视频| 亚洲成a人片77777在线播放| 国产极品美女在线播放| 欧美α片免费观看| 91欧洲国产日韩在线人成| 人妖无码第一页| 精品撒尿视频一区二区三区| 少妇精品在线| 在线观看国产精美视频| 欧美在线视频a| 欧美一级在线播放| 国产高清不卡视频| 日本在线视频免费| 日本不卡在线| 亚洲无码免费黄色网址| 91精品人妻互换| 国产国语一级毛片在线视频| 日本成人福利视频| 国产农村妇女精品一二区| 国产毛片一区| 一级做a爰片久久毛片毛片| 欧美成人A视频| AⅤ色综合久久天堂AV色综合| 青青青国产在线播放| 韩国v欧美v亚洲v日本v| 国产丝袜第一页| 中文字幕无线码一区| 久久情精品国产品免费| 人妻夜夜爽天天爽| 欧美日韩动态图| 亚洲成aⅴ人片在线影院八| 视频二区中文无码| 亚洲无码四虎黄色网站| 国产精品无码AV中文| 国产精品入口麻豆| 97成人在线观看| 国产一区二区视频在线| 国产在线视频二区| 九色综合伊人久久富二代| 国产第一页免费浮力影院| 无码视频国产精品一区二区| 日韩无码视频专区| 欧美a在线视频| 58av国产精品| 亚亚洲乱码一二三四区| 92精品国产自产在线观看| 无码丝袜人妻| 97视频在线精品国自产拍| 中文字幕波多野不卡一区| 国产一区二区精品福利| 亚洲人成色在线观看| 日韩经典精品无码一区二区| 亚洲欧美人成人让影院| 亚洲国产成人精品一二区| 欧美成人一级| 亚洲中文字幕23页在线| 曰AV在线无码| 九九热视频在线免费观看| 亚洲综合色在线| yjizz视频最新网站在线| 狠狠色丁香婷婷| 久久久亚洲国产美女国产盗摄| 国产理论精品| 女同久久精品国产99国| 久久亚洲中文字幕精品一区| 亚洲一区二区在线无码| 久久一级电影| 91久久国产综合精品| 亚洲美女一级毛片| 国产sm重味一区二区三区| 天天操天天噜| 国产经典三级在线| 久久99久久无码毛片一区二区| 国产精品一区二区无码免费看片|