999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

知識(shí)萃取研究述評(píng)

2023-12-29 00:00:00高國(guó)偉康涔
圖書館研究與工作 2023年7期

摘 要:文章對(duì)知識(shí)萃取的概念、面臨的問(wèn)題、技術(shù)和應(yīng)用進(jìn)行了描述,通過(guò)對(duì)當(dāng)前知識(shí)萃取的研究成果進(jìn)行梳理,闡述知識(shí)萃取的研究現(xiàn)狀,明確未來(lái)研究方向。通過(guò)分析可以看出知識(shí)萃取的研究仍處于初級(jí)階段,對(duì)技術(shù)和應(yīng)用等方面的研究還有許多不足之處,需要進(jìn)一步的創(chuàng)新與發(fā)展。文章提出知識(shí)萃取的技術(shù)創(chuàng)新、知識(shí)庫(kù)的構(gòu)建和維護(hù)、知識(shí)圖譜和知識(shí)融合的發(fā)展有可能成為知識(shí)萃取未來(lái)的研究熱點(diǎn),可以做更加深入的研究。

關(guān)鍵詞:知識(shí)萃取;大知識(shí);知識(shí)獲取;知識(shí)工程;知識(shí)圖譜;知識(shí)融合;人工神經(jīng)網(wǎng)絡(luò)

中圖分類號(hào):G252.8 文獻(xiàn)標(biāo)識(shí)碼:A

Review of the Research on Knowledge Extraction

Abstract This paper provides a description of the concept, challenges, technologies, and applications of knowledge extraction. By reviewing current research achievements, the research status of knowledge extraction is clarified, and future research directions are proposed. The analysis indicates that the research on knowledge extraction is still in its early stage and there are many deficiencies in the study of technologies and applications. Further innovation and development are needed. This paper proposes that technological innovation, knowledge base construction and maintenance, and the development of knowledge graph and knowledge fusion could become the future research hotspots of knowledge extraction. Therefore, more in-depth research could be conducted in these areas.

Key words knowledge extraction; big knowledge; knowledge acquisition; knowledge engineering; knowledge graph; knowledge fusion; artificial neural network

1 引言

大數(shù)據(jù)時(shí)代,越來(lái)越多的學(xué)者更加注重對(duì)知識(shí)萃取的研究。知識(shí)萃取是知識(shí)獲取的最佳途徑,選擇合適的知識(shí)萃取方法和技術(shù)可以放大知識(shí)的使用價(jià)值。隨著互聯(lián)網(wǎng)的快速發(fā)展,知識(shí)的數(shù)量持續(xù)增長(zhǎng),知識(shí)的種類也愈加復(fù)雜。在網(wǎng)絡(luò)發(fā)達(dá)的現(xiàn)今社會(huì)中,大多數(shù)人都需要通過(guò)持續(xù)攝取知識(shí)來(lái)充實(shí)自身,以達(dá)到終身學(xué)習(xí)的目的,從而更好地完成學(xué)業(yè)并且發(fā)展事業(yè)。但是由于知識(shí)存在質(zhì)量良莠不齊、形式碎片化等特點(diǎn),所以只有進(jìn)行知識(shí)萃取,才能使人們更加方便地獲取高質(zhì)量的知識(shí)。

知識(shí)萃取是大知識(shí)研究的重要研究方向,也是知識(shí)工程的重要研究領(lǐng)域之一。大數(shù)據(jù)時(shí)代下知識(shí)工程的核心是集成碎片化知識(shí)。知識(shí)萃取可以對(duì)碎片化知識(shí)進(jìn)行組織和管理,以達(dá)到萃取出高質(zhì)量知識(shí)精華并為他人所用的目的。目前國(guó)外學(xué)者側(cè)重于研究知識(shí)萃取的技術(shù)創(chuàng)新以及應(yīng)用,國(guó)內(nèi)學(xué)者則更側(cè)重于研究知識(shí)萃取在不同領(lǐng)域中的應(yīng)用。但是總體來(lái)說(shuō)缺乏對(duì)研究成果的系統(tǒng)梳理,知識(shí)萃取的相關(guān)述評(píng)仍是一個(gè)空缺。

本文使用文獻(xiàn)調(diào)查法、歸納總結(jié)法和比較分析法,總結(jié)歸納知識(shí)萃取的概念,梳理了知識(shí)萃取的技術(shù),對(duì)國(guó)內(nèi)外的知識(shí)萃取研究?jī)?nèi)容進(jìn)行簡(jiǎn)要對(duì)比分析。并從應(yīng)用知識(shí)萃取較多的領(lǐng)域入手,梳理了知識(shí)萃取的應(yīng)用,最后提出了未來(lái)知識(shí)萃取的發(fā)展方向。

2 知識(shí)萃取概念

知識(shí)萃取(knowledge extraction),亦可稱為知識(shí)抽取。業(yè)界對(duì)于知識(shí)萃取的概念眾說(shuō)紛紜,并沒(méi)有統(tǒng)一的界定。因此筆者梳理了學(xué)者們比較認(rèn)同的知識(shí)萃取概念。吳慶海[1]認(rèn)為知識(shí)萃取是從大量數(shù)據(jù)、信息、文本、經(jīng)驗(yàn)中,通過(guò)合適的方法和工具,將精華的知識(shí)抽取出來(lái)的過(guò)程。化柏林等人[2]認(rèn)為知識(shí)抽取是通過(guò)對(duì)文獻(xiàn)進(jìn)行內(nèi)容分析處理,把文獻(xiàn)中所蘊(yùn)含的知識(shí)點(diǎn)(也稱知識(shí)元)逐條抽取出來(lái),對(duì)知識(shí)的屬性進(jìn)行標(biāo)記,再以一定形式存入知識(shí)庫(kù)中。Jung Hanmin等人[3]認(rèn)為知識(shí)萃取是一種可以作為知識(shí)發(fā)現(xiàn)、數(shù)據(jù)挖掘和數(shù)據(jù)庫(kù)的自然語(yǔ)言接口的基礎(chǔ)前端技術(shù),并且可以逐步轉(zhuǎn)變?yōu)橹饕腤eb應(yīng)用技術(shù)。鄭彥寧和化柏林[4]認(rèn)為知識(shí)的利用具有普遍性,從數(shù)據(jù)變成信息的過(guò)程需要知識(shí),知識(shí)作用于數(shù)據(jù)轉(zhuǎn)變?yōu)樾畔⒌霓D(zhuǎn)化過(guò)程之中。因此知識(shí)的加工、萃取從一定意義上來(lái)講也可以是對(duì)數(shù)據(jù)和信息的精煉。綜上,本文認(rèn)為知識(shí)萃取是指從數(shù)據(jù)、信息、知識(shí)等中,對(duì)有意義的知識(shí)元進(jìn)行整合、加工和提煉,再將知識(shí)存入知識(shí)庫(kù)之中,使知識(shí)更加容易被固化、傳承,并創(chuàng)造出更大的價(jià)值。

3 知識(shí)萃取的技術(shù)研究

3.1 知識(shí)萃取發(fā)展面臨的問(wèn)題

在大數(shù)據(jù)時(shí)代,互聯(lián)網(wǎng)成為了用戶分享的平臺(tái),用戶生成內(nèi)容逐漸增多并廣泛傳播,給知識(shí)萃取的發(fā)展帶來(lái)了極大的挑戰(zhàn)。用戶生成內(nèi)容是指由用戶創(chuàng)作并發(fā)布在維基百科、知乎、微博等社會(huì)化媒體平臺(tái)上的文字、圖片、音頻、視頻等內(nèi)容[5]。用戶在互聯(lián)網(wǎng)上隨意發(fā)表觀點(diǎn)、修改詞條等行為,使互聯(lián)網(wǎng)上存在大量基于用戶生成內(nèi)容的碎片化知識(shí)內(nèi)容。由于碎片化知識(shí)具有表征情境性、結(jié)構(gòu)瑕疵性、領(lǐng)域多樣性等特征,增加了用戶精準(zhǔn)把握知識(shí)的難度,使知識(shí)萃取面臨了一些問(wèn)題。

(1)隱形知識(shí)的轉(zhuǎn)化。波蘭尼將知識(shí)分為隱性知識(shí)和顯性知識(shí),顯性知識(shí)是指那些已經(jīng)被證實(shí)的,可以用語(yǔ)言、文字、圖表等表述的知識(shí)。顯性知識(shí)萃取是知識(shí)萃取的核心之一,也是知識(shí)工程的核心之一[2]。隱性知識(shí)又被稱為默會(huì)知識(shí)、意會(huì)知識(shí),是指不可以用文字、符號(hào)、圖表等表示出來(lái),而隱藏于人們的頭腦以及日常行動(dòng)之中的知識(shí)。但是隱性知識(shí)卻不能直接被萃取,需要將其轉(zhuǎn)化為顯性知識(shí),才能進(jìn)行知識(shí)萃取,以便更好地保留并發(fā)揮出隱性知識(shí)的價(jià)值。因此如何進(jìn)行隱性知識(shí)萃取或者將隱性知識(shí)經(jīng)過(guò)轉(zhuǎn)化后再進(jìn)行萃取,是學(xué)者需要解決的問(wèn)題,同時(shí)也是知識(shí)萃取研究所面臨的難題之一。

(2)冗余知識(shí)的約簡(jiǎn)和提優(yōu)。在大數(shù)據(jù)環(huán)境下互聯(lián)網(wǎng)發(fā)展迅速,任何人都可以通過(guò)社會(huì)化媒體平臺(tái)發(fā)表觀點(diǎn)。過(guò)多的用戶生成內(nèi)容使知識(shí)的數(shù)量不斷增加,其復(fù)雜性也隨之增加。由于知識(shí)的劃分不明確,同時(shí)每名用戶都擁有著自己的知識(shí)結(jié)構(gòu),所以往往會(huì)存在著一些重復(fù)或者不被他人所認(rèn)知的知識(shí)。每名用戶也都有著屬于自己的專業(yè)性知識(shí),但是由于用戶生成內(nèi)容過(guò)多,用戶常常會(huì)攝取到一些非自身專業(yè)的知識(shí)。這些現(xiàn)象導(dǎo)致了知識(shí)存在冗余,增加了用戶吸收知識(shí)的時(shí)間和精力。因此如何對(duì)這些冗余的知識(shí)進(jìn)行約簡(jiǎn)并擇優(yōu)提取,是知識(shí)萃取研究所面臨的難題之一。

(3)碎片化知識(shí)的補(bǔ)全。在大數(shù)據(jù)環(huán)境下會(huì)產(chǎn)生很多基于知識(shí)領(lǐng)域的情境知識(shí),這些情境知識(shí)是基于當(dāng)前某些特定的背景和環(huán)境產(chǎn)生的,是不完整的,并且無(wú)法獨(dú)立地表示某一領(lǐng)域概念。同時(shí)大量的用戶生成內(nèi)容使知識(shí)碎片化,用戶在使用過(guò)程中往往會(huì)出現(xiàn)斷章取義等情況,無(wú)法真正了解知識(shí)所表達(dá)的完整含義,這樣就會(huì)使得知識(shí)庫(kù)中的實(shí)體往往會(huì)存在信息缺失或不完整的情況。并且隨著社會(huì)的不斷進(jìn)步,會(huì)產(chǎn)生很多新知識(shí)存儲(chǔ)到知識(shí)庫(kù)中。因此如何識(shí)別不完整知識(shí)并將其進(jìn)行情景化擴(kuò)充和補(bǔ)全,是知識(shí)萃取研究所面臨的難題之一。

(4)跨學(xué)科知識(shí)的規(guī)范化。隨著社會(huì)的不斷進(jìn)步發(fā)展,涌現(xiàn)出了許多不同的學(xué)科。不同學(xué)科之間的知識(shí)交叉流動(dòng),又發(fā)展出許多新的交叉學(xué)科,如生物化學(xué)等。學(xué)科知識(shí)大多存在于圖書、論文等傳統(tǒng)文獻(xiàn)之中。學(xué)科的不斷演化以及學(xué)科之間的交叉融合使得很多不同的詞語(yǔ)卻被用于表達(dá)同一概念。由于學(xué)術(shù)環(huán)境的不同,不同學(xué)科對(duì)同一知識(shí)的理解和表達(dá)不盡相同,使知識(shí)存在語(yǔ)義問(wèn)題。而且目前跨領(lǐng)域研究十分普遍,但是這種現(xiàn)象對(duì)跨領(lǐng)域研究會(huì)產(chǎn)生一定的不利影響。因此,如何規(guī)范這些存在語(yǔ)義問(wèn)題的領(lǐng)域知識(shí),方便學(xué)者的跨領(lǐng)域研究,是知識(shí)萃取研究所面臨的難題之一。

為了解決上述四個(gè)問(wèn)題,本研究將知識(shí)萃取的技術(shù)劃分為四個(gè)方面,即知識(shí)的轉(zhuǎn)化、知識(shí)的約簡(jiǎn)、知識(shí)的補(bǔ)全、知識(shí)的規(guī)范。很多學(xué)者都在這四個(gè)方面進(jìn)行了大量研究,提出并創(chuàng)新了知識(shí)萃取的技術(shù),在一定程度上解決了上述所論述的知識(shí)萃取發(fā)展所面臨的問(wèn)題,但是有些技術(shù)可能還不是非常成熟,有待后續(xù)的創(chuàng)新完善和發(fā)展。

3.2 知識(shí)萃取的技術(shù)

3.2.1 知識(shí)的轉(zhuǎn)化

本體和神經(jīng)網(wǎng)絡(luò)是實(shí)現(xiàn)知識(shí)轉(zhuǎn)化的有效技術(shù)。本體作為語(yǔ)義Web應(yīng)用的核心,利用本體庫(kù)可以實(shí)現(xiàn)隱性知識(shí)到顯性知識(shí)的轉(zhuǎn)化過(guò)程。周寧等人[6]對(duì)MUDs(Multi-User Dungeon)進(jìn)行改進(jìn),提出了一種基于MUDs的新模型。該模型可以將用戶輸入的文本和概念圖中的信息抽取出來(lái),經(jīng)過(guò)本體服務(wù)器的分析提取出新的知識(shí),存儲(chǔ)到本體庫(kù)之中,實(shí)現(xiàn)知識(shí)的轉(zhuǎn)化過(guò)程。神經(jīng)網(wǎng)絡(luò)規(guī)則抽取算法是一種有效獲取隱性知識(shí)的手段[7]。Luis E.Zárate等人[8]提出了一種新的方法——FCANN,F(xiàn)CANN是一種可以通過(guò)形式概念分析(Formal Concept Analysis, FCA)從人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks, ANN)中提取和表示知識(shí)的方法。FCANN方法的實(shí)現(xiàn)共有8個(gè)步驟,具體如圖1所示。由于隱性知識(shí)很難被提取出來(lái),人類無(wú)法吸收網(wǎng)絡(luò)中所保存的知識(shí),而FCA可以從先前訓(xùn)練的神經(jīng)網(wǎng)絡(luò)中提取和表示知識(shí)。所以FCANN就利用FCA從先前訓(xùn)練的神經(jīng)網(wǎng)絡(luò)中提取和表示靜止?fàn)顟B(tài)下的物理過(guò)程的知識(shí),滿足符號(hào)表示和易于理解的要求。

某些學(xué)者提出的模型也可以實(shí)現(xiàn)隱性知識(shí)的轉(zhuǎn)化。野中郁次郎提出的知識(shí)轉(zhuǎn)換生成模型——SECI(Socialization Externalization Combination Internalization)模型[9],包括社會(huì)化、外在化、組合化、內(nèi)在化四個(gè)過(guò)程。外化過(guò)程可以用比喻或類比等方式將隱性知識(shí)轉(zhuǎn)化為顯性知識(shí),再通過(guò)組合化過(guò)程對(duì)顯性知識(shí)進(jìn)行匯總,使知識(shí)的價(jià)值呈螺旋式上升。吳慶海[10]在企業(yè)知識(shí)應(yīng)用的基礎(chǔ)上,提出了知識(shí)萃取應(yīng)用框架(Knowledge Extraction Application Framework, KEAF)模型。KEAF能夠?qū)⒋鎯?chǔ)于企業(yè)員工大腦中的經(jīng)驗(yàn)萃取出來(lái)。這些經(jīng)驗(yàn)作為隱性知識(shí)通過(guò)KEAF模型萃取出來(lái),并讓員工掌握其中的精髓,可以達(dá)到提升知識(shí)創(chuàng)造的效率和質(zhì)量的目的,從而為企業(yè)創(chuàng)造出更大的價(jià)值。

3.2.2 知識(shí)的約簡(jiǎn)

粗糙集理論和模糊推理可以實(shí)現(xiàn)知識(shí)的約簡(jiǎn),是知識(shí)萃取的主要技術(shù)。粗糙集理論提供了一種從決策系統(tǒng)或訓(xùn)練集中尋找屬性(條件屬性、決策屬性等),并且自動(dòng)去除屬性冗余成分的知識(shí)萃取方法,能夠有效實(shí)現(xiàn)知識(shí)的約簡(jiǎn)。模糊推理模型是可以讓用戶通過(guò)容易理解的模糊規(guī)則深入了解位置的系統(tǒng),也是一種能夠處理復(fù)雜的、非線性的動(dòng)態(tài)系統(tǒng)。Xu Hua等人[11]提出基于粗糙集的多機(jī)器人協(xié)作系統(tǒng)(Cooperative Multiple Robot Systems, CMRS),該系統(tǒng)是動(dòng)態(tài)知識(shí)萃取方法,其中多知識(shí)的機(jī)器人具有識(shí)別環(huán)境變化的能力,能夠做出更加可靠的決策。Wu Qingxiang等人[12]開(kāi)發(fā)了一種尋找多重約簡(jiǎn)的算法,該算法可以用于從UCI機(jī)器學(xué)習(xí)存儲(chǔ)庫(kù)中找到數(shù)據(jù)集中的多重約簡(jiǎn)。梁宗經(jīng)等人[13]基于粗糙集理論對(duì)高校網(wǎng)站信息進(jìn)行屬性約簡(jiǎn)、規(guī)則提取,最終推導(dǎo)出12條決策規(guī)則用于后續(xù)的實(shí)證證明。Hanli Wang等人[14]提出的基于多目標(biāo)層次遺傳算法(Multi-objective Hierarchical Genetic Algovithm, MOHGA)的新方案,此方案是一種基于規(guī)則的知識(shí)萃取方法,其流程如圖2所示。該方法可以使模糊集和規(guī)則被最優(yōu)簡(jiǎn)化,消除規(guī)則庫(kù)中的冗余。

有學(xué)者還提出了其他可以實(shí)現(xiàn)知識(shí)約簡(jiǎn)的方法或模型。冷伏海等人[15]提出了面向科技文獻(xiàn)的混合語(yǔ)義信息抽取方法,該方法可以有效抽取科技文獻(xiàn)中的研究方法和性能指標(biāo)等,達(dá)到去除冗余信息的目的。朱丹浩等人[16]因?yàn)橹形臋C(jī)構(gòu)名結(jié)構(gòu)復(fù)雜、識(shí)別難度大而提出的基于深度學(xué)習(xí)的循環(huán)神經(jīng)網(wǎng)絡(luò)方法,可以有效提高對(duì)中文機(jī)構(gòu)名稱的識(shí)別。周寧等人[17]提出了基于XML(eXtensible Markwp Language)平臺(tái)的知識(shí)元抽取模型,該模型需要對(duì)基本知識(shí)元的結(jié)構(gòu)、長(zhǎng)度、內(nèi)容三個(gè)方面進(jìn)行解析和約束,抽取出知識(shí)元再存入到數(shù)據(jù)庫(kù)中。

3.2.3 知識(shí)的補(bǔ)全

貝葉斯網(wǎng)絡(luò)和知識(shí)元抽取可以很好地對(duì)知識(shí)進(jìn)行補(bǔ)全。貝葉斯網(wǎng)絡(luò)作為一種概率模型,可以學(xué)習(xí)和表示不確定和粗糙的知識(shí),完成概率推理[18]。同時(shí)貝葉斯網(wǎng)絡(luò)很容易被解釋,可以為提取的知識(shí)提供透明的洞察力,為決策過(guò)程提供信心。沈嘉懿等人[19]基于中文機(jī)構(gòu)名有多個(gè)簡(jiǎn)稱、全稱中實(shí)體過(guò)多等問(wèn)題,提出了一種基于規(guī)則的中文組織機(jī)構(gòu)全稱和簡(jiǎn)稱識(shí)別的方法。在中文組織機(jī)構(gòu)全稱識(shí)別過(guò)程中,通過(guò)規(guī)則匹配和貝葉斯概率模型確定組織機(jī)構(gòu)名稱的左邊界,通過(guò)機(jī)構(gòu)后綴詞獲得組織機(jī)構(gòu)名稱的右邊界。而中文組織機(jī)構(gòu)簡(jiǎn)稱的識(shí)別是基于全稱識(shí)別的,可以將簡(jiǎn)稱和全稱進(jìn)行匹配,一定程度上補(bǔ)全中文組織機(jī)構(gòu)簡(jiǎn)稱。

董坤[20]提出了基于知識(shí)元的非遺知識(shí)抽取與組織方法,該方法從最細(xì)粒度的知識(shí)元層面出發(fā),通過(guò)構(gòu)建非遺知識(shí)語(yǔ)料庫(kù)、知識(shí)元抽取、知識(shí)元關(guān)聯(lián)、知識(shí)元表達(dá)這四個(gè)步驟構(gòu)建其組織框架,實(shí)現(xiàn)了對(duì)非遺知識(shí)的完整揭示與多元化表達(dá)。王忠義等人[21]提出了一種基于碎片化UGC(User Generated Content)的知識(shí)元抽取模型,如圖3所示。該模型通過(guò)BTM(Biterm Topic Model)主題分割方法從用戶生成內(nèi)容中抽取知識(shí)要素,然后使用K-means方法聚類知識(shí)要素,最后根據(jù)知識(shí)要素的屬性和聚類結(jié)果生成對(duì)應(yīng)的UGC知識(shí)元。并且作者還對(duì)此模型進(jìn)行了實(shí)驗(yàn)分析,分析結(jié)果可以證明該模型能夠解決知識(shí)碎片化的問(wèn)題,生成具有完整含義的知識(shí)元,具有科學(xué)性和實(shí)用性。

有學(xué)者也提出了一些其他方法實(shí)現(xiàn)知識(shí)補(bǔ)全。Heru Agus Stantoso等人[22]將概念層次結(jié)構(gòu)作為背景知識(shí),將背景知識(shí)融入到OWL(Web Ontology Language)本體的構(gòu)建之中,提出了一種基于關(guān)系數(shù)據(jù)庫(kù)的本體抽取方法。俞琰等人[23]提出了一種融合論文關(guān)鍵詞知識(shí)的專利術(shù)語(yǔ)抽取方法,利用論文中豐富的關(guān)鍵詞知識(shí)獲取專利文本之外的特征,彌補(bǔ)專利語(yǔ)料庫(kù)中信息不足的缺陷,提高專利術(shù)語(yǔ)抽取的準(zhǔn)確率。

3.2.4 知識(shí)的規(guī)范

在知識(shí)萃取的過(guò)程中可以使用命名實(shí)體識(shí)別(概念抽取)、實(shí)體關(guān)系抽取以及屬性抽取等技術(shù)實(shí)現(xiàn)知識(shí)的規(guī)范化處理。本體、自然語(yǔ)言處理(Natural Language Processing, NLP)可以有效解決某個(gè)實(shí)體有多種含義的語(yǔ)義問(wèn)題。孫榮等人[24]提出的基于規(guī)則的事件信息抽取方法,可以有效抽取事件信息,解決一詞多義的現(xiàn)象。劉秀磊等人[25]提出的基于長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)和卷積網(wǎng)絡(luò)深度機(jī)器學(xué)習(xí)的關(guān)系抽取技術(shù),對(duì)科技情報(bào)中預(yù)定義的關(guān)系進(jìn)行抽取,增強(qiáng)了對(duì)科技情報(bào)對(duì)象的感知刻畫能力。丁君軍等人[26]提出的基于規(guī)則的學(xué)術(shù)概念屬性抽取方法,可以從學(xué)術(shù)文獻(xiàn)中抽取出對(duì)某一學(xué)術(shù)概念的屬性,從而構(gòu)建屬性描述知識(shí)庫(kù)。Jon D Patrick等人[27]提出的基于自然語(yǔ)言處理的系統(tǒng)框架,可以有效地對(duì)臨床病歷中縮寫語(yǔ)等進(jìn)行校對(duì)、規(guī)范。

化柏林[28]提出了基于NLP的知識(shí)抽取系統(tǒng)架構(gòu),如圖4所示,該架構(gòu)包括自然語(yǔ)言處理和知識(shí)抽取兩個(gè)部分。自然語(yǔ)言處理部分,需要對(duì)科學(xué)文獻(xiàn)中的內(nèi)容等進(jìn)行句子切分、詞性標(biāo)注、句法分析等8個(gè)過(guò)程。知識(shí)抽取部分包括分析篇章結(jié)構(gòu)、分析論文類型、知識(shí)表示、知識(shí)抽取4大模塊。只有充分利用自然語(yǔ)言處理技術(shù),才能進(jìn)行知識(shí)抽取。經(jīng)過(guò)處理后的規(guī)范化句子,需要將其轉(zhuǎn)化為計(jì)算機(jī)可以識(shí)別的形式存儲(chǔ)到知識(shí)庫(kù)之中。

綜上所述,國(guó)內(nèi)外學(xué)者實(shí)現(xiàn)知識(shí)萃取主要是通過(guò)本體和神經(jīng)網(wǎng)絡(luò)、粗糙集理論和模糊推理、貝葉斯網(wǎng)絡(luò)、實(shí)體抽取等技術(shù)來(lái)實(shí)現(xiàn)。國(guó)內(nèi)學(xué)者的研究?jī)?nèi)容主要集中于本體、實(shí)體抽取、自然語(yǔ)言處理等技術(shù),以及企業(yè)知識(shí)管理、知識(shí)融合、知識(shí)圖譜等領(lǐng)域。國(guó)外學(xué)者的研究?jī)?nèi)容主要集中在神經(jīng)網(wǎng)絡(luò)、粗糙集理論、模糊推理等技術(shù),以及計(jì)算機(jī)科學(xué)和工程學(xué)等領(lǐng)域。國(guó)內(nèi)外學(xué)者也都更加側(cè)重于知識(shí)萃取技術(shù)的實(shí)際應(yīng)用,通過(guò)一些思考或想法對(duì)已有模型進(jìn)行修改或改進(jìn),亦或借助某項(xiàng)技術(shù)完成某一模型或算法的構(gòu)建,來(lái)實(shí)現(xiàn)知識(shí)萃取,以此投入到某一實(shí)際應(yīng)用之中。

4 知識(shí)萃取的應(yīng)用

企業(yè)管理領(lǐng)域誕生出了許多有關(guān)知識(shí)萃取的典型方法,包括聯(lián)想復(fù)盤、華為知識(shí)收割、美國(guó)陸軍事后回顧等。最早做知識(shí)萃取的就是聯(lián)想的聯(lián)想復(fù)盤。聯(lián)想復(fù)盤是由聯(lián)想集團(tuán)創(chuàng)始人柳傳志先生提出的。聯(lián)想復(fù)盤學(xué)習(xí)模式包括回顧目標(biāo)、評(píng)估結(jié)果、分析原因、總結(jié)經(jīng)驗(yàn)四個(gè)步驟[29],旨在通過(guò)總結(jié)和分析過(guò)往事件,發(fā)現(xiàn)其中具有規(guī)律性的內(nèi)容[30],從而形成類似知識(shí)庫(kù)的智慧結(jié)晶,為以后的事件作出指導(dǎo)和借鑒。

在計(jì)算機(jī)科學(xué)領(lǐng)域,Jung Hanmin等人[3]提出了信息抽取系統(tǒng)——POSIE(POSTECH Information Extraction System),POSIE是在問(wèn)答框架上混合自動(dòng)引導(dǎo)和一系列學(xué)習(xí)算法的知識(shí)萃取系統(tǒng)。POSIE使用結(jié)構(gòu)化的Web文檔、字典和語(yǔ)義信息來(lái)設(shè)置實(shí)例和上下文的模式,用最少的人力來(lái)驗(yàn)證這些模式,然后迭代地發(fā)現(xiàn)新的模式。Fernando Gomez等人[31]提出了一種從文本中提取知識(shí)的系統(tǒng),是一個(gè)完全基于語(yǔ)義解釋器輸出的知識(shí)獲取系統(tǒng)(Knowledge Acquisition System, KAS),旨在實(shí)現(xiàn)大規(guī)模的語(yǔ)義解釋。

在生物醫(yī)學(xué)領(lǐng)域,電子病歷(Electronic Medical Record, EMR)是豐富的臨床信息來(lái)源。但大量非結(jié)構(gòu)化文本的存在阻礙了電子病歷的發(fā)展,面對(duì)這種挑戰(zhàn),Guergana K Savova等人[32]提出了臨床文本分析與知識(shí)萃取系統(tǒng)(Clinical Text Analysis and Knowledge Extraction System, cTAKES),cTAKES結(jié)合了基于規(guī)則和機(jī)器學(xué)習(xí)的技術(shù),旨在從臨床敘述中提取信息。隨著電子病歷的需求不斷增長(zhǎng),人們對(duì)醫(yī)療實(shí)體和關(guān)系抽取技術(shù)產(chǎn)生了極大的興趣。Zhao Qing等人[33]提出了知識(shí)增強(qiáng)關(guān)系抽取(Knowledge-Enhanced Relation Extraction, KERE)模型,以提高電子病歷中關(guān)系抽取的性能,同時(shí)KERE模型還具有減少語(yǔ)義歧義和人工標(biāo)注的能力。

在軍事研究領(lǐng)域,武器裝備的制造和管理是非常重要的。中國(guó)運(yùn)載火箭技術(shù)研究院率先開(kāi)展了有關(guān)知識(shí)萃取的研究工作,將存在于人腦中的想法和經(jīng)驗(yàn)轉(zhuǎn)化為大家共同擁有的財(cái)富,為大量的寶貴知識(shí)資源提供了知識(shí)共享的途徑。中國(guó)運(yùn)載火箭技術(shù)研究院提出了面向型號(hào)的關(guān)鍵知識(shí)萃取及表達(dá)方法[34]以及面向型號(hào)的知識(shí)萃取系統(tǒng)建設(shè)[35],力求提高航天型號(hào)知識(shí)的共享與利用以及航天型號(hào)的核心競(jìng)爭(zhēng)力。北京臨近空間飛行器系統(tǒng)工程研究所的研究員提出了基于知識(shí)標(biāo)簽的“3+4+5+2”式知識(shí)萃取模型,對(duì)人腦中存在的隱性知識(shí)進(jìn)行挖掘,使知識(shí)外化和群化,進(jìn)而使他人得到分享并校驗(yàn)知識(shí)[36]。Liu Chenguang等人[37]提出了一種基于條件隨機(jī)場(chǎng)和句法分析樹(shù)的實(shí)體關(guān)系抽取方法,優(yōu)化了軍事裝備領(lǐng)域知識(shí)圖譜的構(gòu)建過(guò)程。

5 知識(shí)萃取研究展望

5.1 知識(shí)萃取的技術(shù)創(chuàng)新和發(fā)展

知識(shí)萃取的技術(shù)發(fā)展包括已有技術(shù)的組合應(yīng)用、已有技術(shù)的突破發(fā)展以及新技術(shù)的創(chuàng)新發(fā)現(xiàn)。現(xiàn)有的知識(shí)萃取技術(shù)種類繁多,但是大多都不是獨(dú)立存在的,而是相互融合,發(fā)揮各自的技術(shù)優(yōu)勢(shì)。目前許多知識(shí)萃取技術(shù)都同時(shí)存在著本體和自然語(yǔ)言處理的影子。張敏等人[38]在構(gòu)建多維語(yǔ)義索引的時(shí)候就結(jié)合了基于本體和基于自然語(yǔ)言處理的技術(shù),兩者之間的優(yōu)勢(shì)互補(bǔ),構(gòu)成了更加豐富的多維語(yǔ)義索引。因此知識(shí)萃取的技術(shù)之間相互融合、互利互助是未來(lái)的研究方向之一,可以全方位地實(shí)現(xiàn)知識(shí)萃取的價(jià)值。

人工神經(jīng)網(wǎng)絡(luò)是知識(shí)萃取的重要技術(shù)之一,知識(shí)萃取被證明是人工神經(jīng)網(wǎng)絡(luò)領(lǐng)域最有興趣的開(kāi)放問(wèn)題之一,所以人工神經(jīng)網(wǎng)絡(luò)技術(shù)的突破是值得廣大學(xué)者關(guān)注并繼續(xù)研究的。由于人們對(duì)人工神經(jīng)網(wǎng)絡(luò)系統(tǒng)內(nèi)部發(fā)生的事情知之甚少,認(rèn)為其沒(méi)有解釋能力,無(wú)法解釋其潛在的推理機(jī)制,因此人工神經(jīng)網(wǎng)絡(luò)通常被批評(píng)為“黑盒”模型。為了克服人工神經(jīng)網(wǎng)絡(luò)被稱為“黑盒”模型的情況,許多學(xué)者都做出了新的嘗試。Garcez等人[39]做了從訓(xùn)練有素的網(wǎng)絡(luò)中提取象征性知識(shí)的第一次嘗試。Greer B.Kingston等人[40]考慮到模型關(guān)系中的不確定性,提出了一種從人工神經(jīng)網(wǎng)絡(luò)的權(quán)重中提取概率信息的通用框架,以評(píng)估建模的輸入—輸出關(guān)系。因此在未來(lái)可以著重開(kāi)發(fā)能夠更加全方面來(lái)準(zhǔn)確量化人工神經(jīng)網(wǎng)絡(luò)模型重要性的技術(shù),最好解釋其內(nèi)部推理機(jī)制,增強(qiáng)其在不同領(lǐng)域中的應(yīng)用實(shí)用性。

知識(shí)萃取是人工智能領(lǐng)域知識(shí)獲取的關(guān)鍵技術(shù)之一。知識(shí)工程是人工智能的主要成果之一,知識(shí)工程的根本目的是解決人工智能中知識(shí)獲取的問(wèn)題。知識(shí)工程包括知識(shí)獲取、知識(shí)表示和知識(shí)利用三大過(guò)程。知識(shí)萃取是知識(shí)獲取的方式之一,但是知識(shí)獲取卻一直是人工智能研究的難點(diǎn)。所以知識(shí)萃取技術(shù)的創(chuàng)新發(fā)展可以為人工智能的發(fā)展帶去原動(dòng)力。因此如何發(fā)展知識(shí)萃取技術(shù),從而攻克知識(shí)獲取的難題,促進(jìn)人工智能的發(fā)展,進(jìn)而豐富知識(shí)工程,是未來(lái)學(xué)者們的研究方向之一。

5.2 知識(shí)庫(kù)的構(gòu)建和維護(hù)

知識(shí)庫(kù)的構(gòu)建與維護(hù)一直是知識(shí)萃取研究的熱點(diǎn),同時(shí)知識(shí)庫(kù)的動(dòng)態(tài)更新和維護(hù)一直是知識(shí)工程面臨的一大難題。知識(shí)萃取是知識(shí)獲取的有效方式之一,知識(shí)獲取又是知識(shí)庫(kù)構(gòu)建的前提,所以知識(shí)萃取對(duì)于知識(shí)庫(kù)的構(gòu)建是十分重要的。在知識(shí)萃取的過(guò)程中,經(jīng)過(guò)轉(zhuǎn)化、約簡(jiǎn)、補(bǔ)全、規(guī)范等操作的知識(shí)都會(huì)存入于知識(shí)庫(kù)之中。然而知識(shí)庫(kù)之中的資源是有一定的生命周期的,在一定的時(shí)期內(nèi),時(shí)效性比較差的資源使用價(jià)值就會(huì)下降。如果仍舊將這些資源保留在知識(shí)庫(kù)之中,會(huì)給知識(shí)庫(kù)的內(nèi)存和運(yùn)行造成壓力。所以要對(duì)知識(shí)庫(kù)中的資源進(jìn)行定期的管理。同時(shí)隨著社會(huì)的不斷發(fā)展,會(huì)產(chǎn)生源源不斷的新知識(shí)并保存到知識(shí)庫(kù)之中,使知識(shí)庫(kù)中資源具有時(shí)代性。另外知識(shí)萃取的技術(shù)實(shí)現(xiàn)需要算法,也需要計(jì)算機(jī)運(yùn)行算法。但是算法和計(jì)算機(jī)都存在潛在的危險(xiǎn)以及不確定性,需要有專業(yè)人員對(duì)其進(jìn)行定期的維護(hù),防止出現(xiàn)算法錯(cuò)誤的情況。因此在知識(shí)萃取中,知識(shí)庫(kù)的構(gòu)建和維護(hù)是至關(guān)重要的,是知識(shí)萃取未來(lái)研究的熱點(diǎn)之一。

5.3 知識(shí)圖譜的應(yīng)用和發(fā)展

知識(shí)萃取是知識(shí)圖譜構(gòu)建的主要技術(shù)之一,為構(gòu)建知識(shí)圖譜提供數(shù)據(jù)基礎(chǔ)。關(guān)鍵的萃取技術(shù)包括實(shí)體抽取、關(guān)系抽取、屬性抽取、事件抽取等[41],其中實(shí)體抽取和識(shí)別是知識(shí)圖譜構(gòu)建的核心。由于知識(shí)的來(lái)源十分龐雜,很容易出現(xiàn)知識(shí)的冗余或錯(cuò)誤,所以構(gòu)建知識(shí)圖譜的本體是一個(gè)難題[42]。知識(shí)圖譜中的知識(shí)需要補(bǔ)全與更新,李綱等人在構(gòu)建國(guó)家安全事件知識(shí)圖譜的過(guò)程中就提及了對(duì)模式層和數(shù)據(jù)層的信息的補(bǔ)全和更新[43]。因此需要研究更加通用的實(shí)體抽取技術(shù)和更加精細(xì)的算法來(lái)解釋其知識(shí)來(lái)源,開(kāi)發(fā)更加方便的本體構(gòu)建方法,探究動(dòng)態(tài)的知識(shí)補(bǔ)全模型,以構(gòu)建高質(zhì)量的知識(shí)圖譜,更加清晰地展示技術(shù)的演變。這些都將成為未來(lái)知識(shí)萃取的重點(diǎn)研究方向。同時(shí)知識(shí)圖譜的發(fā)展也方便了科研人員搜索、跟蹤和更新技術(shù)文檔,提高了他們的工作效率。科研人員之間的學(xué)術(shù)交流也為知識(shí)圖譜的可持續(xù)發(fā)展提供了寶貴的財(cái)富。

5.4 知識(shí)融合的發(fā)展

知識(shí)萃取是知識(shí)融合的重要環(huán)節(jié),知識(shí)融合是知識(shí)萃取的接續(xù)發(fā)展。知識(shí)經(jīng)過(guò)萃取和融合會(huì)更好地發(fā)揮價(jià)值,知識(shí)融合是通過(guò)實(shí)體消歧、實(shí)體對(duì)齊和知識(shí)合并等方法,對(duì)經(jīng)過(guò)知識(shí)萃取的知識(shí)進(jìn)行融合,從而形成新知識(shí)或新的知識(shí)組合的過(guò)程。知識(shí)融合是一個(gè)動(dòng)態(tài)的過(guò)程,經(jīng)過(guò)萃取的知識(shí)單元可以更好地進(jìn)行知識(shí)融合,反過(guò)來(lái)更好的知識(shí)融合也會(huì)促進(jìn)知識(shí)萃取的發(fā)展。知識(shí)萃取過(guò)程需要經(jīng)過(guò)不斷的評(píng)價(jià)和反饋,以提高知識(shí)融合的效率[44]。知識(shí)融合的過(guò)程中會(huì)產(chǎn)生新知識(shí),新知識(shí)會(huì)給知識(shí)萃取帶來(lái)挑戰(zhàn),但是也會(huì)促進(jìn)知識(shí)萃取的技術(shù)發(fā)展。知識(shí)融合的領(lǐng)域非常廣泛,包括醫(yī)療、軍事、商業(yè)等。知識(shí)融合在不同領(lǐng)域的發(fā)展也會(huì)給知識(shí)萃取帶來(lái)新的機(jī)會(huì)。因此知識(shí)萃取和知識(shí)融合二者之間相互協(xié)調(diào)發(fā)展,可以更好地為用戶提供知識(shí)服務(wù)。

6 結(jié)語(yǔ)

知識(shí)萃取可以幫助人們從大量的異構(gòu)知識(shí)中萃取出精華。許多學(xué)者不斷針對(duì)知識(shí)萃取進(jìn)行了技術(shù)研究和應(yīng)用開(kāi)發(fā),不斷豐富和發(fā)展了知識(shí)萃取的內(nèi)容。但是當(dāng)前知識(shí)萃取的研究仍處于初級(jí)階段,一些知識(shí)萃取的技術(shù)研究只停留在理論層面,沒(méi)有更加深入的實(shí)踐。所以知識(shí)萃取的未來(lái)研究仍有很大的發(fā)展空間,其研究方向和領(lǐng)域也需要不斷深化拓展。相信知識(shí)萃取在未來(lái)較長(zhǎng)一段時(shí)間內(nèi)仍然是學(xué)者們研究的熱點(diǎn)問(wèn)題,可以為知識(shí)工程的發(fā)展奠定技術(shù)基礎(chǔ)。

參考文獻(xiàn):

[1] 吳慶海.企業(yè)知識(shí)萃取理論與實(shí)踐研究[J].知識(shí)管理論壇,2016,1(4):243-250.

[2] 化柏林,張新民.從知識(shí)抽取相關(guān)概念辨析看知識(shí)抽取的特點(diǎn)和發(fā)展趨勢(shì)[J].情報(bào)科學(xué),2010,28(2):311-315.

[3] HANMIN J,EUNJI Y,DONGSEOK K,et al.Information extraction with automatic knowledge expansion[J].Information Processing and Management,2005,41(2):217-242.

[4] 鄭彥寧,化柏林.數(shù)據(jù)、信息、知識(shí)與情報(bào)轉(zhuǎn)化關(guān)系的探討[J].情報(bào)理論與實(shí)踐,2011,34(7):1-4.

[5] 趙宇翔,范哲,朱慶華.用戶生成內(nèi)容(UGC)概念解析及研究進(jìn)展[J].中國(guó)圖書館學(xué)報(bào),2012,38(5):68-81.

[6] 周寧,王淼.基于MUDs的面向特定領(lǐng)域的知識(shí)管理模型研究[J].現(xiàn)代圖書情報(bào)技術(shù),2008,164(5):33-38.

[7] 孫晨,周志華,陳兆乾.神經(jīng)網(wǎng)絡(luò)規(guī)則抽取研究[J].計(jì)算機(jī)應(yīng)用研究,2000(2):34-37.

[8] Zárate L E,DIAS S M,SONG M A J.FCANN:A new approach for extraction and representation of knowledge from ANN trained via Formal Concept Analysis[J].Neurocomputing,2008,71(13/14/15):2670-2684.

[9] NONAKA I,TAKEUCHI H.The knowledge-creating Company:How Japanese Companies Create the Dynamics of Innovation[M].New York:Oxford University Press,1995.

[10] 吳慶海.知識(shí)萃取應(yīng)用框架研究與實(shí)務(wù)[J].圖書情報(bào)工作,2019,63(1):65-69.

[11] XU H,JIA P F.A novel dynamic knowledge extraction method in cooperative multiple robot system using rough set[C]//IFIP Advances in Information and Communication Technology,September7-9,2005,Beijing.New York:Springer New York.2005:535-543.

[12] WU Q X,DAVID B.Multi-knowledge extraction and application[C]//Proceeding of the 9th International Conference on Rough Sets,May26-29,2003,Chongqing.Heidelberg:Springer-Verlag Berlin Heidelberg,2003:274-278.

[13] 梁宗經(jīng),曠蕓,雷應(yīng)喜.基于粗糙集理論的高校網(wǎng)站信息知識(shí)發(fā)現(xiàn)[J].現(xiàn)代情報(bào),2010,30(11):19-24.

[14] WANG H,WONG S K,JIN Y C,et al.Multi-objective hierarchical genetic algorithm for interpretable fuzzy rule-based knowledge extraction[J].Fuzzy Sets and Systems,2005,149(1):149-186.

[15] 冷伏海,白如江,祝清松.面向科技文獻(xiàn)的混合語(yǔ)義信息抽取方法研究[J].圖書情報(bào)工作,2013,57(11):112-119.

[16] 朱丹浩,楊蕾,王東波.基于深度學(xué)習(xí)的中文機(jī)構(gòu)名識(shí)別研究:一種漢字級(jí)別的循環(huán)神經(jīng)網(wǎng)絡(luò)方法[J].現(xiàn)代圖書情報(bào)技術(shù),2016(12),36-43.

[17] 周寧,余肖生,劉瑋,等.基于XML平臺(tái)的知識(shí)元表示與抽取研究[J].中國(guó)圖書館學(xué)報(bào),2006(3):41-45.

[18] ZHANG Y C,LAN Y X,F(xiàn)ANG Q,et al.Efficient Reinforcement Learning from Demonstration via Bayesian Network-Based Knowledge Extraction[J].Computational Intelligence and Neuroscience,2021:1-16.

[19] 沈嘉懿,李芳,徐飛玉,等.中文組織機(jī)構(gòu)名稱與簡(jiǎn)稱的識(shí)別[J].中文信息學(xué)報(bào),2007(6):17-21.

[20] 董坤.基于知識(shí)元的非物質(zhì)文化遺產(chǎn)知識(shí)抽取與組織研究[J].情報(bào)理論與實(shí)踐,2021,44(9):148,155-160.

[21] 王忠義,鄭鑫.基于碎片化UGC的知識(shí)元抽取研究[J].情報(bào)理論與實(shí)踐,2021,324(1):188-194.

[22] SANTOSO H A,HAW S C,ABDUL-MEHDI Z T.Ontology extraction from relational database_ Concept hierarchy as background knowledge[J].Knowledge-Based Systems,2011,24(3):457-464.

[23] 俞琰,陳磊,姜金德,等.融合論文關(guān)鍵詞知識(shí)的專利術(shù)語(yǔ)抽取方法[J].圖書情報(bào)工作,2020,64(14):104-111.

[24] 孫榮,周文,劉宗田.用規(guī)則抽取句子中事件信息[J].小型微型計(jì)算機(jī)系統(tǒng),2011,32(11):2309-2314.

[25] 劉秀磊,王延飛,劉思含,等.科技情報(bào)對(duì)象關(guān)系抽取的技術(shù)選擇[J].情報(bào)工程,2018,4(3):39-47.

[26] 丁君軍,鄭彥寧,化柏林.基于規(guī)則的學(xué)術(shù)概念屬性抽取[J].情報(bào)理論與實(shí)踐,2011,34(12):10-14,33.

[27] PATRICK J D,NGUYEN D H M,WANG Y F,et al.A knowledge discovery and reuse pipeline for information extraction in clinical notes[J].Reasearch and applications,2011,18(5):574-579.

[28] 化柏林.基于NLP的知識(shí)抽取系統(tǒng)架構(gòu)研究[J].現(xiàn)代圖書情報(bào)技術(shù),2007(10):38-41.

[29] 徐寧.互聯(lián)網(wǎng)時(shí)代下組織學(xué)習(xí)機(jī)制構(gòu)建:以聯(lián)想復(fù)盤式學(xué)習(xí)模式為案例[J].中國(guó)人力資源開(kāi)發(fā),2016(24):58-62.

[30] 柳傳志.復(fù)盤:最好的學(xué)習(xí)方式[J].新遠(yuǎn)見(jiàn),2013(7):59-61.

[31] FERNANDO G,CARLOS S.Semantic interpretation and knowledge extraction[J].ScienceDirect,2007,20(1):51-60.

[32] SAVOVA G K,MASANZ J J,PHILIP V O,et al.Mayo clinical Text Analysis and Knowledge Extraction System (cTAKES) architecture, component evaluation and applications[J].Application of information technology,2010,17(5):507-513.

[33] ZHAO Q,LI J Q,XU C,et al.Knowledge-Enhanced Relation Extraction for Chinese EMRs[J].Artificial Intelligence,2022,22(4):57-62.

[34] 朱紅,賈倩,楊玉堃,等.面向型號(hào)的關(guān)鍵知識(shí)萃取及表達(dá)方法研究[J].航天工業(yè)管理,2017(4):11-14.

[35] 姜悅,姚星合,郭大慶,等.面向型號(hào)的知識(shí)萃取系統(tǒng)建設(shè)[J].航天工業(yè)管理,2019(4):8-11.

[36] 趙媛心,楊飛,底亞峰,等.基于知識(shí)標(biāo)簽法的專業(yè)知識(shí)萃取與應(yīng)用實(shí)踐[J].航天工業(yè)管理,2019(4):39-43.

[37] LIU C G,YU Y L,LI X X,et al.Application of Entity Relation Extraction Method Under CRF and Syntax Analysis Tree in the Construction of Military Equipment Knowledge Graph[J].IEEE Access,2020(8):200581-200588.

[38] 張敏,丁良萍,劉歡.面向科技文獻(xiàn)的多維語(yǔ)義索引構(gòu)建思路及實(shí)現(xiàn)[J].情報(bào)理論與實(shí)踐,2021,44(8):139-145.

[39] GARCEZ A A,BRODA K,GABBAY D M.Symbolic knowledge extraction from trained neural networks_ A sound approach[J].Aritificial Intelligence,2001,125(1/2):155-207.

[40] KINGSTON G B,MAIER H R,LAMBERT M F.A probabilistic method for assisting knowledge extraction from artificial neural networks used for hydrological prediction[J].Marhematical and Computer Modelling,2006,44(5/6):499-512.

[41] 于瀏洋,郭志剛,陳剛,等.面向知識(shí)圖譜構(gòu)建的知識(shí)抽取技術(shù)綜述[J].信息工程大學(xué)學(xué)報(bào).2020,21(2):227-235.

[42] 覃曉,廖兆琪,施宇,等.知識(shí)圖譜技術(shù)進(jìn)展及展望[J].廣西科學(xué)院學(xué)報(bào),2020,129(3):242-251.

[43] 李綱,王施運(yùn),毛進(jìn),等.面向態(tài)勢(shì)感知的國(guó)家安全事件圖譜構(gòu)建研究[J].情報(bào)學(xué)報(bào),2021,40(11):1164-1175.

[44] 劉曉娟,李廣建,化柏林.知識(shí)融合:概念辨析與界說(shuō)[J].圖書情報(bào)工作,2016,60(13):13-19,32.

作者簡(jiǎn)介:高國(guó)偉,博士,遼寧師范大學(xué)政府管理學(xué)院副教授,碩士生導(dǎo)師,研究方向?yàn)橹R(shí)管理、電子政務(wù)、知識(shí)融合等;康涔,遼寧師范大學(xué)政府管理學(xué)院碩士,研究方向?yàn)橹R(shí)管理、知識(shí)融合等。

收稿日期:2022-12-28本文責(zé)編:孫曉清

主站蜘蛛池模板: 一级一级特黄女人精品毛片| 国产精品分类视频分类一区| 中文字幕欧美日韩| 久久久久国色AV免费观看性色| 精品久久久久久久久久久| 中文字幕有乳无码| 亚洲无码日韩一区| 麻豆精品在线视频| 国产微拍精品| 在线人成精品免费视频| 国产麻豆精品在线观看| 精品一区二区三区水蜜桃| 亚洲国产理论片在线播放| 亚洲一级毛片免费看| 欧美一级高清视频在线播放| 国内精品91| 好紧太爽了视频免费无码| 中文字幕 欧美日韩| 五月天在线网站| 99久久精品无码专区免费| 亚洲欧美一级一级a| 亚洲中文无码h在线观看| 日本不卡免费高清视频| 日本午夜网站| 亚洲丝袜第一页| 亚洲第一色视频| 欧美激情视频二区三区| 免费在线不卡视频| 国产中文一区二区苍井空| 亚洲欧美综合精品久久成人网| 国产成人免费视频精品一区二区| 99国产在线视频| 国产农村妇女精品一二区| 免费毛片a| 一级做a爰片久久毛片毛片| 成人一级免费视频| 亚洲人成网18禁| 热思思久久免费视频| 亚洲中文制服丝袜欧美精品| 性色生活片在线观看| 中文字幕2区| 九色最新网址| 99热这里只有精品2| 欧美另类视频一区二区三区| 韩国自拍偷自拍亚洲精品| 欧美www在线观看| 视频二区中文无码| 国产在线啪| 她的性爱视频| 制服丝袜在线视频香蕉| 日韩无码视频专区| 亚洲中文精品人人永久免费| 免费午夜无码18禁无码影院| 中文字幕波多野不卡一区| 日韩欧美综合在线制服| 欧美性精品不卡在线观看| 国产情侣一区| 久久婷婷国产综合尤物精品| 综合色婷婷| 天天综合天天综合| 久久精品无码专区免费| 国产农村妇女精品一二区| 99国产精品一区二区| 欧美一区二区三区国产精品| 强乱中文字幕在线播放不卡| 91香蕉国产亚洲一二三区| 国产成人欧美| 久久五月天国产自| 天天做天天爱夜夜爽毛片毛片| 欧美精品在线免费| 67194成是人免费无码| 国产精女同一区二区三区久| 伊人福利视频| 午夜精品福利影院| 亚洲最新在线| 国产69囗曝护士吞精在线视频| 乱人伦99久久| 亚洲欧美综合另类图片小说区| 青青极品在线| 亚洲综合色区在线播放2019| 国产亚洲欧美日本一二三本道| 青青网在线国产|