999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

利用SemRep語(yǔ)義網(wǎng)及MeSH語(yǔ)義網(wǎng)表達(dá)單篇論文知識(shí)

2019-06-13 08:02:20
關(guān)鍵詞:語(yǔ)義概念內(nèi)容

知識(shí)組織與表達(dá)是知識(shí)管理領(lǐng)域的核心內(nèi)容,對(duì)科學(xué)論文中蘊(yùn)含知識(shí)的表達(dá)是文本挖掘和知識(shí)發(fā)現(xiàn)的基礎(chǔ)和核心。語(yǔ)義網(wǎng)絡(luò)作為知識(shí)表達(dá)的一種方式,為文本挖掘和知識(shí)發(fā)現(xiàn)后結(jié)果的可視化呈現(xiàn)提供了堅(jiān)實(shí)基礎(chǔ)。語(yǔ)義網(wǎng)絡(luò)是一種文本網(wǎng)絡(luò)表示模型,隨著社會(huì)復(fù)雜網(wǎng)絡(luò)逐漸受到關(guān)注,越來(lái)越多的研究將語(yǔ)義網(wǎng)絡(luò)應(yīng)用于文本挖掘、知識(shí)發(fā)現(xiàn)和知識(shí)圖譜的表示[1]。

目前,有關(guān)單篇科學(xué)論文內(nèi)容表達(dá)的研究較為少見(jiàn)。PubMed數(shù)據(jù)庫(kù)中揭示單篇論文內(nèi)容特征的方式包括論文題目、摘要、關(guān)鍵詞及MeSH主題詞等,缺乏以語(yǔ)義網(wǎng)絡(luò)為基礎(chǔ)的揭示單篇科學(xué)論文內(nèi)容特征的知識(shí)表達(dá)方式。關(guān)于文獻(xiàn)集內(nèi)容語(yǔ)義網(wǎng)絡(luò)表達(dá)的典型代表為Kilicoglu等開(kāi)發(fā)的Semantic MEDLINE自動(dòng)摘要系統(tǒng)[2],利用自然語(yǔ)言處理工具SemRep將文獻(xiàn)摘要集處理為概念及語(yǔ)義關(guān)系集,以語(yǔ)義網(wǎng)絡(luò)圖的形式呈現(xiàn)檢索結(jié)果,為用戶提供直觀清晰的研究?jī)?nèi)容,但僅適用于某一研究主題的文獻(xiàn)集可視化呈現(xiàn),未能實(shí)現(xiàn)單篇論文內(nèi)容的揭示與表達(dá)。

SemRep作為一種基于自然語(yǔ)言處理技術(shù)的數(shù)據(jù)挖掘軟件,以一體化醫(yī)學(xué)語(yǔ)言系統(tǒng)中的超級(jí)詞表、語(yǔ)義網(wǎng)絡(luò)和專家辭典為基礎(chǔ)[3],專指性較強(qiáng),反映學(xué)科知識(shí)也較具體,但從文獻(xiàn)中提取出的語(yǔ)義關(guān)系分散于其挖掘結(jié)果之中,不利于對(duì)所提取的關(guān)系進(jìn)行統(tǒng)計(jì)分析[4]。以MeSH主題詞對(duì)論文內(nèi)容進(jìn)行標(biāo)引是生物醫(yī)學(xué)權(quán)威文獻(xiàn)數(shù)據(jù)庫(kù)中組織和表達(dá)論文內(nèi)容的主要形式,其優(yōu)點(diǎn)是可以排除“多詞一義”、“一詞多義”和詞義含糊現(xiàn)象,使標(biāo)識(shí)與概念盡可能一一對(duì)應(yīng),具有相當(dāng)高的專指度[5],能較為確切地表達(dá)文獻(xiàn)的主題概念,缺點(diǎn)是不能反映MeSH主題詞間的語(yǔ)義關(guān)系。 本文將語(yǔ)義網(wǎng)絡(luò)引入單篇論文內(nèi)容表達(dá)研究領(lǐng)域,并結(jié)合MeSH主題語(yǔ)言與SemRep對(duì)自然語(yǔ)言概念抽取的優(yōu)勢(shì),以SemRep語(yǔ)義網(wǎng)及MeSH語(yǔ)義網(wǎng)的形式呈現(xiàn)單篇論文的研究?jī)?nèi)容,并對(duì)2種網(wǎng)絡(luò)進(jìn)行評(píng)價(jià)比較。

1 數(shù)據(jù)與方法

1.1 研究樣本的選擇

本文利用MedSci 2018年期刊智能查詢系統(tǒng)對(duì)醫(yī)學(xué)期刊進(jìn)行檢索并排行,選取IF值(5年)≥3的10種期刊,每種期刊選取研究主題為diabetes mellitus的代表性論文2篇,共計(jì)納入20篇科學(xué)論文作為后續(xù)分析的數(shù)據(jù)集。本文是對(duì)單篇論文內(nèi)容語(yǔ)義網(wǎng)絡(luò)表達(dá)的探索,經(jīng)反復(fù)探索驗(yàn)證后發(fā)現(xiàn),對(duì)選取的期刊論文達(dá)到以下要求時(shí)形成的語(yǔ)義網(wǎng)絡(luò)效果較好。一是論文篇幅適中。因?yàn)檎撐倪^(guò)長(zhǎng)會(huì)導(dǎo)致所形成的的語(yǔ)義網(wǎng)絡(luò)過(guò)于龐大復(fù)雜,不利于后續(xù)分析,過(guò)短則會(huì)導(dǎo)致形成的語(yǔ)義網(wǎng)絡(luò)圖不足以反映論文具體研究?jī)?nèi)容。二是選取的論文在PubMed中標(biāo)注的MeSH主題詞數(shù)量在10~20個(gè),且主題詞概念盡量具體。以降血糖藥為例,論文標(biāo)引的MeSH主題詞應(yīng)為具體的降血糖藥如Metformin(二甲雙胍)而非其寬泛的上位類Hypoglycemic Agents(降血糖藥)。

1.2 SemRep語(yǔ)義網(wǎng)及MeSH語(yǔ)義網(wǎng)的構(gòu)建

1.2.1 概念間關(guān)系的提取

本文使用自然語(yǔ)言處理工具SemRep對(duì)單篇科學(xué)論文中的概念進(jìn)行抽取和語(yǔ)義關(guān)系表達(dá)。SemRep可以實(shí)現(xiàn)將單篇科學(xué)論文中的實(shí)義詞映射為UMLS中規(guī)范的概念詞。目前UMLS術(shù)語(yǔ)表已經(jīng)涵蓋了320多萬(wàn)個(gè)概念、133個(gè)語(yǔ)義類型和54個(gè)語(yǔ)義關(guān)系,概念不僅被賦予至少一個(gè)語(yǔ)義類型,同時(shí)規(guī)定了語(yǔ)義類型與語(yǔ)義關(guān)系搭配的規(guī)則[6],為揭示概念及概念間關(guān)系提供了獨(dú)有的優(yōu)勢(shì),也為后期文本可視化分析奠定了基礎(chǔ)。

抽取出映射概念之間的關(guān)系。對(duì)于輸入的文本,SemRep將其中的句子處理為形如“主語(yǔ)|謂詞|賓語(yǔ)”的語(yǔ)義述謂項(xiàng)( Semantic Predication),其中主語(yǔ)和賓語(yǔ)為UMLS中的概念,謂語(yǔ)為UMLS中的語(yǔ)義關(guān)系[7]。示例如下。

Childhood obesity is a predictor of an increased rate of death,owing primarily to an increased risk of cardiovascular disease.(1)

|Obesity|dsyn|PREDISPOSES|Diabetes Mellitus,Non-Insulin-Dependent|dsyn|(2)

項(xiàng)(2)為SemRep對(duì)句子(1)處理后所產(chǎn)生的語(yǔ)義述謂項(xiàng),其中Obesity為主語(yǔ),PREDISPOSES為語(yǔ)義關(guān)系,Diabetes Mellitus and Non-Insulin-Dependent為賓語(yǔ),主語(yǔ)及賓語(yǔ)的語(yǔ)義類型均為疾病或綜合癥(disease or syndrome,dsyn)。

1.2.2 SemRep語(yǔ)義網(wǎng)及MeSH語(yǔ)義網(wǎng)的繪制

語(yǔ)義網(wǎng)絡(luò)圖表示模型是以圖論為基礎(chǔ)構(gòu)建的,其基本模型可以定義為一個(gè)三元組:G=(N,E,W),即圖元素包括節(jié)點(diǎn)(N)、邊(E)及邊的權(quán)重(W)[8]。本文中,節(jié)點(diǎn)(N)表示SemRep處理后的概念,邊(E)表示概念間的語(yǔ)義關(guān)系,邊的權(quán)重(W)表示SemRep處理后此概念對(duì)共現(xiàn)的頻次。利用SemRep處理單篇論文全文所產(chǎn)生的概念及概念間語(yǔ)義關(guān)系構(gòu)建單篇論文SemRep語(yǔ)義網(wǎng),MeSH語(yǔ)義網(wǎng)由SemRep處理后生成的概念與該篇論文在PubMed中標(biāo)引的MeSH主題詞匹配后形成。構(gòu)建過(guò)程采用的可視化分析工具為Gephi[9]。

1.2.3 SemRep語(yǔ)義網(wǎng)的簡(jiǎn)化及描述

利用Cytoscape[10]軟件中的PEWCC算法精簡(jiǎn)網(wǎng)絡(luò),可找到整體網(wǎng)絡(luò)的近似最大派系。PEWCC算法[9]首先利用PE-measure評(píng)估概念節(jié)點(diǎn)間語(yǔ)義關(guān)系的可靠性,然后基于加權(quán)聚類系數(shù)(WCC)的概念檢測(cè)整體網(wǎng)絡(luò),從而抽取出與整體網(wǎng)絡(luò)最為接近的子圖。語(yǔ)義網(wǎng)絡(luò)簡(jiǎn)化的目的是為了加深評(píng)價(jià)人員對(duì)SemRep語(yǔ)義網(wǎng)及MeSH語(yǔ)義網(wǎng)的理解,同時(shí)對(duì)抽取出的SemRep語(yǔ)義網(wǎng)子圖的內(nèi)容進(jìn)行簡(jiǎn)要的語(yǔ)言描述以提高評(píng)價(jià)的準(zhǔn)確性。

1.3 SemRep語(yǔ)義網(wǎng)及MeSH語(yǔ)義網(wǎng)的評(píng)價(jià)指標(biāo)

設(shè)計(jì)調(diào)查問(wèn)卷評(píng)價(jià)最終形成單篇論文SemRep語(yǔ)義網(wǎng)及MeSH語(yǔ)義網(wǎng)是否能夠表達(dá)該篇論文的研究?jī)?nèi)容,調(diào)查對(duì)象為14位中國(guó)醫(yī)科大學(xué)文本挖掘相關(guān)領(lǐng)域的研究人員,評(píng)價(jià)納入數(shù)據(jù)集(10種期刊的20篇單篇論文)SemRep語(yǔ)義網(wǎng)及MeSH語(yǔ)義網(wǎng)的全面性、準(zhǔn)確性和易用性(根據(jù)評(píng)價(jià)人員對(duì)語(yǔ)義網(wǎng)絡(luò)各個(gè)指標(biāo)的滿意程度評(píng)分從低到高為1~10)。利用SPSS 23.0軟件對(duì)結(jié)果數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,統(tǒng)計(jì)方法使用獨(dú)立樣本t檢驗(yàn),評(píng)價(jià)指標(biāo)具體如下。

全面性:SemRep處理后得到的概念與MeSH主題詞相比是否全面。

準(zhǔn)確性:SemRep處理后得到的概念與MeSH詞完全對(duì)應(yīng),未標(biāo)引為MeSH詞,但經(jīng)SemRep處理后出現(xiàn)次數(shù)較多且能反映論文內(nèi)容的概念。

易用性:語(yǔ)義關(guān)系標(biāo)簽表達(dá)概念間關(guān)系是否準(zhǔn)確,可視化網(wǎng)絡(luò)表達(dá)論文內(nèi)容的方法是否直觀清晰。

2 結(jié)果與分析

2.1 期刊及論文選取數(shù)據(jù)集

根據(jù)研究期刊及單篇論文選取標(biāo)準(zhǔn)納入的數(shù)據(jù)分析集見(jiàn)表1。以期刊TheNewEnglandJournalofMedicine中的論文“Childhood adiposity,adult adiposity,and cardiovascular risk factors.” (PMID:22087679)為例進(jìn)行實(shí)例研究,揭示單篇論文SemRep語(yǔ)義網(wǎng)及MeSH語(yǔ)義網(wǎng)的構(gòu)建過(guò)程。

表1 納入期刊及代表性科學(xué)論文的PMID

2.2 實(shí)例研究結(jié)果

2.2.1 單篇論文語(yǔ)義述謂項(xiàng)提取結(jié)果

對(duì)選取的期刊論文“Childhood adiposity,adult adiposity,and cardiovascular risk factors.”利用自然語(yǔ)言處理工具SemRep對(duì)其全文進(jìn)行了概念及語(yǔ)義關(guān)系的提取,共得到53項(xiàng)語(yǔ)義述謂項(xiàng),相同語(yǔ)義述謂項(xiàng)經(jīng)合并后最終形成了34項(xiàng)語(yǔ)義述謂項(xiàng)組成的單篇論文語(yǔ)義述謂項(xiàng)集。前10項(xiàng)語(yǔ)義述謂項(xiàng)及其在該篇論文中相應(yīng)語(yǔ)義述謂項(xiàng)出現(xiàn)的頻次見(jiàn)表2。

2.2.2 單篇論文的機(jī)器處理結(jié)果與人工標(biāo)引結(jié)果的比較

該篇論文在PubMed上標(biāo)引的MeSH主題詞(去除特征詞后)、經(jīng)自然語(yǔ)言處理工具SemRep處理與MeSH主題詞完全對(duì)應(yīng)的概念及部分未標(biāo)引為MeSH主題詞,但經(jīng)SemRep處理后能反映論文內(nèi)容的概念(表3)。

從表3中可看出,去除Adult、Child等特征詞后,該篇論文標(biāo)引的MeSH主題詞共10個(gè),經(jīng)SemRep處理與MeSH主題詞完全對(duì)應(yīng)的UMLS概念為7個(gè),覆蓋率達(dá)70%。此外,經(jīng)人工篩選除去與MeSH主題詞完全對(duì)應(yīng)的概念外,經(jīng)SemRep處理后能反映論文內(nèi)容的概念為7個(gè),其中Dyslipidemias與MeSH主題詞Hypertriglyceridemia、Hypercholesterolemia概念相近,Overweight、Carotid-Atherosclerosis等雖未標(biāo)引為MeSH主題詞但也能反映論文內(nèi)容的概念,在一定程度上彌補(bǔ)了MeSH主題詞反映論文全文內(nèi)容不足的缺陷。

表2 單篇論文語(yǔ)義述謂項(xiàng)表達(dá)示例

表3 機(jī)器處理結(jié)果與人工標(biāo)引結(jié)果的比較

2.2.3 單篇論文SemRep語(yǔ)義網(wǎng)及MeSH語(yǔ)義網(wǎng)構(gòu)建結(jié)果

將提取出的語(yǔ)義述謂項(xiàng)集導(dǎo)入Gephi,并利用Gephi中YifanHu的多水平算法生成語(yǔ)義網(wǎng)絡(luò)圖(圖1,圖2)。其中,圖1表示單篇論文經(jīng)SemRep處理后形成的概念語(yǔ)義網(wǎng)絡(luò)圖(簡(jiǎn)稱“SemRep語(yǔ)義網(wǎng)”),圖2為SemRep處理后生成的概念與MeSH主題詞匹配后形成的MeSH語(yǔ)義網(wǎng),即圖1去除與MeSH主題詞不直接相連的概念節(jié)點(diǎn)后所形成的語(yǔ)義網(wǎng)絡(luò)圖。2個(gè)圖中,邊的顏色對(duì)應(yīng)的語(yǔ)義標(biāo)簽為橙色(ISA)、粉色(LOCATION_OF)、深黃色(PREDISPOSES)、綠色(PROCESS_OF)、淡紫色(USES),其中紅色填充的概念節(jié)點(diǎn)表示與MeSH主題詞完全對(duì)應(yīng)的概念。

圖1 SemRep語(yǔ)義網(wǎng)

圖2 MeSH語(yǔ)義網(wǎng)

2.2.4 單篇論文語(yǔ)義網(wǎng)絡(luò)簡(jiǎn)化圖及結(jié)果解析

利用PEWCC算法對(duì)圖1所示的單篇論文SemRep語(yǔ)義網(wǎng)進(jìn)行網(wǎng)絡(luò)簡(jiǎn)化,抽取出與整體網(wǎng)絡(luò)最為接近的子圖,經(jīng)過(guò)語(yǔ)義標(biāo)簽設(shè)置、重復(fù)邊移除等處理之后,形成了圖3所示的該篇論文的語(yǔ)義網(wǎng)絡(luò)簡(jiǎn)化圖。

從圖3看出,肥胖、超重人群易患高血壓疾病及非胰島素依賴型糖尿病,高血壓疾病是非胰島素依賴型糖尿病的一種過(guò)程。

2.2.5 單篇論文語(yǔ)義網(wǎng)絡(luò)的節(jié)點(diǎn)度數(shù)中心度分析

將得到的單篇論文語(yǔ)義述謂項(xiàng)集進(jìn)行Gephi可視化處理的同時(shí),將其導(dǎo)入U(xiǎn)cinet[11]對(duì)網(wǎng)絡(luò)節(jié)點(diǎn)度數(shù)中心度進(jìn)行分析。該篇論文的語(yǔ)義述謂項(xiàng)集經(jīng)Ucinet分析后所示的概念節(jié)點(diǎn)度數(shù)中心度分布見(jiàn)表4。從表4可見(jiàn),點(diǎn)的絕對(duì)度數(shù)中心度(Degree)大于1的概念節(jié)點(diǎn)。

圖3 語(yǔ)義網(wǎng)絡(luò)簡(jiǎn)化圖

表4 概念節(jié)點(diǎn)度數(shù)中心度分布

從上述節(jié)點(diǎn)度數(shù)中心度分布可以看出,Obesity、Diabetes Mellitus,Non-Insulin-Dependent,Overweight,Hypertensive disease等概念節(jié)點(diǎn)度數(shù)中心度較高,說(shuō)明在此語(yǔ)義網(wǎng)絡(luò)中這些概念較為重要。根據(jù)這些概念節(jié)點(diǎn)的度數(shù)中心度分布可初步推斷該篇論文的內(nèi)容為肥胖、超重人群易患高血壓、頸動(dòng)脈粥樣硬化、非胰島素依賴型糖尿病等疾病。

2.3 SemRep語(yǔ)義網(wǎng)與MeSH語(yǔ)義網(wǎng)的結(jié)果評(píng)價(jià)

以語(yǔ)義網(wǎng)絡(luò)評(píng)價(jià)標(biāo)準(zhǔn)對(duì)納入數(shù)據(jù)集進(jìn)行評(píng)價(jià),在調(diào)查對(duì)象的14位研究人員中,醫(yī)學(xué)信息學(xué)院情報(bào)學(xué)、文獻(xiàn)學(xué)、圖書館學(xué)教研室教師各3人,均具有10年以上的研究經(jīng)驗(yàn);圖書館參考咨詢部研究人員3人,均具有3年以上的研究經(jīng)驗(yàn);情報(bào)學(xué)專業(yè)碩士研究生2人,在科室分布、研究經(jīng)驗(yàn)、學(xué)歷分布上均有差異。發(fā)放問(wèn)卷全部回收且有效,對(duì)其進(jìn)行統(tǒng)計(jì)分析的結(jié)果見(jiàn)表5。

表5 文獻(xiàn)集SemRep語(yǔ)義網(wǎng)與MeSH語(yǔ)義網(wǎng)評(píng)價(jià)結(jié)果比較

注:表中t值為獨(dú)立樣本t檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量,P<0.05表示差異具有統(tǒng)計(jì)學(xué)意義

從表5可見(jiàn),評(píng)價(jià)人員對(duì)SemRep語(yǔ)義網(wǎng)及MeSH語(yǔ)義網(wǎng)在表達(dá)單篇論文內(nèi)容方面的滿意程度。從全面性看,評(píng)價(jià)人員對(duì)SemRep語(yǔ)義網(wǎng)和MeSH語(yǔ)義網(wǎng)評(píng)分均值均高于8分,且分值差異較小,說(shuō)明2種網(wǎng)絡(luò)均能全面覆蓋單篇論文的主要研究?jī)?nèi)容;從準(zhǔn)確性看,2種網(wǎng)絡(luò)的評(píng)分均值均不足8分,說(shuō)明二者所揭示的論文全文的主要概念與MeSH主題詞相比還不夠準(zhǔn)確,單篇論文內(nèi)容的表達(dá)準(zhǔn)確性還有待提高;P<0.05說(shuō)明2種網(wǎng)絡(luò)在表達(dá)單篇論文內(nèi)容的準(zhǔn)確性方面存在顯著性差異,且MeSH語(yǔ)義網(wǎng)評(píng)分高于SemRep語(yǔ)義網(wǎng)的主要原因?yàn)镾emRep語(yǔ)義網(wǎng)中冗余、無(wú)用概念較多,從而造成準(zhǔn)確率的下降;從易用性看,MeSH語(yǔ)義網(wǎng)的評(píng)分均值為8.23,高于自然語(yǔ)言語(yǔ)義網(wǎng),這是因?yàn)镸eSH語(yǔ)義網(wǎng)中概念節(jié)點(diǎn)及語(yǔ)義關(guān)系較少,網(wǎng)絡(luò)清晰,更容易獲得評(píng)價(jià)人員的肯定。整體上看,MeSH語(yǔ)義網(wǎng)在表達(dá)單篇論文內(nèi)容的全面性、準(zhǔn)確性及易用性的評(píng)分均值均高于SemRep語(yǔ)義網(wǎng),但2種網(wǎng)絡(luò)在表達(dá)單篇論文內(nèi)容的準(zhǔn)確性方面還有待提高。

3 結(jié)論

本文所構(gòu)建的2種語(yǔ)義網(wǎng)絡(luò)所提供的語(yǔ)義信息具備一定的文獻(xiàn)挖掘潛力,可實(shí)現(xiàn)對(duì)單篇科學(xué)論文內(nèi)容的揭示與表達(dá)。將復(fù)雜網(wǎng)絡(luò)分析方法與語(yǔ)義搭配模式相結(jié)合,能夠?yàn)橹T如信息抽取、知識(shí)發(fā)現(xiàn)、知識(shí)圖譜及學(xué)科研究態(tài)勢(shì)分析等研究提供新的方法和思路。通過(guò)比較SemRep語(yǔ)義網(wǎng)及MeSH語(yǔ)義網(wǎng)在表達(dá)單篇論文內(nèi)容的全面性、準(zhǔn)確性及易用性方面的異同,根據(jù)評(píng)價(jià)人員對(duì)SemRep語(yǔ)義網(wǎng)及MeSH語(yǔ)義網(wǎng)的調(diào)查評(píng)價(jià)結(jié)果,發(fā)現(xiàn)MeSH語(yǔ)義網(wǎng)相較于SemRep語(yǔ)義網(wǎng)更能深入細(xì)致地揭示單篇論文中的主要概念及概念間的語(yǔ)義關(guān)系。其主要原因?yàn)楂@得MeSH主題詞表的支持,排除了冗余、無(wú)用概念的干擾,從而實(shí)現(xiàn)單篇論文研究?jī)?nèi)容的深度表達(dá)與揭示,對(duì)文獻(xiàn)的挖掘更加靈活、強(qiáng)大。

隨著語(yǔ)義網(wǎng)絡(luò)研究的深入,對(duì)文獻(xiàn)信息的挖掘必然從以概念為對(duì)象向以概念結(jié)合語(yǔ)義關(guān)系為對(duì)象的方向發(fā)展。利用MeSH語(yǔ)義網(wǎng)表達(dá)單篇論文知識(shí)的方法可廣泛應(yīng)用于探索施引文獻(xiàn)與被引文獻(xiàn)之間內(nèi)容上的異同,探索高質(zhì)量論文(或高被引論文)與一般論文的差別,探索單篇論文內(nèi)容的新穎程度,為科研人員進(jìn)行科研績(jī)效評(píng)價(jià)提供一種新途徑。

4 討論

本文以語(yǔ)義網(wǎng)絡(luò)圖的形式提出了一種表達(dá)單篇論文研究?jī)?nèi)容的新途徑。隨著信息技術(shù)的發(fā)展,不久后我們將能夠基于規(guī)則和機(jī)器學(xué)習(xí)等方法實(shí)現(xiàn)單篇論文全文概念及語(yǔ)義關(guān)系的自動(dòng)化抽取及可視化,即將單篇論文全文輸入應(yīng)用程序,系統(tǒng)自動(dòng)進(jìn)行全文概念及關(guān)系的抽取,進(jìn)而實(shí)現(xiàn)單篇論文全文內(nèi)容的可視化,形成單篇論文的語(yǔ)義網(wǎng)絡(luò)圖。用戶理解文獻(xiàn)內(nèi)容將不僅僅局限于參考MeSH主題詞及文獻(xiàn)摘要,還能夠結(jié)合單篇論文SemRep語(yǔ)義網(wǎng)及MeSH語(yǔ)義網(wǎng)快速瀏覽和分析文獻(xiàn)內(nèi)容,并清晰直觀地了解概念如何在語(yǔ)義網(wǎng)絡(luò)結(jié)構(gòu)中相互關(guān)聯(lián)。在以后的研究中,我們將能夠利用本體構(gòu)建單篇論文語(yǔ)義網(wǎng)絡(luò)知識(shí)庫(kù),實(shí)現(xiàn)單篇論文語(yǔ)義網(wǎng)絡(luò)的規(guī)范表達(dá)。

本文的局限性主要體現(xiàn)在兩方面。一是語(yǔ)義網(wǎng)絡(luò)復(fù)雜性帶來(lái)的限制。如果單篇論文的篇幅過(guò)長(zhǎng),經(jīng)SemRep處理后所形成的語(yǔ)義述謂項(xiàng)會(huì)隨之增加,語(yǔ)義網(wǎng)絡(luò)復(fù)雜度也會(huì)相應(yīng)增加,不利于直觀清晰地表達(dá)單篇論文研究?jī)?nèi)容,因此此方法還不適用于處理篇幅過(guò)長(zhǎng)的單篇論文。二是冗余、無(wú)用的語(yǔ)義述謂項(xiàng)帶來(lái)的限制。單篇論文全文經(jīng)SemRep處理后所形成的語(yǔ)義述謂項(xiàng)存在冗余、無(wú)用現(xiàn)象,同一實(shí)體概念搭配過(guò)多特征詞概念,影響單篇論文內(nèi)容的表達(dá)。

猜你喜歡
語(yǔ)義概念內(nèi)容
內(nèi)容回顧溫故知新
Birdie Cup Coffee豐盛里概念店
語(yǔ)言與語(yǔ)義
幾樣概念店
學(xué)習(xí)集合概念『四步走』
聚焦集合的概念及應(yīng)用
主要內(nèi)容
臺(tái)聲(2016年2期)2016-09-16 01:06:53
“上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
認(rèn)知范疇模糊與語(yǔ)義模糊
語(yǔ)義分析與漢俄副名組合
主站蜘蛛池模板: 精品无码国产自产野外拍在线| 国产福利小视频在线播放观看| 亚洲日韩国产精品无码专区| 在线精品自拍| 国产不卡一级毛片视频| 亚洲中文字幕av无码区| 色综合久久综合网| 欧美日韩高清在线| 无码人妻免费| 男女性午夜福利网站| 亚洲无码高清免费视频亚洲 | 制服丝袜国产精品| 国产91av在线| 一级不卡毛片| 国产91无毒不卡在线观看| 国产久草视频| 综合网天天| 狠狠久久综合伊人不卡| 美臀人妻中出中文字幕在线| 青草视频网站在线观看| 久草视频精品| 欧美日韩动态图| 国产精品视频白浆免费视频| 亚洲男人天堂2020| 国产av色站网站| 欧美不卡二区| 九九热精品视频在线| 三上悠亚精品二区在线观看| 国产精品美乳| 四虎国产成人免费观看| 欧美视频在线不卡| 精品午夜国产福利观看| 人人妻人人澡人人爽欧美一区| 免费一级无码在线网站 | 特级做a爰片毛片免费69| 一本无码在线观看| 欧美国产日韩一区二区三区精品影视| 国产91特黄特色A级毛片| 午夜日本永久乱码免费播放片| 最新日本中文字幕| 久久91精品牛牛| 日本一区二区三区精品视频| 亚洲成网777777国产精品| 午夜精品影院| 久草视频中文| 亚洲欧洲国产成人综合不卡| 九九热视频在线免费观看| a级毛片免费看| h视频在线观看网站| 国产毛片不卡| а∨天堂一区中文字幕| 97人人做人人爽香蕉精品| 久久一级电影| 中日韩欧亚无码视频| 色噜噜狠狠色综合网图区| 国产在线精彩视频二区| 最新日韩AV网址在线观看| 国产精品成人久久| 久久五月天综合| 国产区成人精品视频| 91综合色区亚洲熟妇p| 久久精品午夜视频| 内射人妻无码色AV天堂| 欧美中日韩在线| 亚洲精品色AV无码看| 日本在线亚洲| 91福利在线看| 午夜日b视频| 国产免费久久精品99re不卡| 亚洲狠狠婷婷综合久久久久| 亚洲狼网站狼狼鲁亚洲下载| 亚洲综合二区| 一本大道视频精品人妻| 香蕉eeww99国产在线观看| 国产亚洲男人的天堂在线观看| 99精品免费在线| 国产又色又刺激高潮免费看 | 国产白浆视频| 婷婷六月在线| 在线精品视频成人网| 亚洲动漫h| 国产丝袜一区二区三区视频免下载|