999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于語義表達(dá)的中藥概念數(shù)據(jù)模型構(gòu)建

2017-04-22 03:49:56劉麗紅
世界中醫(yī)藥 2017年4期
關(guān)鍵詞:語義中醫(yī)藥概念

劉麗紅 朱 彥

(中國中醫(yī)科學(xué)院中醫(yī)藥信息研究所,北京,100700)

基于語義表達(dá)的中藥概念數(shù)據(jù)模型構(gòu)建

劉麗紅 朱 彥

(中國中醫(yī)科學(xué)院中醫(yī)藥信息研究所,北京,100700)

目的:中藥領(lǐng)域大量內(nèi)容豐富、異質(zhì)異構(gòu)數(shù)據(jù)為領(lǐng)域信息交換與共享帶來困難。建立基于語義表達(dá)的中藥數(shù)據(jù)模型,一方面,能在語義層面上提供知識共享與重用;另一方面,能促進(jìn)數(shù)據(jù)資源的集成、交換和應(yīng)用的互操作。方法:采用本體與底層數(shù)據(jù)相結(jié)合的方法,基于現(xiàn)有本體中國中醫(yī)藥學(xué)語言系統(tǒng)(Traditional Chinese Medicine Language System,TCMLS),參照已有概念數(shù)據(jù)模型,結(jié)合基于基礎(chǔ)數(shù)據(jù)進(jìn)行概念抽取構(gòu)建中藥概念數(shù)據(jù)模型。結(jié)果:基于中醫(yī)藥一體化數(shù)據(jù)模型(Traditional Chinese Medicine Integrated Model,TCMIM)框架,分析目前中藥領(lǐng)域數(shù)據(jù)資源,抽取中藥及相關(guān)業(yè)務(wù)領(lǐng)域概念,構(gòu)建中藥概念數(shù)據(jù)模型框架。結(jié)論:運用本體與數(shù)據(jù)相結(jié)合的方法,在概念層面建立中藥數(shù)據(jù)模型,在數(shù)據(jù)層面有利于數(shù)據(jù)建模的準(zhǔn)確性,促進(jìn)信息資源的集成與交換;在語義層面上有利于豐富補充領(lǐng)域本體。

中藥;概念數(shù)據(jù)模型;語義表達(dá)

1 概述

數(shù)據(jù)模型分概念層、邏輯層、物理層的3層架構(gòu)。概念數(shù)據(jù)模型(Conceptual Data Model)描述計算機系統(tǒng)將要處理的問題領(lǐng)域中的事物,它本身常常采用實體聯(lián)系模型(E-R Model)。概念/語義數(shù)據(jù)模型可以被看作是“語義模型”或“信息模型”,它與“本體”基本上處于同樣的相對位置。這些模型都可以從本體研究那里找到重疊或借鑒的東西[1](如圖1)。

本體自20世紀(jì)90年代引入計算機人工智能領(lǐng)域,目前主要有兩層含義:一是哲學(xué)領(lǐng)域的存在,是本體論的研究對象;二是延伸到特定領(lǐng)域之中,指某套概念及其相互之間關(guān)系的形式化表達(dá),包括概念化、規(guī)范化、形式化和共享4個特征[2]。信息科學(xué)中的本體論的目標(biāo)是確定領(lǐng)域內(nèi)共同認(rèn)可的詞匯,并從不同層次的形式化模型上給出這些詞匯和詞匯間相互關(guān)系的明確定義,從而獲取相關(guān)領(lǐng)域的知識,提供對該領(lǐng)域知識的共同理解[3]。謝琪等提出應(yīng)用領(lǐng)域本體方法建立中醫(yī)概念信息模型的思路與構(gòu)想,解決中醫(yī)藥領(lǐng)域頂層設(shè)計理論指導(dǎo)不足的問題,是從頂層設(shè)計本體,發(fā)現(xiàn)語義關(guān)系,構(gòu)建中醫(yī)藥概念信息模型。郭磊[4]根據(jù)方證相關(guān)性構(gòu)建中醫(yī)藥關(guān)系型數(shù)據(jù)庫中數(shù)據(jù)概念模型,張麗穎[5]等基于本體建立醫(yī)學(xué)科研信息模型,提出本體建模的依據(jù)與方式方法。李明[6]等采用本體方法,探討中醫(yī)證候本體表達(dá)模式的構(gòu)建方法及其在語義檢索、智能診斷、數(shù)據(jù)分析等方面的應(yīng)用。周揚[7]等提出了構(gòu)建中藥本體的思路,期望全面描述中藥本質(zhì),揭示中藥本身及中藥間復(fù)雜的功效與物質(zhì)關(guān)系,澄清中藥的知識結(jié)構(gòu)。婁苗苗[8]等提出基于領(lǐng)域信息構(gòu)建國家衛(wèi)生信息概念數(shù)據(jù)模型的方法,目的是為元數(shù)據(jù)項目開發(fā)和管理提供一致、透明的語義背景。

圖1 各模型與本體關(guān)系圖

在一些行業(yè)領(lǐng)域,對于數(shù)據(jù)模型的研究較為成熟的如交通地理信息領(lǐng)域,其系統(tǒng)的交通地理信息系統(tǒng)數(shù)據(jù)模型[9]基于應(yīng)用出發(fā),從傳統(tǒng)數(shù)據(jù)模型、線性定位參照體系、導(dǎo)航數(shù)據(jù)模型至GIS一T時空數(shù)據(jù)模型,用來表達(dá)地理信息系統(tǒng)中數(shù)據(jù)之間的聯(lián)系與邏輯組織形式,滿足交通地理信息系統(tǒng)導(dǎo)航需要、多維化與時態(tài)化。在石油工業(yè)領(lǐng)域,熊方平等[10]以實體為主線,將各專業(yè)數(shù)據(jù)有機、完整結(jié)合,形成一體化勘探開發(fā)數(shù)據(jù)庫,滿足各個層面應(yīng)用研究需求的跨專業(yè)勘探開發(fā)一體化數(shù)據(jù)模型EPDM。這些數(shù)據(jù)模型成熟且完善,覆蓋了該行業(yè)各個業(yè)務(wù)領(lǐng)域過程環(huán)節(jié)數(shù)據(jù),方便一體化管理,為跨專業(yè)的綜合研究提供了基礎(chǔ)。國內(nèi)對于信息交換研究進(jìn)行了一些探索,張玉海[11]等對國家衛(wèi)生信息概念數(shù)據(jù)模型與HL7RIM之間進(jìn)行了映射關(guān)系的對照,確定了它們之間的關(guān)系,檢驗概念數(shù)據(jù)模型的范圍。唐忠[12]分析軍用電子設(shè)備試驗數(shù)據(jù),研究設(shè)計了試驗數(shù)據(jù)庫概念模型,采用時間、設(shè)備和試驗題三維關(guān)聯(lián)數(shù)據(jù)模型,滿足試驗數(shù)據(jù)庫管理系統(tǒng)應(yīng)用需求。

在中醫(yī)藥領(lǐng)域,數(shù)據(jù)模型研究基本處于探索階段,還未見系統(tǒng)完整的概念數(shù)據(jù)模型,語義web技術(shù)得到了一些應(yīng)用[13]。目前,由于沒有統(tǒng)一語義的數(shù)據(jù)模型標(biāo)準(zhǔn),沒有參照,重復(fù)建設(shè),低質(zhì)量的數(shù)據(jù)模型直接影響應(yīng)用系統(tǒng)的質(zhì)量,更談不上應(yīng)用互操作,阻礙了信息資源的的集成、交換。

中藥概念數(shù)據(jù)模型屬數(shù)據(jù)模型范疇,一方面通過梳理中藥知識體系,分析中藥類數(shù)據(jù)資源,基于基礎(chǔ)數(shù)據(jù)進(jìn)行中藥概念信息抽取,另一方面利用中醫(yī)藥領(lǐng)域內(nèi)本體及現(xiàn)有模型指導(dǎo)約束概念及概念間關(guān)系的確定。利用本體與數(shù)據(jù)結(jié)合構(gòu)建概念數(shù)據(jù)模型,明確概念含義,理清概念間關(guān)系,有利于數(shù)據(jù)建模的準(zhǔn)確性,促進(jìn)信息資源的集成與交換;在語義層面上有利于補充領(lǐng)域本體。

2 研究方法與步驟

2.1 中藥及相關(guān)業(yè)務(wù)領(lǐng)域概念特征分析

2.1.1 中藥業(yè)務(wù)領(lǐng)域數(shù)據(jù)資源分析 中藥概念數(shù)據(jù)模型中的概念來源主要基于中藥領(lǐng)域數(shù)據(jù)資源進(jìn)行抽取。中藥領(lǐng)域數(shù)據(jù)來源需根據(jù)概念數(shù)據(jù)模型構(gòu)建需求設(shè)定。

一方面,中藥領(lǐng)域核心概念來源要考慮反映中藥核心知識體系,需分析中藥領(lǐng)域權(quán)威辭典、工具書、教材,如《中華人民共和國藥典》《中華本草》《中藥大辭典》《中藥學(xué)》《臨床中藥學(xué)》等;另一方面,中藥概念數(shù)據(jù)模型是針對數(shù)據(jù)構(gòu)建的模型,要考慮反映中藥領(lǐng)域數(shù)據(jù)庫信息特點。

中國中醫(yī)科學(xué)院中醫(yī)藥信息研究所的中藥相關(guān)數(shù)據(jù)庫包括中國中藥數(shù)據(jù)庫、中藥科技基礎(chǔ)信息數(shù)據(jù)庫、中藥藥理實驗數(shù)據(jù)庫、中藥化學(xué)實驗數(shù)據(jù)庫、中藥化學(xué)成分?jǐn)?shù)據(jù)庫、中國方劑數(shù)據(jù)庫等;相關(guān)數(shù)據(jù)庫包括中醫(yī)臨床疾病數(shù)據(jù)庫、中醫(yī)醫(yī)案數(shù)據(jù)庫、有毒中藥數(shù)據(jù)庫等。另外,中國科學(xué)院的中國中草藥數(shù)據(jù)庫、中藥有效成分?jǐn)?shù)據(jù)庫、中藥基本信息數(shù)據(jù)庫、中國中成藥數(shù)據(jù)庫、中國英文中藥數(shù)據(jù)庫,上海中醫(yī)中藥數(shù)據(jù)中心的SIRC/TCM中醫(yī)藥信息系統(tǒng),中國科學(xué)院武漢植物園的神農(nóng)架藥用植物數(shù)據(jù)庫與華中藥用植物數(shù)據(jù)庫,復(fù)旦大學(xué)生物多樣性科學(xué)研究所的上海市藥用植物數(shù)據(jù)庫查詢系統(tǒng)等。通過分析這些數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)集與核心數(shù)據(jù)元,利用權(quán)威辭典對數(shù)據(jù)元進(jìn)行規(guī)范抽取,可以作為中藥核心概念的可靠來源。

圖2 中藥及相關(guān)業(yè)務(wù)領(lǐng)域概念

2.1.2 中藥相關(guān)業(yè)務(wù)領(lǐng)域范圍設(shè)定 TCMIDM的構(gòu)建研究提出了數(shù)據(jù)模型集成框架[14]。基于此集

表1 中藥類數(shù)據(jù)元

圖3 中藥核心概念示例

成框架,中藥概念數(shù)據(jù)模型包含中藥及相關(guān)業(yè)務(wù)領(lǐng)域術(shù)語資源、數(shù)據(jù)資源、信息系統(tǒng)等方面概念的抽取,進(jìn)行中藥概念數(shù)據(jù)模型構(gòu)建,以中藥為核心進(jìn)行相關(guān)業(yè)務(wù)領(lǐng)域數(shù)據(jù)資源概念抽取如圖2。

2.2 中藥及相關(guān)業(yè)務(wù)領(lǐng)域概念及概念間相互關(guān)系 楊喆[15]等基于國家衛(wèi)生信息概念數(shù)據(jù)模型為基礎(chǔ),提煉和描述衛(wèi)生領(lǐng)域數(shù)據(jù)元,表達(dá)數(shù)據(jù)元及其語義關(guān)聯(lián)。該方法與中藥概念數(shù)據(jù)模型中基礎(chǔ)概念抽取一致。在中藥及相關(guān)業(yè)務(wù)領(lǐng)域概念抽取中,以中藥知識體系為核心概念體系,相關(guān)業(yè)務(wù)領(lǐng)域概念為補充完善。前期研究[16]對中藥知識資源體系進(jìn)行了比較,結(jié)合“中醫(yī)藥數(shù)據(jù)元標(biāo)準(zhǔn)研究”中藥類數(shù)據(jù)源[17],進(jìn)行中藥類數(shù)據(jù)元整理修訂,結(jié)果如表1。基于數(shù)據(jù)元進(jìn)行核心概念的抽取與描述,示例如圖3。

在進(jìn)行中藥概念數(shù)據(jù)涉及的業(yè)務(wù)領(lǐng)域分析研究中,需結(jié)合調(diào)研咨詢、業(yè)務(wù)梳理、專家討論等,辨析中藥及相關(guān)業(yè)務(wù)域概念含義及其在理論中的地位、性質(zhì)、作用,確定核心概念、非核心概念,比較概念含義及其重要性,確定核心概念、非核心概念,對中藥領(lǐng)域概念與相關(guān)業(yè)務(wù)領(lǐng)域概念進(jìn)行梳理。

2.3 中藥概念數(shù)據(jù)模型構(gòu)建 參考中藥工具書、教材、相關(guān)專著及中藥規(guī)范數(shù)據(jù)元研究成果,根據(jù)其含義及其在理論中的地位、性質(zhì)、作用,確定核心概念、非核心概念,對核心概念與非核心概念之間的層次、類屬、邏輯關(guān)系等進(jìn)行深入辨析,確定其相互關(guān)系;結(jié)合中藥相關(guān)業(yè)務(wù)領(lǐng)域,分析中藥域與其他域之間的關(guān)系,進(jìn)行中藥概念及關(guān)系的考量。以本體論方法為指導(dǎo),全面分析提取概念間的語義關(guān)系,以TCMLS的56種語義關(guān)系為參照,結(jié)合其語義關(guān)系適用情況,進(jìn)行適當(dāng)?shù)脑鰟h調(diào)整,梳理中藥概念間的語義關(guān)系,基于統(tǒng)一語義表達(dá),構(gòu)建中藥概念數(shù)據(jù)模型。

中藥概念數(shù)據(jù)模型的建立,一方面希望可以作為數(shù)據(jù)物理模型的上層,指導(dǎo)數(shù)據(jù)庫規(guī)范建設(shè),方便數(shù)據(jù)交換與共享,另一方面作為領(lǐng)域概念信息的抽取,可以豐富和補充TCMLS,完善中醫(yī)藥領(lǐng)域頂層本體建設(shè)。

3 結(jié)語

運用本體與數(shù)據(jù)相結(jié)合的方法,基于基礎(chǔ)數(shù)據(jù)進(jìn)行中藥及相關(guān)業(yè)務(wù)領(lǐng)域概念及概念間抽取,概念及概念間關(guān)系的確定需結(jié)合利用領(lǐng)域本體TCMLS,重用概念及概念間關(guān)系,兼顧HL7 RIM模型,建立概念間關(guān)系,在概念層面建立中藥數(shù)據(jù)模型。這種構(gòu)建概念數(shù)據(jù)模型的模式,概念來源于基礎(chǔ)數(shù)據(jù),能夠反映數(shù)據(jù)結(jié)構(gòu)特點,利用語義表達(dá)概念間關(guān)系,可在語義層面上提供知識共享與重用,為中藥本體的構(gòu)建提供來源。

概念數(shù)據(jù)模型一方面要有較強的表達(dá)能力,另一方面也需要簡單、清晰,易于理解。在實際應(yīng)用過程中,必須進(jìn)一步轉(zhuǎn)換成為邏輯數(shù)據(jù)模型、物理數(shù)據(jù)模型,才能在具體數(shù)據(jù)庫中實現(xiàn)[18]。

[1]余彤鷹.札記:本體及數(shù)據(jù)、信息、領(lǐng)域、企業(yè)建模與模型.http://www.ee-forum.org/wp/pub/ty/2011-02-p2491.html,2016-06-07.

[2]Studer Rudi,Richard Benjamins,Dieter Fensel.Knowledge engineering:principles and methods[J].Data and Knowledge Engineering,1998,25(1/2):161-197.

[3]蘇里,朱慶偉,陳宜金,等.基于地理本體的空間數(shù)據(jù)庫概念建模[J].計算機工程,2007,33(12):87-89.

[4]郭磊.根據(jù)方證相關(guān)理論構(gòu)建中醫(yī)藥關(guān)系型數(shù)據(jù)庫概念模型探討[J].山西中醫(yī),2009,25(3):60-61.

[5]張麗穎,馬鳴華,金巖.基于本體的醫(yī)學(xué)科研信息模型的建立與分析[J].中華中醫(yī)藥學(xué)刊,2013,31(10):2259-2261.

[6]李明,張昌林,包漢飛,等.中醫(yī)證候本體表達(dá)模式的構(gòu)建與應(yīng)用研究[J].上海中醫(yī)藥雜志,2013,4(1):7-11.

[7]周揚,王振國.中藥Ontology概念關(guān)系體系的構(gòu)建探析[J].中國中醫(yī)藥信息雜志,2009,16(3):96-97.

[8]婁苗苗,楊喆,劉丹紅,等.基于領(lǐng)域信息的衛(wèi)生信息概念數(shù)據(jù)模型構(gòu)建方法[J].中國數(shù)字醫(yī)學(xué),2015,10(1):74-77.

[9]石建軍,許國華,何民,等.交通地理信息系統(tǒng)數(shù)據(jù)模型的研究進(jìn)展[J].北京工業(yè)大學(xué)學(xué)報,2004,30(3):311-322.

[10]熊方平,馬進(jìn)山,陳新燕,等.中國石油一體化勘探開發(fā)數(shù)據(jù)模型研究與實踐[J].信息技術(shù)與信息化,2011,(3):49-55,60.

[11]張玉海,徐勇勇,劉丹紅,等.國家衛(wèi)生信息概念數(shù)據(jù)模型與HL7RIM的映射研究[J].第四軍醫(yī)大學(xué)學(xué)報,2006,27(11):999-1001.

[12]唐忠,周含冰,何榮茂,等.軍用電子設(shè)備試驗數(shù)據(jù)庫概念模型設(shè)計[J].計算機與數(shù)字工程,2013,41(1):148-150.

[13]于彤,崔蒙,李敬華.語義Web在中醫(yī)藥領(lǐng)域的應(yīng)用研究綜述[J].世界中醫(yī)藥,2013,8(1):107-109.

[14]劉麗紅,朱彥,李海燕,等.中醫(yī)藥一體化數(shù)據(jù)模型的構(gòu)建[J].中國數(shù)字醫(yī)學(xué),2015,10(10):70-72.

[15]楊喆,劉丹紅,婁苗苗,等.基于信息建模的數(shù)據(jù)元標(biāo)準(zhǔn)化方法[J].中國數(shù)字醫(yī)學(xué),2016,11(2):58-60,70.

[16]劉麗紅,賈李蓉,劉靜,等.中藥本體相關(guān)概念描述探討[J].中國數(shù)字醫(yī)學(xué),2016,1(2):90-92.

[17]董燕,張竹綠,李海燕,等.中醫(yī)藥數(shù)據(jù)元提取規(guī)則與分類探討[J].中國數(shù)字醫(yī)學(xué),2013,8(11):79-80,88.

[18]梁禮方.數(shù)據(jù)模型[J].金融科技時代,2014(1):45-51.

(2016-06-08收稿 責(zé)任編輯:白樺)

Building Chinese Medicine Conceptual Data Model Based on Semantic Representation

Liu Lihong,Zhu Yan

(InstituteofInformationonTraditionalChineseMedicine,ChinaAcademyofChineseMedicalSciences,Beijing100700,China)

Objective:A large amount of rich content and heterogeneous data in Chinese medicine field bring difficulties for information exchange and sharing. On the one hand,it can provide knowledge sharing and reusing on semantic level,on the other hand,it can promote the integration,exchange and application of data resources. Methods:Combining ontology and data,Chinese medicine conceptual data model was established based on the existing ontology Traditonal Chinese Medicine Language System (TCMLS),with reference to the existing conceptual data model to extract concepts. Results:Based on the Traditional Chinese Medicine integrated data model framework,the current data resources in the Chinese medicine field were analyzed,Chinese medicine and related business concepts were extracted to build the framework of Chinese medicine concept data model. Conclusion:With combination of ontology and data,Chinese medicine data model is built at the conceptual level,for the accuracy of data modeling on data level and it could promote the integration and exchange of information resources and supplement the domain ontology at semantic level.

Chinese medicine; Conceptual data model; Semantic representation

國家自然科學(xué)基金青年項目(編號:61601521)

朱彥(1983.04—),男,中醫(yī)信息學(xué)博士,研究實習(xí)員,研究方向:中醫(yī)藥知識組織與挖掘,E-mail:zhuyan166@126.com

R-331;R286

A

10.3969/j.issn.1673-7202.2017.04.058

猜你喜歡
語義中醫(yī)藥概念
Birdie Cup Coffee豐盛里概念店
中醫(yī)藥在惡性腫瘤防治中的應(yīng)用
中醫(yī)藥在治療惡性腫瘤骨轉(zhuǎn)移中的應(yīng)用
語言與語義
幾樣概念店
學(xué)習(xí)集合概念『四步走』
聚焦集合的概念及應(yīng)用
從《中醫(yī)藥法》看直銷
中醫(yī)藥立法:不是“管”而是“促”
“上”與“下”語義的不對稱性及其認(rèn)知闡釋
主站蜘蛛池模板: 狠狠色综合久久狠狠色综合| 5388国产亚洲欧美在线观看| 中文字幕在线日本| 亚洲欧美自拍一区| 国产毛片高清一级国语| 亚洲天堂在线免费| 欧美精品啪啪| 人妻丝袜无码视频| 一级毛片高清| 五月婷婷欧美| 成人综合网址| 亚洲一区二区三区在线视频| 无码国产偷倩在线播放老年人| 亚洲国产一成久久精品国产成人综合| 亚洲欧美精品一中文字幕| 国产一级无码不卡视频| 国产成人综合日韩精品无码首页| 伊人久久福利中文字幕| 另类欧美日韩| 91年精品国产福利线观看久久| 国产91视频免费| 成人午夜免费观看| 久久综合色播五月男人的天堂| 九九热精品在线视频| 色婷婷在线影院| 欧美日本在线播放| 亚洲91在线精品| 在线观看无码av免费不卡网站| 91在线一9|永久视频在线| 91麻豆精品国产91久久久久| 亚洲熟女中文字幕男人总站| 浮力影院国产第一页| 国产国语一级毛片在线视频| 国产精品一区在线麻豆| 无码一区中文字幕| 啊嗯不日本网站| 国产91高跟丝袜| 91青草视频| 亚洲欧美成人在线视频| 91成人免费观看| 91久久大香线蕉| 亚洲无线国产观看| 成人免费网站在线观看| 亚洲精品在线影院| 亚洲福利片无码最新在线播放| 久久精品人妻中文视频| 无码日韩视频| 亚洲swag精品自拍一区| 伊人久久福利中文字幕| 国产va在线观看| 国产成人三级| 国产精品妖精视频| 久久综合成人| 国产极品美女在线播放| 国产视频a| 凹凸精品免费精品视频| 亚洲 欧美 日韩综合一区| 996免费视频国产在线播放| 亚洲色成人www在线观看| 中文天堂在线视频| 亚洲欧美色中文字幕| 青青草原国产免费av观看| av大片在线无码免费| 熟妇人妻无乱码中文字幕真矢织江| 国产第一色| 婷婷开心中文字幕| 亚洲精品自在线拍| 国产波多野结衣中文在线播放| 国产三级a| 六月婷婷综合| 99一级毛片| 99久久婷婷国产综合精| 久久久久久尹人网香蕉| 国产精品对白刺激| 日韩国产精品无码一区二区三区| 中文字幕在线看| 国产精品性| 久久综合结合久久狠狠狠97色| 青青国产视频| 99国产精品国产高清一区二区| 婷婷五月在线| 99在线小视频|