于彤++劉靜++朱玲++董燕++賈李蓉++楊碩++譚麗娜


摘要:描述邏輯是一種面向計算機知識表示的邏輯語言,主要用于描述概念分類以及概念之間的關系。因其表達能力強、邏輯嚴謹、支持自動推理等特點,在本體工程中得到了廣泛應用。本文結合中醫藥知識體系的具體案例介紹描述邏輯的概念、特點和表達方式,并探討其在中醫藥領域的應用價值。
關鍵詞:描述邏輯;中醫藥;本體;知識表示
在計算機科學領域,本體是針對一個概念體系的正式而明確的規范。傳統的本體構建方法包括框架系統(frames)和語義網絡(semanticnetwork)等。這些方法在語義上缺乏嚴謹性,實際應用效果并不盡如人意。近年來,描述邏輯(description logics,DL)以其強大的表達能力和可計算性的保證,已逐漸取代上述兩種本地構建方法而成為新的主流。
DL為中醫藥知識體系的系統梳理提供了嚴謹的邏輯模型。它不僅能有效處理中醫藥領域的復雜知識,對中醫藥概念體系進行精確描述和規定,而且將有助于提升中醫藥領域本體的規范性。但中醫藥信息學者在本體工程實踐中尚未充分利用DL的表達能力,有關DL在中醫藥領域應用的文獻較少。筆者將結合中醫案例介紹DL的概念、特點和表達方式,并探討DL在中醫藥領域的應用價值,為構建基于DL的中醫藥領域本體提供參考。
1 描述邏輯的基本概念
DL是一類形式化知識表示語言的統稱,可用于對概念定義及特征進行形式化描述,并據此實現概念之間關系的自動推理,因而適用于領域概念化和本體設計。DL技術產生于20世紀80年代,在90年代取得了一系列理論和算法上的突破,從21世紀開始則趨于實用化。經過20余年的發展,DL已成為成熟的知識表示系統。
根據DL,一個知識體系中包括3種基本組件:概念(concept)、角色(role)和個體(individual)。其中,“個體”對應某個具體的對象;“概念”對應由兩個或多個對象所構成的集合,這些對象被稱為這一“概念”的實例(instance);“角色”則表示某種個體之間的二元關系。例如,“病人”屬于一個概念,某位病人“張三”屬于個體;“四君子湯”屬于一個概念,“張三”某次服用的一副“四君子湯”則是一個個體;若“張三”被診斷為“腎虛”,則可以說“腎虛”屬于一個概念,而“張三”的臨床表現屬于“腎虛”的一個實例;“治療”“臨床表現”等二元關系則屬于角色。DL為表達領域實體之間的關系提供了多種手段。
1.1 蘊含(i nc lusi on)關系
DL可表達概念或角色之間的蘊含關系( )。例如,“中藥 藥物”表明“藥物”這一概念囊括(subsume)了“中藥”這一概念;又如,“治療 影響”表明“治療”關系是一種特殊的“影響”關系。
1.2 等價(equivalence)關系
DL可表達概念或角色之間的等價關系( )。例如,“病人;患者”表明“病人”和“患者”是同義的概念;又如,“治;治療”表明“治”和“治療”是同義的角色。
1. 3 隸屬(type)關系
DL可表達“個體”和“概念”之間的隸屬關系(∈)。個體是從某個(或某些)概念延伸出來的一個特殊的實例,而這個(這些)概念被稱為該個體的類型(type)。例如,“人參∈中藥”表明人參屬于一種中藥;“氣虛證∈證候”表明氣虛證屬于一種證候。
1.4 個體關聯關系
DL可通過斷言(assertion)表示個體之間的二元關系。可將“四君子湯”“人參”“氣虛證”等領域實體表示為個體,再通過“包含”“治療”等角色表達個體之間的關聯關系,如(人參,治療,氣虛證)(四君子湯,包含,人參)等。
2 描述邏輯的表達方式舉例
DL為表達復雜的領域知識提供了豐富的表達方式。如表1所示,DL提供“合取( )”“析取( )”“非( )”“存在量詞( )”“全稱量詞( )”等構造算子(constructor),用于通過簡單概念和角色來構造復雜概念。例如,可將“疏肝劑”這一概念表示為“方劑 疏.肝”;又如,“中醫典籍 作者.中醫”表示“中醫典籍的作者僅能為中醫”。可見,DL是一種側重于描述“疏肝湯”之類復雜概念的邏輯語言,這也是“描述邏輯”名稱的由來。下面對DL的表達方式進行具體介紹。
2.1 互斥關系
DL可被用于定義兩個概念是互斥的。在DL中,A
B表示概念A和B是互斥的;即任意A的實例不可能同時是B的實例。例如,可通過“寒;一熱”表示“寒”和“熱”兩者之間沒有交集。
2.2 全稱約束
在DL中,全稱量詞V表示“僅僅”“只”等意思。例如,“方劑 包含.中藥”表示“任意方劑所包含的僅能是中藥(它不能包含西藥)”的概念,即“任意一種方劑都僅能與中藥發生‘包含關系”;又如,“水 克.火”表示“屬水者僅能克火”的意思。
2.3 存在約束
在DL中,存在量詞 表示“存在”的意思。例如,“方劑 包含.中藥”描述“任意方劑都‘存在一些組成成分”的概念,即“每種方劑都與某些中藥存在‘包含關系”。
2.4 角色互逆
在DL中,一個角色可被聲明為另一個角色的逆角色。P為Q的逆角色,則任意形如(x,P,y)的陳述蘊含形如(y,Q,x)的陳述。DL使用負號來表示逆角色,P-Q即表示P為Q的逆角色。例如,“被治療;治療”表達“治療”和“被治療”之間的互逆關系。
2.5 角色的定義域和值域
通過DL可以描述各種角色的定義域(約束角色適用的主體的取值范圍)和值域(約束屬性適用的客體的取值范圍)。例如,“ 治療.
藥物”表示“治療”的定義域為藥物,“ 治療.疾病”表示“治療”的值域為疾病(T表示包含所有事物的類型)。
3 描述邏輯的應用價值
近年來,本體成為實現生物醫學術語規范化的一項新興技術,它幫助交互各方對特定領域內共用的概念、術語以及概念分類建立一致的理解,從而支持知識的表示與共享。目前,生物醫學領域已出現了數百個本體,著名的UMLS、SNOMED CT、Gene Ontology等生物醫學術語系統都體現了本體的設計理念和方法。本體技術在中醫藥領域也得到了成功應用,建成了溫病學、傳統針灸、中醫脾胃病、中醫證候、中藥、中醫古籍等方面的一系列本體。DL作為目前國際上主流的本體表示方法,在中醫藥領域具有廣闊的應用前景。
DL在中醫藥領域的核心作用在于構建領域本體以及基于本體的知識庫,從而系統性地存儲和管理中醫藥領域知識,為知識服務系統提供穩定的知識來源。中醫藥知識體系具有結構復雜、表達方式多樣、模糊性強等特點,DL為中醫藥領域提供了高級的知識建模手段。基于DL,可對中醫證候學等復雜知識進行清晰表達,有利于梳理證候、疾病、癥狀、中藥、方劑、治法、出處等之間錯綜復雜的關聯關系,建立以本體為主框架的中醫藥知識體系。因此,DL為中醫藥本體知識庫系統的構建提供了解決方案。
DL在保證可計算性的前提下,提供了強大的表達能力。基于DL的理論,己出現了FaCT、Racer、Pellet等一系列實用的推理機,在實際應用中均表現出良好的性能。在未來,有可能將中醫辨證論治的知識存入知識庫中,基于DL實現中醫藥知識的自動推理,從而改進臨床決策支持系統的效果,幫助臨床醫師做出更準確的診斷。
基于DL的邏輯模型可為語義關系賦予更加確切的含義。例如,假設在本體中具有“中藥,治療,疾病”這樣一條語義關系,若這條關系意味著“任何中藥都能治療某種疾病”,則對應的DL公式為“中藥 治療.疾病”。嚴謹的DL公式可用于自動檢測本體中的錯誤。例如,“方劑”和“中藥”之間的關系一般是“某方劑是由某些中藥組成的”,兩者之間不可能出現“治療”關系。可通過DL規定“方劑和中藥之間只能存在‘由……組成關系”,指導推理機找出本體中的錯誤,藉此保持本體內邏輯關系的一致性。例如,若機器發現形如“方劑,治療,中藥”的語義關系,則可將其作為一個錯誤呈現給系統管理員,由管理員檢查錯誤的原因并修改。另外,DL還能支持本體自動轉換、自動重構等方法的實現,促進中醫藥本體的規范化。
DL與語義網(semantic web)技術有密切聯系。語義網是一個機器可以理解且人機共享的信息空間,為在互聯網環境中進行語義信息和結構性知識的交換提供了理想的解決方案。DL為語義網技術體系之中的萬維網本體語言OWL提供理論基礎,對OWL的設計和語義定義起到指導作用。因此,基于DL構建的知識庫與互聯網具有天然的結合點,有利于通過互聯網對中醫藥知識進行廣泛傳播,
4 小結
DL是近年來知識表示領域的研究熱點,因其表達能力強、邏輯嚴謹、支持自動推理等特點,在本體工程中得到廣泛的應用。DL為中醫藥領域提供了高級的知識建模手段,使領域本體在邏輯上更加嚴謹,應用上更為可行。在中醫藥領域中應用DL,需要分析實際的語言環境,理解語義關系的確切內涵和用法,進而決定邏輯模型的設計。可選擇中醫證候學等涉及復雜概念體系和領域邏輯的子學科開展DL的示范性應用研究,最終建立完整的中醫藥邏輯模型,為中醫藥領域的知識表示與共享奠定基礎。