









〔摘要〕 目的 利用本體技術實現中醫厥證領域知識的共建、共享及推理。方法 提取中醫文獻中的厥證相關知識,使用斯坦福大學提出的本體構建“七步法”,基于Protégé工具構建中醫厥證領域本體,實現厥證相關知識的領域建模,并進行內部一致性檢驗,實現本體的推理功能。結果 構建的中醫厥證領域本體共有27類,585個實例,25個對象屬性,其中反向屬性6個,數值屬性1個,均通過了一致性檢驗,實現厥證領域知識的語義化表達,完成厥證知識的共建、共享和推理。結論 本研究采用本體技術,促使中醫厥證領域知識的融合重組與推理,為將來中醫急危重癥診療知識庫的構建、中醫急危重癥應急決策和輔助診療等系統的建立,奠定基礎并提供參考。
〔關鍵詞〕 中醫急危重癥;厥證;證型;癥狀;語義網絡;領域本體;智能決策
〔中圖分類號〕R259" " " " "〔文獻標志碼〕A" " " " " 〔文章編號〕doi:10.3969/j.issn.1674-070X.2024.03.011
Domain ontology construction of TCM syncope pattern
ZHANG Shina1, GAO Yuan1, ZHENG Aihua2, YAN Junfeng3*
1. School of Chinese Medicine, Hunan University of Chinese Medicine, Changsha, Hunan 410208, China; 2. Department of Critical Care Medicine, the Second Hospital of Hunan University of Chinese Medicine, Changsha, Hunan 410005, China;
3. School of Informatics, Hunan University of Chinese Medicine, Changsha, Hunan 410208, China
〔Abstract〕 Objective To realize the co-construction, sharing, and reasoning of the domain knowledge of TCM syncope pattern by means of ontology. Methods The knowledge related to syncope pattern in TCM literature was extracted, and the \"seven-step method\" proposed by Stanford University was used to construct the domain ontology of syncope pattern in TCM based on the Protégé tool and to realize the domain modeling of the related knowledge of syncope pattern. The internal consistency was checked and the reasoning function of its ontology was achieved. Results The constructed domain ontology of TCM syncope pattern had 27 classes, 585 instances, and 25 object attributes, including 6 reverse attributes and 1 numerical attribute, all of which had passed the consistency test. The semantic expression of the domain knowledge of TCM syncope pattern had been realized, and the co-construction, sharing, and reasoning of it had been achieved. Conclusion The use of ontology technology realizes the blending, recombination, and reasoning of the domain knowledge of TCM syncope pattern, which lays the foundation and provides reference for the further construction of the knowledge base for the diagnosis and treatment, the establishment of the emergency decision-making system and the auxiliary diagnosis and treatment system for acute and critical illnesses in TCM.
〔Keywords〕 acute and critical illness in TCM; syncope pattern; pattern; symptom; semantic network; domain ontology; intelligent decision-making
中醫藥發展千余年,積累了豐富的急危重癥救治理論和方法。然而,中醫急診急救知識應用于臨床實踐者較少,未被充分挖掘和利用[1]。將沉睡于文獻籍海中豐富的中醫急危重癥診療知識重新組織和管理,實現高效的語義檢索、語義推理和知識發現[2],是將中醫急危重癥診療知識靈活創新、推廣應用的重要手段。本研究以中醫厥證這一臨床常見急危重癥為例[3],對其領域知識進行系統采集、分類、語義標注,采用斯坦福大學提出的本體“七步法”,借助Protégé軟件[4],建立符合中醫急危重癥快速診斷、精準施治、有據可查特點的中醫厥證領域本體,并進行推理驗證,實現知識可視化查詢,為中醫急危重癥系統知識網絡、中醫急危重癥智能決策等系統的構建,奠定基礎并提供參考。
1 資料與方法
1.1" 領域知識范疇
1.1.1" 知識來源" 厥證知識源自以下4個方面:(1)中醫學教材,如《中醫急診學》[5]《實用中醫內科學》[6]《中醫內科學》[7]等。(2)相關指南,如《中醫急診急救指南》[8]。(3)中醫學著名典籍,如《肘后備急方》[9]《外臺秘要》[10]《急救廣生集》[11]等。(4)文獻知識庫,如中國知網和《中華歷代名醫醫案全庫》[12]。
1.1.2" 納入標準" 厥證這一疾病由來已久,但該疾病名稱在歷史發展中多有變遷,文獻中記載的“厥”“昏厥”“暴厥”“薄厥”“厥逆”“暈厥”“厥脫”皆與厥證有關。納入與上述病名有關的知識。其中,中國知網中的厥證知識檢索關鍵詞為“厥證”“醫案”或“病案”,發表時間限定為2014年2月1日至2023年2月1日。
1.1.3" 排除標準" (1)知識來源中僅提及或僅解釋病名,但未詳細記載厥證有關的臨床表現、診斷、治療等內容的知識;(2)不同知識來源中多次重復記載的知識,對年代久遠的知識予以剔除,僅保留時間最近的文獻知識;(3)患者臨床信息不全、診斷及用藥不明確、療效未具體說明的醫案知識。
1.1.4" 中醫術語規范化方法" 術語規范化參考《中國中醫藥學主題詞表》,對于《中國中醫藥學主題詞表》中未出現的術語,參考中醫臨床術語系統;若以上兩者都未出現,則在研究團隊內組織會議,以“少數服從多數”的原則進行術語規范化。
1.2" 構建方法
目前,本體的構建方法較多,如七步法、骨架法、企業建模法、互操作定義法、循環獲取法等[13]。本體構建“七步法”由斯坦福大學醫學院生物信息研究中心提出,且提供了Java編寫的開源軟件Protégé工具。該工具操作界面友好,以樹狀結構逐層展開,便于查看本體的層次結構[14],并允許用戶直接對本體進行管理操作和導航,集本體論編輯和知識庫編輯于一身,且該軟件開放源碼,支持插件擴展,支持可擴展標記語言(extensible markup language, XML)、資源描述框架(resource description framework, RDF)、網絡本體語言(ontology web language,OWL)等本體表示語言,后臺支持數據庫存儲[15]。因此,本研究采用本體構建七步法,使用Protégé 5.5.0軟件對OWL進行完整闡述,使用軟件自帶推理機HermiT對本體進行一致性檢驗。構建流程詳見圖1。
1.2.1" 類和類目" 類是本體的核心[16]。經過對篩選出的厥證知識整理和調整,其涉及的概念可歸入以下10個核心類:中醫疾病、西醫類病、病因、病機、癥狀、治療、穴位、中醫器械和設備、中醫操作方法、知識來源,具體類目構建詳見圖2。本研究厥證本體類的構建特色:(1)在不同的厥證相關文獻中,關于厥證的診斷和治療有所不同,單獨設有“知識來源”的類來標記知識的出處,以利于將來本體的知識聚類和知識發現。(2)中醫厥證治療涉及一些中醫器械和工具,如毫針、刮痧板等,因此,中醫器械和工具應作為一個單獨的類,中醫操作方法也應作為一個單獨模塊,以方便與中醫器械、工具建立二元關系。(3)中醫厥證具有發病急、病情程度重、病情變化快的特點,在疾病診治的速度和效率方面有特殊要求。因此,本體結構中須涵蓋充足的急救方法才能滿足使用者的需求,本研究收集中醫古籍中散落的簡便廉驗的急救方法,擴充厥證急救模塊。(4)中醫厥證包含西醫多種疾病,設立西醫類疾病的類,可作為中醫厥證與西醫相關疾病的關系接口。
1.2.2" 類的屬性設置" (1)對象屬性。對象屬性用來描述兩個實體間的關系,在屬性設置中十分重要,使用頻率最高。合理恰當的對象屬性設置,能為推理機提供更多的推理依據[17]。通過對象屬性定義域和值域限定,可以規范數據質量[18]。其中,定義域指在本體知識體系中存在的能夠作為輸入值的主體概念集合,值域是指在定義域范圍內所有可能作為輸出值的概念集合。例如,“導致”的定義域是“病因”,值域是“厥證”,與其相關的逆屬性(inverse of)“由……導致”的定義域是“厥證”,值域是“病因”。本研究構建的對象屬性共25個,其中反向關系6個。詳見表1。
(2)數據屬性。數據屬性是一個類或實例的數據值。例如,某患者的性別是男性,年齡為38歲,病程是1小時,性別、年齡、病程均為數據屬性[19]。數據屬性的設置在現有本體表達中較少。例如,美國密歇根大學開發的不良反應本體也僅有1種,基于中醫厥證所涉及的具體屬性,本研究僅設立1種數值屬性——“藥物使用場景”。通過對病情程度的判斷,在不同場景下選擇不同的方劑,如食厥重癥患者,優先使用“濃鹽湯”探吐,再使用神術散合保和丸加減。對于數據屬性的設置,將來可進一步擴充,如藥物劑量、呼吸頻率、脈率等,可為使用者提供更詳細的參考。
1.2.3" 實例添加" 實例也稱個體,是類的具體成員。以厥證系統知識為依據進行實例構建。Protégé軟件僅允許類和類、實例和實例之間建立二元關系,若將含有實例較多的類按照子類構建,不利于語義的表達[20],本研究將證型、知識來源、方劑、藥物等類按照實例構建。以中醫厥證知識來源的權威書籍《中醫急診急救指南》中提出的厥證證型為例,展示實例添加在對象屬性欄中選擇“觀點有”與《中醫急診急救指南》提出的厥證“證型”相聯系,該權威著作提出氣厥-實證、氣厥-虛證、血厥-實證、血厥-虛證、食厥、痰厥和暑厥7個厥證證型,構成相關實例的添加。詳見圖3。
2 結果
構建的中醫厥證領域本體共有27類,585個實例,25個對象屬性,其中反向屬性6個,數值屬性1個,通過了一致性檢驗,實現厥證領域知識的語義化表達,完成厥證知識的共建、共享和推理。
2.1" 一致性檢驗
在本體構建過程中,系統內部始終在進行邏輯檢驗,如邏輯式編寫錯誤或者引用不存在的類、屬性或實例,軟件會自動將錯誤內容劃紅線提示,且無法對該條邏輯執行“完成”操作,以盡可能保證本體構建過程中的準確性。本體內部類的從屬關系是否正確,需要通過本體推理來檢驗[21]。如果本體具有內在一致性,推理機會根據已經設定的語義關系自動歸類,且歸類結果以淺黃色標亮顯示[22];如果本體不具有內在邏輯的一致性,推理機則會報錯。本研究采用Protégé軟件附帶的HermiT推理機來檢驗本體內部邏輯的一致性,啟動 Protégé 推理機,推理機根據已定義的語義關系自動補充歸類。例如,已在“癥狀”的實例中添加每個癥狀的歸屬證型,推理機能根據已定義的“證型”表現為“癥狀”的語義關系,自動歸類出厥證的每個證型的臨床癥狀,系統自動實現了厥證“暑邪閉竅”證型的主要癥狀、次要癥狀及舌脈象的推理,即圖中自動標黃且無法手動修改的部分為推理結果,表明該本體通過了內部一致性檢驗,知識模型架構合理準確。詳見圖4。
2.2" 厥證知識體系可視化
本研究通過Protégé的OntoGraf插件實現語義關系的可視化展示。本體構建完成后可對部分類名和實例名進行本體內的檢索和可視化,使厥證知識更加體系化。厥證本體圖形化展示見圖 5—9,分別展示了厥證的證型、癥狀、辨證論治及厥證整體語義網絡。
由圖5可知,與厥證有關的證型以立體網狀結構呈現,有血郁氣逆、痰厥、暑厥、肝氣郁滯、食厥、暑邪閉竅、熱厥、寒厥、氣厥-實證、氣厥-虛證、血厥-實證、血厥-虛證等。
在本體內查詢,得到厥證的主要癥狀、次要癥狀、兼夾癥狀的分類,如厥證的主要癥狀有突然昏倒、不省人事、四肢厥冷等。詳見圖6。
厥證辨證論治語義網絡,包括證型、治法、方劑、藥物。厥證的證型包括氣厥、血厥、寒厥、暑厥等。厥證的治法包括順氣開郁、益氣養血、溫經散寒、清暑益氣等。厥證的治療方劑包括獨參湯、丹參飲加減、四味回陽飲加減、清暑益氣湯加減等。治療厥證的藥物包括人參、丹參、附子、西洋參等。詳見圖7。
厥證語義網絡架構及內容包括四級。一級為厥證;二級為病因、癥狀、中醫器械與設備、穴位、治療、中醫疾病、西醫類病、知識來源、中醫操作方法、病機;三級為綜合治療、辨證論治、急救措施;四級為藥物、方劑、中醫古籍急救方法、注射劑、中成藥、治法、證型、針灸。詳見圖8—9。
3 討論
中醫歷次重大理論突破都是以急危重癥的治療為突破口[23],對急危重癥的救治是中醫學的立身之本。在中醫藥信息化戰略背景下,中醫急危重癥亟需借助現代科學技術手段,走信息化道路,以更好地發揮中醫對急危重癥救治的優勢,如構建中醫急危重癥智能輔助決策系統、專家系統、智能預警系統等,是中醫急危重癥醫學發展的新趨勢。而中醫急危重癥是一個巨大的系統,其知識表示和知識庫構建是一項巨大的工程,可將典型疾病的知識表示和語義網框架的建立作為范例,以拋磚引玉。厥證是一種臨床常見的急危重癥,臨床以突然昏倒、不省人事、四肢逆冷為主要表現[24]。該病名最早見于《黃帝內經》,歷經數千年而沿用至今,歷代醫家對厥證病因、病機及治療等多個方面的記載和論述較為翔實[25],但在實際中醫臨床診療中,醫師掌握的厥證知識并不全面,對疾病的認識和治療多有不足,加之中醫診療多依賴于醫師的主觀感受和經驗,可能導致對疾病的誤解、誤判和誤治,這是厥證乃至整個中醫急危重癥臨床實踐中急需解決的問題,是導致中醫藥在急危重癥的臨床診療中應用偏少和使用效果不佳的重要原因[26]。構建厥證語義知識網絡,可將厥證相關知識系統而全面地重建,實現厥證領域知識的共享、推理和查詢,通過知識服務的方式提高厥證臨床診療效率,有利于改善目前西醫急救占主導的現狀,而且能對將來整個中醫急危重癥系統知識表示、語義檢索和數據挖掘起到示范和參考的作用。
本體是一種知識建模工具,能夠很好地描述概念和語義關系,具有良好的層次結構和邏輯推理支持,可有效解決概念理解歧義的問題,具有拓展和優化語義檢索的優勢,并且能進行知識推理,實現知識的自動歸類和語義關系發現[27],較為適合知識靈活度較大的中醫藥領域知識表示。近年來,本體理論和技術在中醫藥領域應用有所增加,如劉暢[28]構建了嶺南灸法古籍知識的領域本體,并在此基礎上進行語義檢索的聯想和推薦,實現了嶺南針灸知識中顯性知識和隱性知識的語義化表達;鮑玉來[29]構建了蒙醫藥的蒙漢雙語本體知識庫,實現了蒙醫藥知識服務的實踐;朱玲等[30]構建了哮喘疾病本體,對哮喘領域知識體系進行了重新組織和表示等。
本研究從與厥證相關的教材、指南、權威書籍、診療資料中,獲取厥證知識并進行規范化,在正確理解其概念術語的內涵和外延的基礎上,使用OWL語言,利用本體工具 Protégé構建了厥證本體,該本體共提取出27個類,25個對象屬性,1個數據屬性,585個實例,且通過了本體內部一致性檢驗,最后使用Protégé自帶的OntoGraf插件實現本體可視化和知識交互。通過本體技術,厥證知識能被更科學系統地利用、發現和管理,為厥證文獻的全面檢索、數據庫建設、文本挖掘以及概念闡釋提供基礎,為醫師提供更深刻、完整、全面的厥證知識服務。
目前,本研究構建的厥證本體庫依然存在一些不足,如完整性和簡潔性方面。未來可進一步擴充厥證的概念及屬性關系,進一步探索基于本體更加清晰、完整的知識庫,可望發展成為未來中醫急危重癥檢索問答系統、應急決策系統等各種知識服務的知識庫組成內容,對將來整個中醫急危重癥領域更加復雜和完善的語義網絡、中醫急危重癥臨床智能決策系統知識庫的構建都具有一定的參考價值。
參考文獻
[1] 李" 強. 劉清泉:為中醫急診正名[J]. 中國醫院院長, 2020(1): 82-83.
[2] 李盼飛, 張楚楚, 李海燕. 科技賦能中醫古籍精華傳承與創新應用[J]. 中醫雜志, 2023, 64(15): 1519-1524.
[3] 朱俊秀, 聞永毅, 李亞軍. 陳士鐸辨治厥證學術思想探究[J]. 中國中醫急癥, 2021, 30(5): 892-893, 927.
[4] 王" 松, 李正鈞, 楊" 濤, 等. 國醫大師周仲瑛辨治肺癌的中醫藥本體構建研究[J]. 世界科學技術: 中醫藥現代化, 2022, 24(2): 495-501.
[5] 劉清泉. 中醫急診學[M]. 北京: 中國中醫藥出版社, 2016: 107-109.
[6] 王永炎, 嚴世蕓. 實用中醫內科學[M]. 2版. 上海: 上海科學技術出版社, 2009: 69-72.
[7] 吳勉華, 王新月. 中醫內科學[M]. 3版. 北京: 中國中醫藥出版社, 2012: 143-148.
[8] 龐國明, 張勝強, 劉增省. 中醫急診急救指南[M]. 北京: 中國醫藥科技出版社, 2019: 48-54.
[9] 葛" 洪. 肘后備急方[M]. 北京: 中國中醫藥出版社, 2016: 1-12.
[10] 王" 燾. 外臺秘要方[M]. 北京: 中國醫藥科技出版社, 2011: 99-117.
[11] 程鵬程. 急救廣生集[M]. 北京: 人民軍醫出版社, 2009: 82-89.
[12] 魯兆麟. 中華歷代名醫醫案全庫[M]. 北京: 北京科學技術出版社, 2015: 2360-2389.
[13] 任" 高, 張倫倫, 李" 冉, 等. 中醫不寐知識圖譜構建與知識發現[J]. 湖南中醫藥大學學報, 2023, 43(9): 1664-1671.
[14] 王欣宇, 楊" 濤, 胡孔法. 基于知識表示學習的名老中醫治療肺癌用藥知識自動化補全研究[J]. 南京中醫藥大學學報, 2023, 39(10): 972-978.
[15] 徐偉超, 杜艷茹, 郎曉猛, 等. “數據-知識”雙驅動模式的辨證決策方法探索: 以胃癌前狀態為例[J]. 中醫雜志, 2024, 65(2): 154-158.
[16] 蔡" 云. 周仲瑛教授治療肺癌的知識本體構建與數據挖掘研究[D]. 廣州: 廣州中醫藥大學, 2019.
[17] 鄺浩丹. 《傷寒論》知識圖譜構建及其在陽明病的應用[D]. 杭州: 浙江中醫藥大學, 2021.
[18] 朱" 玲, 李敬華, 于" 彤, 等. 基于本體的功能性胃腸病知識庫構建研究[J]. 湖南中醫藥大學學報, 2018, 38(10): 1154-1160.
[19] RODRíGUEZ-GARCíA M á, HOEHNDORF R. Inferring onto?logy graph structures using OWL reasoning[J]. BMC Bioinformatics, 2018, 19(1): 7.
[20] ZHANG L, WANG Y Z, ZHAO X Y. A new emergency decision support methodology based on multi-source knowledge in 2-tuple linguistic model[J]. Knowledge-Based Systems, 2018, 144: 77-87.
[21] STEVENS R, GOBLE C A, BECHHOFER S. Ontology-based knowledge representation for bioinformatics[J]. Briefings in Bioinformatics, 2000, 1(4): 398-414.
[22] GOMEZ-VALADES A, MARTINEZ-TOMAS R, RINCON M. Integrative base ontology for the research analysis of Alzheimer's disease-related mild cognitive impairment[J]. Frontiers in Neuroinformatics, 2021, 15: 561691.
[23] 姜德友, 孟" 璐, 李超然, 等. 厥證源流考(二)[J]. 中國中醫急癥, 2018, 27(8): 1479-1482, 1485.
[24] 楊" 濤, 沈" 劼. 金元四大家論治厥證[J]. 中國中醫急癥, 2020, 29(10): 1858-1860, 1863.
[25] 姜德友, 孟" 璐, 李文昊, 等. 厥證源流考(一)[J]. 中國中醫急癥, 2018, 27(7): 1280-1282, 1285.
[26] 朱晨晨. 中醫藥急診發展戰略展望[J]. 中華中醫藥雜志, 2019, 34(2): 460-466.
[27] 陳" 琦, 李" 芹, 張君冬, 等. 中醫臨床試驗文獻知識本體的構建[J]. 中國實驗方劑學雜志, 2023, 29(20): 190-197.
[28] 劉" 暢. 基于本體的嶺南灸法古籍知識庫構建研究[D]. 廣州: 廣州中醫藥大學, 2019.
[29] 鮑玉來. 基于領域本體的蒙醫藥學知識庫構建與知識發現研究[D]. 長春: 吉林大學, 2018.
[30] 朱" 玲, 李敬華, 于" 琦, 等. 中醫哮喘領域本體的構建[J]. 中國實驗方劑學雜志, 2017, 23(15): 5.