張秀梅 翟運開 丁 楠 吳晨溪 張兵濤 徐建武
(中國科學技術信息研究所 北京 100038) (鄭州大學管理工程學院 鄭州 450001) (北京萬方數據股份有限公司 北京 100038) (中國科學技術信息研究所 北京 100038)
臨床決策支持系統(Clinic Decision Support System,CDSS)是醫院信息系統重要組成部分,我國智慧醫院及電子病歷等相關政策明確對其提出要求[1]。隨著“互聯網+”、移動互聯、大數據、人工智能、機器學習、區塊鏈等新技術不斷發展,醫療及醫院信息化領域面臨著全新挑戰和機遇[2-3]。CDSS的歷史可以追溯到1976年斯坦福大學研究開發的MYCIN,雖然發展歷史久遠,但現實應用中仍存在一定問題,如知識與規則流程融合、臨床從循證醫學走向精準醫學、多學科聯合決策支持、知識內容嚴謹性和質控等[4-8]。本文從精準醫學臨床決策支持系統(Clinical Decision Support System for Precision Medicine, PM-CDSS)出發,研究構建支撐PM-CDSS的精準醫學知識組織體系,滿足CDSS在多角色工作場景中的信息需求。
醫學知識組織體系或知識組織系統(Medical Knowledge Organization Systems, MedKOS)涵蓋醫學領域內各種詞表、概念體系、分類體系等,具有組織和描述醫學知識、概念語義消歧和標準化、概念間層級和非層級結構語義關聯展示等功能,屬于圖書情報學科領域中的一個分支,包括對知識單元或概念內在結構進行的加工、整理、序化、表示等一系列操作。
國外關于醫學知識組織研究較為成熟,其中在臨床及學術領域應用較為廣泛的有:醫學主題詞表(MeSH)、一體化醫學語言系統(UMLS)、系統化人獸醫學術語表臨床術語(SNOMED CT)、觀測指標標識符邏輯命名與編碼系統(LONIC)、國際疾病分類(ICD)等;精準醫學相關知識組織有:人類孟德爾遺傳在線(OMIM)、罕見病(ORPHA)、中文人類表型(CHPO)、藥物基因組學(PharmGKB_drugs)、基因(HGNC)、變異(DisGeNET)、藥物編碼查詢系統(ATC)等。國內醫學知識組織體系有:中國圖書館圖書分類法、醫學主題詞表中文版、UMLS中文版、中醫藥主題詞表等[9-17],見表1。

表1 國內外主要醫學知識組織體系

續表1
3.1.1 概述 基于場景的精準醫學臨床決策支持系統(Senario based Clinical Decision Support System for Precision Medicine,PM-CDSS)為精準診斷和治療提供決策支持,涵蓋場景、對象、時間、決策信息的精準等。構建覆蓋全學科、多角色(支持醫生、護士、藥劑師、麻醉師、檢查/驗技師等)主要工作場景,滿足診前、診中及診后全流程需求的精準醫學決策支持系統,為臨床工作提供及時、有效的精準參考建議,進而降低醫療風險,提高總體診療水平[18]。本文基于上述對于精準醫學的理解和認知,重點分析PM-CDSS的場景需求及知識組織設計。
3.1.2 特點 對知識數據顆粒度要求更細、內容時效和準確度要求更高,需要抽提各類醫學概念類;在推理過程中以醫學概念類之間的語義關系為基礎,建立語義規則庫,為輸出最佳決策信息提供支撐。能夠適應不同終端載體,深入場景與各醫院信息系統深度整合,動態、精準地提供決策支持。傳統CDSS與精準CDSS區別,見表2。

表2 傳統CDSS與精準CDSS區別
3.2.1 概述 一方面遵從循證醫學要求,知識數據必須有權威可靠出處,才能夠為決策支持所用;另一方面數據廣度和深度要求更高,數據廣度方面增加精準醫學相關術語和知識,深度方面需要對數據進行二次碎片化加工,為臨床決策提供支撐。

表3 精準醫學主要概念及數據來源
3.2.2 獲取途徑 一是國內外主要醫學知識組織術語集合,包括精準醫學相關術語體系,如ICD10/11,SNOMED CT,OMIM,ORPHA,CHPO等;二是國家頒布的各類標準,醫保目錄,醫療服務操作項目等;三是臨床路徑或指南等正式公開發表的文獻,權威工具書教材等;四是官方渠道獲取,如藥品說明書等;五是基于醫院臨床實際情況經過驗證的方法結論[19-20]。此外在以上數據采集的基礎上,還需要對數據進行二次深度加工,包括數據碎片化加工、術語統一等處理,以及最終數據的審核入庫。
3.3.1 意義 傳統知識庫以文獻為單元進行知識組織,而精準醫學知識庫的數據顆粒度更小,需要將醫學領域中涉及到的醫學概念進行抽取標注。通過提取概念可以為后續構建語義關系提供基礎,不同概念類別也能夠為不同決策場景提供數據支持。
3.3.2 知識類型 本文以臨床醫學指南、臨床路徑、檢查檢驗操作指南、藥物說明書等數據為基礎,根據臨床應用場景需求,將醫學概念進行聚類歸納后,總結出以下10個主要知識類型:疾病類、癥狀體征類、病因病機類、藥物類、檢查類、檢驗類、護理類、診斷類、治療類、個體特征類。除定義每個概念類別自有屬性值(如名稱、別名、ID等)外,還需定義概念相關屬性,例如數值屬性,如年齡、性別是單值屬性,參考值范圍是數值屬性;對象屬性指兩個類別之間的關系,如癥狀發生的部位、適應癥對應的疾病等[21-24]。此外需要對每個概念類賦予唯一ID,建立統一的分類體系,并將其與院內各類醫學術語詞典進行匹配關聯,便于后期語義關系的梳理、導航瀏覽及系統對接應用。精準醫學知識組織體系,見圖1。

圖1 精準醫學知識組織體系
3.4.1 內涵 語義關系構建是精準醫學決策支持的關鍵,智能化的動態提醒基于強大的數據規則庫作為支撐,不同場景下通過調用不同規則語義關系可以實現不同支持目的,如醫囑推薦、醫囑合理性判斷、診斷及鑒別診斷等。
3.4.2 語義關聯關系 根據已有知識組織體系相關研究[25-26],歸納總結以下常見的語義關聯關系:等級與非等級關系。非等級關系包括等同、相關關系及其他。本研究在梳理醫學概念類基礎上,總結參考臨床醫學指南、臨床路徑、檢查檢驗操作指南、藥物說明書等知識中關于概念與概念之間的描述,梳理標注22種精準醫學知識語義關系,見表4。由于醫學知識組織體系是不斷發展的體系,醫學概念及語義關系也會不斷更新調整。

表4 精準醫學知識語義關系
知識組織體系應用范疇較廣,在信息檢索優化、知識庫構建、臨床決策支持、命名實體識別、數據挖掘等方面都可以發揮重要作用。本研究僅在場景化的精準醫學決策支持方面進行討論。臨床診療活動是一個連續的過程,單場景應用包括臨床輔助診斷、臨床診療建議、合理性檢查、數值提醒、數據挖掘等方面,該方式無法完全發揮醫學知識組織在臨床實踐中的作用,如僅有診斷結論而沒有后續的治療建議,或僅有標準化的治療方案但缺少相應的個性化用藥指導等。鑒于此,提出基于臨床業務流程的決策場景,在臨床業務流程模型中每個業務節點都與知識庫進行關聯,在不同節點進行相應提醒,以門診和住院兩個場景為例進行分析。

圖2 門診場景精準醫學決策支持
詢問病情時能夠提供問診及分診信息;初步診斷時提供輔助診斷建議;下達檢查檢驗醫囑時推薦合理的檢查檢驗項目并對其合理性進行判斷;閱讀結果報告時有相關解讀及危急值提醒標注;下達用藥處方時提供藥物說明并合理性判斷;患者離開醫院后能夠進行健康管理。

圖3 住院場景精準醫學決策支持
撰寫電子病歷時有相關提醒及校正;初步診斷時進行鑒別診斷提醒;下達醫囑時有推薦醫囑提醒,并對醫囑內容進行合理性判斷及風險提醒;閱讀結果報告時有相關解讀及危急值提醒標注;制定并執行治療處理方案時有風險評估、護理方案及相關風險預測提醒;患者出院后能夠進行健康管理。
基于場景的精準醫學知識體系研發以臨床業務流程為中心,滿足各種場景臨床決策支持需求。本文通過調研國內外醫學知識組織體系及臨床主要業務場景,對PM-CDSS特點、醫學知識組織體系、知識數據來源、概念抽取、語義關系梳理及場景應用進行系統性研究,由于精準醫學知識組織體系是一個復雜且龐大的工程,現有知識組織體系還存在一定差距,下一步將在PM-CDSS實現、知識組織工程化以及知識組織體系完善等方面開展研究。