999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

呼吸病學標準醫學術語在電子病歷中的使用情況調研

2021-10-08 04:04:43商濤程瑤陳祿明鄧立宗蔣太交
中國科技術語 2021年4期
關鍵詞:電子病歷

商濤 程瑤 陳祿明 鄧立宗 蔣太交

摘 要:調研全國科學技術名詞審定委員會發布的呼吸病學名詞在電子病歷中的使用情況。通過觀察疾病、體征或癥狀類標準醫學術語及其關聯的同義詞在呼吸疾病電子病歷中的分布,發現標準醫學術語在使用頻次上高于非標準醫學術語,但整體而言,同一醫學概念在不同來源的病歷中表達多樣,標準化程度不高。此外,《呼吸病學名詞》收錄的標準醫學術語及其同義詞對電子病歷中所使用的醫學術語覆蓋度偏低,需要擴充和完善。

關鍵詞:標準醫學術語;電子病歷;術語覆蓋度;術語標準化;術語挖掘

中圖分類號:R4;H083? 文獻標識碼:A? DOI:10.12339/j.issn.1673-8578.2021.04.008

An Investigation into the Practical Use of Respiratory Disease Standard Medical Terms in Electronic Health Record//SHANG Tao,CHENG Yao,CHEN Luming,DENG Lizong,JIANG Taijiao

Abstract: The application of standard respiratory disease terms constructed by China National Committee for Terms in Sciences and Technologies was investigated in this research. The usage frequency of standard disease and symptom terms of respiratory disease is much higher than synonymous of standard terms. Overall, the standard terms could not descript practical clinical problems completely in electronic health record as of the diversity of medical concepts. Otherwise, standard terms collected by Terms of Respiratory Disease also could not cover all synonymous in electronic health record. Thus, the continuous development is necessary to expand the coverage of respiratory disease terms in real world applications.

Keywords: standard medical terms;electronic health record;coverage of medical terms;terminology standardization;terms mining

收稿日期:2021-06-15? 修回日期:2021-09-05

基金項目:全國科學技術名詞審定委員會事務中心一般項目“醫學名詞審定中的同義詞整理與分析”(SWZX2018003),“科技名詞社會使用狀況調查”(SWZX202003);廣州實驗室應急攻關項目“新冠與其他12項呼吸道病原體核酸檢測技術和設備”(EKPG21-12)

引言

以臨床電子病歷為代表的真實世界數據(real world data)蘊含了豐富的患者診療信息,若能對這些診療信息加以有效利用,將極大地推動我國醫療健康大數據應用的發展[1]。然而,由于不同機構、不同醫生的用語習慣不同,電子病歷中的診療信息存在著用語不規范、不統一的問題,這為醫療健康大數據的整合和利用帶來了極大的障礙[2]。為規范我國臨床醫學術語的使用,以國家衛生健康委員會(簡稱“衛健委”)、全國科學技術名詞審定委員會(簡稱“名詞委”)為代表的國家機構頒布了一系列標準醫學術語①,引導中文醫學術語的規范表達,推動了我國醫學術語的標準化進程[3-4]。

調研已發布的標準醫學術語在真實世界數據中的使用情況是一項十分重要的工作[5]。這一工作通常可以從兩方面展開:一是調研真實世界數據使用標準醫學術語的情況;二是調研標準醫學術語對真實世界數據中所使用術語的覆蓋度。前者關注的是真實世界數據所使用醫學術語的標準化程度,后者關注的是標準醫學術語描述真實世界數據的完備程度。

國內外學者均非常重視調研標準醫學術語在真實世界數據中的使用情況。例如,來自梅奧診所的研究者[5]從電子病歷中搜集了4996個描述臨床問題的醫學術語,發現國際衛生術語標準制定組織制定的臨床醫學系統術語 (SNOMED-CT)能覆蓋其中92.3%的臨床問題術語。來自四川大學華西醫院的研究者[6]通過對比中文人類表型標準用語(CHPO)和從中文電子病歷中獲取的表型術語,發現電子病歷中使用的術語口語化、隨意化現象嚴重,同標準醫學術語集之間存在著巨大差異。中國醫學科學院的研究者[7]系統匯集了衛健委、名詞委發布的857 193個標準醫學術語,并統計了標準醫學術語對實際使用于臨床指南、電子病歷中的69 865個醫學術語的覆蓋度,發現中文標準醫學術語資源對于常見術語的覆蓋度較高(74.3%),但對不常見術語的覆蓋度偏低(26.8%)。

名詞委歷來都很重視標準醫學術語的審定與應用,不僅發布了呼吸病學、老年醫學等18個專科的標準醫學術語, 還發布了一系列專科醫學術語審定名詞與非規范名詞對照表[8]。然而,對于目前真實世界數據中對已發布的專科標準醫學術語的使用情況和專科標準醫學術語對真實世界數據中使用術語的覆蓋度尚缺少細致深入的研究。在本研究中,我們擬以名詞委2018年發布的《呼吸病學名詞》為切入點,調研《呼吸病學名詞》中有關疾病、體征、癥狀類標準醫學術語在電子病歷中的使用情況,以期充實和完善我國的呼吸病學標準醫學術語。

1 研究方法

1.1 研究設計

本研究的總體設計如圖1所示:首先,我們搜集并整理了名詞委《呼吸病學名詞》中疾病、體征或癥狀類標準醫學術語;隨后,我們通過匯集《呼吸病學名詞》《中文醫學主題詞表》(CMeSH,“萬方醫學網”發布)、“39健康網”等醫學健康網站收錄的同義詞資源,整理了與標準醫學術語存在同義關聯的非標準醫學術語;我們還通過術語挖掘的方法,從實際電子病歷語料中發掘了與標準醫學術語存在同義關聯的非標準醫學術語;最后,我們根據整理獲得的標準醫學術語和非標準醫學術語集,對它們在實際電子病歷語料中的使用情況展開調研。詳述如下。

1.2 搜集并整理《呼吸病學名詞》中疾病、體征或癥狀標準醫學術語

首先,我們搜集并整理了名詞委2018年發布的《呼吸病學名詞》中547個疾病、體征或癥狀類標準醫學術語,其中,疾病類標準醫學術語數目為428個,體征或癥狀類標準醫學術語數目為119個。我們主要出于兩方面考慮疾病、體征或癥狀類的術語:首先,疾病、體征或癥狀是電子病歷中最重要的一類診療信息;其次,我們前期積累了大量的疾病、體征或癥狀類同義詞資源,可從中發掘出與標準醫學術語具有同義關聯的非標準醫學術語,進而展開更深入的分析。

1.3 搜集并整理以呼吸系統疾病為主要診斷的電子病歷

為評估呼吸病學標準醫學術語在電子病歷數據中的使用情況,我們通過“愛愛醫”和“醫脈通”網站的典型病例欄目搜集并整理了5383份以呼吸系統疾病為主要診斷的中文電子病歷。“愛愛醫”和“醫脈通”的典型病例均來自不同醫院、不同醫生的臨床記錄,其中的醫學術語表達具有多樣性,因此非常適合作為本文的研究語料。

互聯網電子病歷資源網站所發布的電子病歷數據通常包含各個疾病種類。為了配合調研呼吸病學標準術語使用情況的目的,我們設計了如下規則對所獲的電子病歷數據進行篩選。

(1)對于如“愛愛醫”和“大專家”等帶有疾病診斷標簽的病歷資源,以呼吸病學名詞為種子詞,篩選診斷結果為呼吸病學相關疾病的電子病歷數據作為本研究所使用數據集的重要組成之一,共篩選出4321份電子病歷。

(2)對于“醫學慕課”和“醫脈通”等無任何標簽的病歷資源,以呼吸病學名詞為關鍵術語,篩選出病歷文本內容中包含10個以上呼吸病學相關癥狀或疾病術語的電子病歷,共篩選出1063份電子病歷。由于這部分數據無確定的診斷標簽用于判斷其是否為呼吸病學相關病歷,我們采用人工的方法,確認了這1063份電子病歷數據均為呼吸病學相關數據。

1.4 搜集并整理與標準醫學術語存在同義關聯的非標準醫學術語

在本研究中,我們將名詞委發布的《呼吸病學名詞》中的疾病、體征或癥狀類術語作為標準醫學術語,將標準醫學術語對應的同義詞稱作非標準術語。我們通過以下三個渠道對標準醫學術語的同義詞進行了擴充:

(1)來自《呼吸病學名詞》的同義詞資源。在名詞委發布的《呼吸病學名詞》中,除了給出標準醫學術語(如“干性咳嗽”),還會給出標準醫學術語的同義詞(如“干咳”)。我們共搜集了114個疾病、體征或癥狀類標準醫學術語的同義詞。

(2)來自“萬方醫學網”發布的《中文醫學主題詞表》和醫學健康網站(“尋醫問藥”“39健康網”等)的同義詞資源。《中文醫學主題詞表》和“39健康網”“99健康網”等醫學健康網站同樣收錄了大量的醫學術語同義詞資源。通過這一系列術語資源,我們為來自《呼吸病學名詞》的標準醫學術語擴充了969個同義詞。

(3)通過運用自動術語挖掘和標準化映射技術發現的同義詞資源。近年來,以大規模語料為基礎,進行術語挖掘或新詞發現的自然語言處理技術愈發成熟,以自動短語挖掘方法(AutoPhrase)[9]為例,它以維基百科中的高質量詞條為種子詞條,采用基于詞性的詞分割方法,基于統計語言模型的詞語片段打分模型實現無監督地面向大語料的術語挖掘。通過運用AutoPhrase并輔以人工判斷,我們從本研究整理的5383份呼吸系統疾病電子病歷中識別了3442條描述呼吸系統疾病、體征或癥狀的醫學術語。挖掘結果如表1所示。

更進一步,我們運用百度翻譯、有道翻譯、騰訊翻譯君將中文醫學術語翻譯成英文,再借助MetaMap[10]將英文醫學術語映射到統一醫學語言系統(UMLS)[11],獲取中文醫學術語在UMLS體系中的概念編碼。若兩個字面不同的中文醫學術語在UMLS體系中具有相同的概念編碼,那么它們就可判定為同義詞。例如,來自《呼吸病學名詞》中的標準醫學術語“肺念珠菌病”(pulmonary candidiasis)和從病歷中挖掘得到的術語“念珠菌肺炎”(candida pneumonia)具有相同的UMLS概念編碼“C0153251”。通過這種方法,我們為來自《呼吸病學名詞》的標準醫學術語擴充了522個同義詞。

除了通過UMLS對中文醫學術語進行同義關聯外,我們還通過計算中文術語間的字形相似度和語義相似度[12],尋求挖掘得到的非標準醫學術語和標準醫學術語之間是否存在同義關系。通過這種方法,結合多輪人工確認,我們為來自《呼吸病學名詞》的標準醫學術語擴充了273個同義詞。

最終,我們搜集并整理了與《呼吸病學名詞》中的547個疾病、體征或癥狀類標準醫學術語相關的同義詞或非標準醫學術語共1878個(表2)。

2 研究結果

2.1 標準醫學術語與非標準醫學術語在電子病歷中的使用情況

我們首先調研了來自《呼吸病學名詞》中547個標準醫學術語和1878個非標準醫學術語在5383份呼吸系統電子病歷中的頻次分布情況。從圖2A可見,標準醫學術語和非標準醫學術語在本研究使用的電子病歷語料中分別出現了51 881次和26 386次。無論對于疾病類還是體征或癥狀類術語而言,標準醫學術語的出現頻次都高于非標準醫學術語。

由于我們整理的非標準醫學術語都是標準醫學術語的同義詞,即對同一臨床概念的不同描述,因此我們還從概念層面分析了某一醫學概念在電子病歷語料中是否更傾向于使用標準醫學術語。我們首先篩選了242個具有同義詞且在電子病歷語料中出現10次以上的醫學概念。統計發現,使用標準醫學術語的概念占比為52.89% (128/242),使用非標準醫學術語的概念占比為47.11% (114/242) (圖2B)。

我們進一步統計了同一醫學概念使用標準醫學術語占該概念總出現次數的比例分布,發現該分布呈U型,即完全使用標準醫學術語或完全使用非標準醫學術語的醫學概念出現較多(圖2C)。典型的例子是“盜汗”和“胸痛”,大部分病歷使用了標準醫學術語,而不是其同義詞“寢汗”和“胸部疼痛”。而對于“干性咳嗽”和“血性痰”,大部分病歷使用的是其同義詞,如“干咳”和“痰中帶血”。從圖2C也可以看出,電子病歷中對同一醫學概念的表達是多樣的,整體而言,術語標準化程度不高。

2.2 標準醫學術語對電子病歷中使用醫學術語的覆蓋度分析

為調研標準醫學術語對電子病歷中使用醫學術語的覆蓋度,我們使用自動術語挖掘并輔以人工判斷的方法,從5383份呼吸系統電子病歷中挖掘出3442條描述呼吸系統疾病、體征或癥狀的醫學術語。

這3442條來自電子病歷中的醫學術語中,有289條可被來自《呼吸病學名詞》中標準醫學術語所覆蓋,有40條可被來自《呼吸病學名詞》的同義詞所覆蓋。在其余的醫學術語中:有173條可利用來自CMeSH和醫學健康網站的同義詞資源映射到《呼吸病學名詞》收錄的標準化醫學術語上;進一步,有522條通過基于UMLS標準化的方法映射到《呼吸病學名詞》收錄的標準化醫學術語上;此外,有273條可通過利用字形相似度和語義相似度相結合的術語映射方法映射到《呼吸病學名詞》收錄的標準化醫學術語上。總體而言,《呼吸病學名詞》中的醫學概念對電子病歷中所使用的醫學術語的覆蓋度是37.68% (1297/3442) (表3)。

我們進一步分析了未被《呼吸病學名詞》收錄的非標準醫學術語的特征。通過語義關聯和字形關聯算法,推薦最為接近的標準醫學術語。通過對這些術語標準化映射的人工確認,我們發現這些術語往往是《呼吸病學名詞》收錄的標準醫學術語的子結點。如:“支氣管腺樣囊性癌”屬于“腺樣囊性癌”,“干酪樣肺炎”屬于“肺結核”等。從概念的角度來看,這些未被收錄的術語所表示的概念往往是《呼吸病學名詞》所收錄的術語概念的子概念,在臨床應用中可進行更為精細的描述與表征。

3 結語

在本研究中,我們調研了名詞委發布的呼吸病學標準醫學術語在電子病歷中的使用情況。盡管在呼吸疾病電子病歷中,標準醫學術語的使用頻次高于非標準醫學術語,但從概念層面上看,術語的標準化程度仍然不高,這也是當前發展醫療健康大數據應用面臨極大挑戰的重要原因之一[2]。

由于術語標準化程度不高,同一概念的臨床描述多種多樣,因此搜集標準醫學術語的同義詞成為標準術語集合未來發展的要點之一[6]。從本文的術語覆蓋度研究中可以看出,如果只考慮來自《呼吸病學名詞》中的術語,它在呼吸疾病電子病歷中所使用的術語的覆蓋度僅為9.56% (329/3442); 但當通過利用現有中英文術語資源、術語挖掘和標準化映射方法擴充同義詞后,在呼吸疾病電子病歷中所使用的術語的覆蓋度可達37.68% (1297/3442)。由此可見,在臨床應用中,同一概念下醫學術語的使用具有多樣性,在使用過程中不僅有標準術語集合所收錄的表達形式,同時也存在各種符合臨床使用習慣的同義詞表述形式。此外,在臨床實踐中,存在傾向于使用非標準醫學術語的概念,其占比為47.11% (114/242)。這說明部分標準術語集合所收錄的術語由于表述方式較復雜,或者不符合漢語、口語習慣等各種因素,臨床使用頻次較低。以上這些結果提示我們在未來的術語審定工作中,需要更充分地考慮不同渠道尤其是來自臨床實踐的同義詞資源,以提升標準醫學術語對臨床實踐的覆蓋度[7]。與此同時,標準術語所收錄的內容需要更為貼近臨床實踐及中文醫學使用場景下的語言習慣,盡可能提升標準術語對臨床應用術語的收錄水平,為統一臨床術語的使用提供可能。

從本研究對未被收錄的呼吸病學相關概念的分析情況來看,未被收錄的這些概念多為已收錄術語概念的子概念,用于表述更為精細的臨床實體和信息。因此在中文標準化術語的制定過程中,除需要更充分考慮臨床習慣用語的同時,也需要考慮收錄更為精細的臨床概念相關術語,并在此基礎之上構建起更為系統的概念間的從屬、修飾關系,使得標準術語系統對臨床應用場景形成更為全面的覆蓋,從而促進臨床實踐中術語的標準化。

本研究的一個不足之處是我們只考慮了呼吸病學疾病、體征或癥狀類術語,而未對手術、藥物等術語進行同樣系統而全面的調研,我們期望在未來的工作中彌補這一不足。同時,盡管本研究針對的是呼吸病學術語,但調研所使用的方法同樣適用于其他專科疾病術語。我們也期望在未來的工作中能進一步調研名詞委發布的其他專科標準醫學術語在真實世界數據中的使用情況,為推動我國的醫學術語標準化事業做出貢獻。

注釋

① 本文將全國科學技術名詞審定委員會審定、公布的醫學類規范名詞與其他國家機構作為標準發布的醫學術語,統稱為“標準醫學術語”。

參考文獻

[1] 宋揚, 賈王平, 韓珂,等. 健康醫療大數據的應用及其挑戰[J]. 中國慢性病預防與控制,2021,29(3):220-223.

[2] 張世紅, 史森, 楊小冉. 健康醫療大數據應用面臨的挑戰及策略探討[J]. 中國衛生信息管理雜志, 2018, 15(6):629-632,658.

[3] 魏星. 全國科技名詞委公布與預公布名詞[J]. 中國科技術語, 2018,20(4):50.

[4] 楊威. 我國醫學名詞現狀及發展分析[J]. 中國衛生標準管理, 2018, 9(1):1-4.

[5] Evaluation of the content coverage of SNOMED CT: ability of SNOMED clinical terms to represent clinical problem lists[J]. Mayo Clinic Proceedings, 2006, 81(6):741-748.

[6] 張睿,陳薇,楊豪,等.醫學術語集的中文同義詞富集方案[J].中華醫學圖書情報雜志,2021,30(2):25-32.

[7] 程瑤,蔣太交,鄧立宗,等. 中文標準醫學術語集對實際應用覆蓋度研究[J]. 中國衛生信息管理雜志, 2020, 17(5):55-59,90.

[8] 全國科技名詞審定委員會. 審定名詞與非規范名詞對照(心血管病學)[J]. 中國綜合臨床, 2000, 16(2):108,111,128.

[9] SHANG Jingbo, LIU Jialu, JIANG Meng, et al. Automated Phrase Mining from Massive Text Corpora[J]. IEEE Transactions on Knowledge & Data Engineering, 2018.

[10] DEMNER-FUSHMAN D, ROGERS W J, ARONSON A R. MetaMap Lite: an evaluation of a new Java implementation of MetaMap[J]. Journal of the American Medical Informatics Association Jamia, 2017(4):841.

[11] BODENREIDER O.The Unified Medical Language System(UMLS):integrating biomedical terminology[J].Nucleic Acids Research,2004(suppl_1):267-270.

[12] 張晨童,張佳影,張知行,等. 融合常用語的大規模疾病術語圖譜構建[J]. 計算機研究與發展, 2020, 57(11):219-229.

作者簡介:商濤(1979—),男,博士,2011年畢業于中國醫學科學院基礎醫學研究所/北京協和醫學院基礎學院細胞生物學專業,主要研究方向為醫學術語審定、醫學數據規范化、國際疾病分類本地化。在醫學術語規范化方面進行了深入的研究。此外,在規范化醫學術語與醫學信息學的交叉融合進行了研究。2013年7月在德國科隆大學進行學術交流活動,現任全國科學技術名詞審定委員會事務中心醫學專項辦公室主管,主持全國科學技術名詞審定委員會事務中心基金項目2項。通信方式:shangt@cnterm.cn。

通訊作者:蔣太交 (1970—),男,博士,中國醫學科學院北京協和醫學院長聘教授、博士生導師,國家杰出青年基金獲得者。多年從事生物信息學、醫學信息學領域的研究。課題組經過多年積累,發表多篇關于生物醫學大數據處理的研究論文。同時在醫學文本自然語言處理、疾病表型、醫學本體、知識圖譜方面進行了非常深入的研究。此外,在解決重大疾病科學問題中對生物信息學、醫學信息學等進行多學科、多方法的交叉融合也是課題組重要的研究方向。通信方式:taijiao@ibms.pumc.edu.cn。

猜你喜歡
電子病歷
云計算平臺下的電子病歷系統安全管理
電子病歷保全與認證研究
法制博覽(2016年12期)2016-12-28 13:05:51
基于病種的全結構化病歷模板研發與應用
現階段電子病歷問題的探討及改革
不同質控方法在病案質量控制中的應用效果
基于HDFS的分布式區域電子病歷存儲策略
軟件導刊(2015年6期)2015-06-24 12:58:39
主站蜘蛛池模板: 午夜视频在线观看区二区| 青青草91视频| 久久超级碰| 精品福利网| 美美女高清毛片视频免费观看| 高清无码一本到东京热| 欧美成人看片一区二区三区 | 久久精品亚洲专区| www.亚洲国产| 97在线公开视频| 欧美在线国产| 国产成年无码AⅤ片在线| 丝袜亚洲综合| 日韩毛片免费视频| 欧美午夜理伦三级在线观看| 中文字幕 欧美日韩| 午夜在线不卡| 综合天天色| 亚洲福利视频一区二区| 玖玖免费视频在线观看| 国内精品小视频福利网址| 亚洲中文字幕久久无码精品A| 欧美va亚洲va香蕉在线| 亚洲综合中文字幕国产精品欧美| 久久久精品国产亚洲AV日韩| 毛片卡一卡二| 91精品情国产情侣高潮对白蜜| 久久semm亚洲国产| 国产成人免费| 久久96热在精品国产高清| 亚洲三级影院| 午夜福利在线观看成人| 国产精品深爱在线| 亚洲永久色| 全裸无码专区| 亚洲国产精品一区二区第一页免| 久久精品电影| 久久毛片免费基地| 全部免费毛片免费播放 | 欧美日韩国产一级| 亚洲h视频在线| 毛片大全免费观看| 国产swag在线观看| 国产精品视频系列专区| 亚洲综合久久成人AV| 粉嫩国产白浆在线观看| 91精品最新国内在线播放| 国产极品美女在线播放| 99热精品久久| 国产欧美综合在线观看第七页| 九九热这里只有国产精品| 亚洲中文精品人人永久免费| 日本不卡在线播放| 国产玖玖视频| аⅴ资源中文在线天堂| 久久性妇女精品免费| vvvv98国产成人综合青青| 国产成人无码综合亚洲日韩不卡| 国产福利免费在线观看| 国产网站免费观看| 欧美亚洲第一页| 亚洲欧洲国产成人综合不卡| 欧美亚洲第一页| 国产日韩久久久久无码精品| 国产微拍一区| 国产在线98福利播放视频免费| 又爽又大又黄a级毛片在线视频| 久久狠狠色噜噜狠狠狠狠97视色| 欧美综合区自拍亚洲综合绿色| 无码一区18禁| 日韩欧美中文字幕在线精品| 91青青视频| 日本福利视频网站| 色网站在线视频| 精品少妇人妻av无码久久| 欧美亚洲一区二区三区导航| 亚洲精品麻豆| 日韩精品无码免费一区二区三区| 日本免费高清一区| 91网站国产| 青青草91视频| 亚洲美女久久|