999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

呼吸病學標準醫學術語在電子病歷中的使用情況調研

2021-10-12 08:30:08陳祿明鄧立宗蔣太交
中國科技術語 2021年5期
關鍵詞:概念標準

商 濤 程 瑤 陳祿明 鄧立宗 蔣太交-5

(1.全國科學技術名詞審定委員會,北京 100717;2.蘇州系統醫學研究所,江蘇蘇州 215123;3.中國醫學科學院系統醫學研究院,北京 100005;4.中國醫學科學院基礎醫學研究所/北京協和醫學院基礎學院,北京 100005;5.廣州實驗室,廣東廣州 510005)

引言

以臨床電子病歷為代表的真實世界數據(real world data)蘊含了豐富的患者診療信息,若能對這些診療信息加以有效利用,將極大地推動我國醫療健康大數據應用的發展[1]。然而,由于不同機構、不同醫生的用語習慣不同,電子病歷中的診療信息存在著用語不規范、不統一的問題,這為醫療健康大數據的整合和利用帶來了極大的障礙[2]。為規范我國臨床醫學術語的使用,以國家衛生健康委員會(簡稱“衛健委”)、全國科學技術名詞審定委員會(簡稱“名詞委”)為代表的國家機構頒布了一系列標準醫學術語①,引導中文醫學術語的規范表達,推動了我國醫學術語的標準化進程[3-4]。

調研已發布的標準醫學術語在真實世界數據中的使用情況是一項十分重要的工作[5]。這一工作通常可以從兩方面展開:一是調研真實世界數據使用標準醫學術語的情況;二是調研標準醫學術語對真實世界數據中所使用術語的覆蓋度。前者關注的是真實世界數據所使用醫學術語的標準化程度,后者關注的是標準醫學術語描述真實世界數據的完備程度。

國內外學者均非常重視調研標準醫學術語在真實世界數據中的使用情況。例如,來自梅奧診所的研究者[5]從電子病歷中搜集了4996個描述臨床問題的醫學術語,發現國際衛生術語標準制定組織制定的臨床醫學系統術語 (SNOMED-CT)能覆蓋其中92.3%的臨床問題術語。來自四川大學華西醫院的研究者[6]通過對比中文人類表型標準用語(CHPO)和從中文電子病歷中獲取的表型術語,發現電子病歷中使用的術語口語化、隨意化現象嚴重,同標準醫學術語集之間存在著巨大差異。中國醫學科學院的研究者[7]系統匯集了衛健委、名詞委發布的857 193個標準醫學術語,并統計了標準醫學術語對實際使用于臨床指南、電子病歷中的69 865個醫學術語的覆蓋度,發現中文標準醫學術語資源對于常見術語的覆蓋度較高(74.3%),但對不常見術語的覆蓋度偏低(26.8%)。

名詞委歷來都很重視標準醫學術語的審定與應用,不僅發布了呼吸病學、老年醫學等18個專科的標準醫學術語, 還發布了一系列??漆t學術語審定名詞與非規范名詞對照表[8]。然而,對于目前真實世界數據中對已發布的專科標準醫學術語的使用情況和??茦藴梳t學術語對真實世界數據中使用術語的覆蓋度尚缺少細致深入的研究。在本研究中,我們擬以名詞委2018年發布的《呼吸病學名詞》為切入點,調研《呼吸病學名詞》中有關疾病、體征、癥狀類標準醫學術語在電子病歷中的使用情況,以期充實和完善我國的呼吸病學標準醫學術語。

1 研究方法

1.1 研究設計

本研究的總體設計如圖1所示:首先,我們搜集并整理了名詞委《呼吸病學名詞》中疾病、體征或癥狀類標準醫學術語;隨后,我們通過匯集《呼吸病學名詞》《中文醫學主題詞表》(CMeSH,“萬方醫學網”發布)、“39健康網”等醫學健康網站收錄的同義詞資源,整理了與標準醫學術語存在同義關聯的非標準醫學術語;我們還通過術語挖掘的方法,從實際電子病歷語料中發掘了與標準醫學術語存在同義關聯的非標準醫學術語;最后,我們根據整理獲得的標準醫學術語和非標準醫學術語集,對它們在實際電子病歷語料中的使用情況展開調研。詳述如下。

圖1 整理呼吸病學標準醫學術語及其同義詞(非標準醫學術語)流程圖

1.2 搜集并整理《呼吸病學名詞》中疾病、體征或癥狀標準醫學術語

首先,我們搜集并整理了名詞委2018年發布的《呼吸病學名詞》中547個疾病、體征或癥狀類標準醫學術語,其中,疾病類標準醫學術語數目為428個,體征或癥狀類標準醫學術語數目為119個。我們主要出于兩方面考慮疾病、體征或癥狀類的術語:首先,疾病、體征或癥狀是電子病歷中最重要的一類診療信息;其次,我們前期積累了大量的疾病、體征或癥狀類同義詞資源,可從中發掘出與標準醫學術語具有同義關聯的非標準醫學術語,進而展開更深入的分析。

1.3 搜集并整理以呼吸系統疾病為主要診斷的電子病歷

為評估呼吸病學標準醫學術語在電子病歷數據中的使用情況,我們通過“愛愛醫”和“醫脈通”網站的典型病例欄目搜集并整理了5383份以呼吸系統疾病為主要診斷的中文電子病歷?!皭蹛坩t”和“醫脈通”的典型病例均來自不同醫院、不同醫生的臨床記錄,其中的醫學術語表達具有多樣性,因此非常適合作為本文的研究語料。

互聯網電子病歷資源網站所發布的電子病歷數據通常包含各個疾病種類。為了配合調研呼吸病學標準術語使用情況的目的,我們設計了如下規則對所獲的電子病歷數據進行篩選。

(1)對于如“愛愛醫”和“大專家”等帶有疾病診斷標簽的病歷資源,以呼吸病學名詞為種子詞,篩選診斷結果為呼吸病學相關疾病的電子病歷數據作為本研究所使用數據集的重要組成之一,共篩選出4321份電子病歷。

(2)對于“醫學慕課”和“醫脈通”等無任何標簽的病歷資源,以呼吸病學名詞為關鍵術語,篩選出病歷文本內容中包含10個以上呼吸病學相關癥狀或疾病術語的電子病歷,共篩選出1063份電子病歷。由于這部分數據無確定的診斷標簽用于判斷其是否為呼吸病學相關病歷,我們采用人工的方法,確認了這1063份電子病歷數據均為呼吸病學相關數據。

1.4 搜集并整理與標準醫學術語存在同義關聯的非標準醫學術語

在本研究中,我們將名詞委發布的《呼吸病學名詞》中的疾病、體征或癥狀類術語作為標準醫學術語,將標準醫學術語對應的同義詞稱作非標準術語。我們通過以下三個渠道對標準醫學術語的同義詞進行了擴充:

(1)來自《呼吸病學名詞》的同義詞資源。在名詞委發布的《呼吸病學名詞》中,除了給出標準醫學術語(如“干性咳嗽”),還會給出標準醫學術語的同義詞(如“干咳”)。我們共搜集了114個疾病、體征或癥狀類標準醫學術語的同義詞。

(2)來自“萬方醫學網”發布的《中文醫學主題詞表》和醫學健康網站(“尋醫問藥”“39健康網”等)的同義詞資源?!吨形尼t學主題詞表》和“39健康網”“99健康網”等醫學健康網站同樣收錄了大量的醫學術語同義詞資源。通過這一系列術語資源,我們為來自《呼吸病學名詞》的標準醫學術語擴充了969個同義詞。

(3)通過運用自動術語挖掘和標準化映射技術發現的同義詞資源。近年來,以大規模語料為基礎,進行術語挖掘或新詞發現的自然語言處理技術愈發成熟,以自動短語挖掘方法(AutoPhrase)[9]為例,它以維基百科中的高質量詞條為種子詞條,采用基于詞性的詞分割方法,基于統計語言模型的詞語片段打分模型實現無監督地面向大語料的術語挖掘。通過運用AutoPhrase并輔以人工判斷,我們從本研究整理的5383份呼吸系統疾病電子病歷中識別了3442條描述呼吸系統疾病、體征或癥狀的醫學術語。挖掘結果如表1所示。

表1 基于語料的術語自動挖掘所得呼吸病學術語示例

更進一步,我們運用百度翻譯、有道翻譯、騰訊翻譯君將中文醫學術語翻譯成英文,再借助MetaMap[10]將英文醫學術語映射到統一醫學語言系統(UMLS)[11],獲取中文醫學術語在UMLS體系中的概念編碼。若兩個字面不同的中文醫學術語在UMLS體系中具有相同的概念編碼,那么它們就可判定為同義詞。例如,來自《呼吸病學名詞》中的標準醫學術語“肺念珠菌病”(pulmonary candidiasis)和從病歷中挖掘得到的術語“念珠菌肺炎”(candida pneumonia)具有相同的UMLS概念編碼“C0153251”。通過這種方法,我們為來自《呼吸病學名詞》的標準醫學術語擴充了522個同義詞。

除了通過UMLS對中文醫學術語進行同義關聯外,我們還通過計算中文術語間的字形相似度和語義相似度[12],尋求挖掘得到的非標準醫學術語和標準醫學術語之間是否存在同義關系。通過這種方法,結合多輪人工確認,我們為來自《呼吸病學名詞》的標準醫學術語擴充了273個同義詞。

最終,我們搜集并整理了與《呼吸病學名詞》中的547個疾病、體征或癥狀類標準醫學術語相關的同義詞或非標準醫學術語共1878個(表2)。

表2 基于不同來源整理的呼吸病學標準醫學術語的同義詞數量統計

2 研究結果

2.1 標準醫學術語與非標準醫學術語在電子病歷中的使用情況

我們首先調研了來自《呼吸病學名詞》中547個標準醫學術語和1878個非標準醫學術語在5383份呼吸系統電子病歷中的頻次分布情況。從圖2A可見,標準醫學術語和非標準醫學術語在本研究使用的電子病歷語料中分別出現了51 881次和26 386次。無論對于疾病類還是體征或癥狀類術語而言,標準醫學術語的出現頻次都高于非標準醫學術語。

圖2 呼吸病學標準醫學術語與非標準醫學術語在電子病歷中的分布統計

由于我們整理的非標準醫學術語都是標準醫學術語的同義詞,即對同一臨床概念的不同描述,因此我們還從概念層面分析了某一醫學概念在電子病歷語料中是否更傾向于使用標準醫學術語。我們首先篩選了242個具有同義詞且在電子病歷語料中出現10次以上的醫學概念。統計發現,使用標準醫學術語的概念占比為52.89% (128/242),使用非標準醫學術語的概念占比為47.11% (114/242) (圖2B)。

我們進一步統計了同一醫學概念使用標準醫學術語占該概念總出現次數的比例分布,發現該分布呈U型,即完全使用標準醫學術語或完全使用非標準醫學術語的醫學概念出現較多(圖2C)。典型的例子是“盜汗”和“胸痛”,大部分病歷使用了標準醫學術語,而不是其同義詞“寢汗”和“胸部疼痛”。而對于“干性咳嗽”和“血性痰”,大部分病歷使用的是其同義詞,如“干咳”和“痰中帶血”。從圖2C也可以看出,電子病歷中對同一醫學概念的表達是多樣的,整體而言,術語標準化程度不高。

2.2 標準醫學術語對電子病歷中使用醫學術語的覆蓋度分析

為調研標準醫學術語對電子病歷中使用醫學術語的覆蓋度,我們使用自動術語挖掘并輔以人工判斷的方法,從5383份呼吸系統電子病歷中挖掘出3442條描述呼吸系統疾病、體征或癥狀的醫學術語。

這3442條來自電子病歷中的醫學術語中,有289條可被來自《呼吸病學名詞》中標準醫學術語所覆蓋,有40條可被來自《呼吸病學名詞》的同義詞所覆蓋。在其余的醫學術語中:有173條可利用來自CMeSH和醫學健康網站的同義詞資源映射到《呼吸病學名詞》收錄的標準化醫學術語上;進一步,有522條通過基于UMLS標準化的方法映射到《呼吸病學名詞》收錄的標準化醫學術語上;此外,有273條可通過利用字形相似度和語義相似度相結合的術語映射方法映射到《呼吸病學名詞》收錄的標準化醫學術語上??傮w而言,《呼吸病學名詞》中的醫學概念對電子病歷中所使用的醫學術語的覆蓋度是37.68% (1297/3442) (表3)。

我們進一步分析了未被《呼吸病學名詞》收錄的非標準醫學術語的特征。通過語義關聯和字形關聯算法,推薦最為接近的標準醫學術語。通過對這些術語標準化映射的人工確認,我們發現這些術語往往是《呼吸病學名詞》收錄的標準醫學術語的子結點。如:“支氣管腺樣囊性癌”屬于“腺樣囊性癌”,“干酪樣肺炎”屬于“肺結核”等。從概念的角度來看,這些未被收錄的術語所表示的概念往往是《呼吸病學名詞》所收錄的術語概念的子概念,在臨床應用中可進行更為精細的描述與表征。

表3 呼吸病學標準醫學術語及其同義詞對電子病歷中使用醫學術語的覆蓋度統計

3 結語

在本研究中,我們調研了名詞委發布的呼吸病學標準醫學術語在電子病歷中的使用情況。盡管在呼吸疾病電子病歷中,標準醫學術語的使用頻次高于非標準醫學術語,但從概念層面上看,術語的標準化程度仍然不高,這也是當前發展醫療健康大數據應用面臨極大挑戰的重要原因之一[2]。

由于術語標準化程度不高,同一概念的臨床描述多種多樣,因此搜集標準醫學術語的同義詞成為標準術語集合未來發展的要點之一[6]。從本文的術語覆蓋度研究中可以看出,如果只考慮來自《呼吸病學名詞》中的術語,它在呼吸疾病電子病歷中所使用的術語的覆蓋度僅為9.56% (329/3442); 但當通過利用現有中英文術語資源、術語挖掘和標準化映射方法擴充同義詞后,在呼吸疾病電子病歷中所使用的術語的覆蓋度可達37.68% (1297/3442)。由此可見,在臨床應用中,同一概念下醫學術語的使用具有多樣性,在使用過程中不僅有標準術語集合所收錄的表達形式,同時也存在各種符合臨床使用習慣的同義詞表述形式。此外,在臨床實踐中,存在傾向于使用非標準醫學術語的概念,其占比為47.11% (114/242)。這說明部分標準術語集合所收錄的術語由于表述方式較復雜,或者不符合漢語、口語習慣等各種因素,臨床使用頻次較低。以上這些結果提示我們在未來的術語審定工作中,需要更充分地考慮不同渠道尤其是來自臨床實踐的同義詞資源,以提升標準醫學術語對臨床實踐的覆蓋度[7]。與此同時,標準術語所收錄的內容需要更為貼近臨床實踐及中文醫學使用場景下的語言習慣,盡可能提升標準術語對臨床應用術語的收錄水平,為統一臨床術語的使用提供可能。

從本研究對未被收錄的呼吸病學相關概念的分析情況來看,未被收錄的這些概念多為已收錄術語概念的子概念,用于表述更為精細的臨床實體和信息。因此在中文標準化術語的制定過程中,除需要更充分考慮臨床習慣用語的同時,也需要考慮收錄更為精細的臨床概念相關術語,并在此基礎之上構建起更為系統的概念間的從屬、修飾關系,使得標準術語系統對臨床應用場景形成更為全面的覆蓋,從而促進臨床實踐中術語的標準化。

本研究的一個不足之處是我們只考慮了呼吸病學疾病、體征或癥狀類術語,而未對手術、藥物等術語進行同樣系統而全面的調研,我們期望在未來的工作中彌補這一不足。同時,盡管本研究針對的是呼吸病學術語,但調研所使用的方法同樣適用于其他專科疾病術語。我們也期望在未來的工作中能進一步調研名詞委發布的其他專科標準醫學術語在真實世界數據中的使用情況,為推動我國的醫學術語標準化事業做出貢獻。

注釋

① 本文將全國科學技術名詞審定委員會審定、公布的醫學類規范名詞與其他國家機構作為標準發布的醫學術語,統稱為“標準醫學術語”。

猜你喜歡
概念標準
2022 年3 月實施的工程建設標準
Birdie Cup Coffee豐盛里概念店
現代裝飾(2022年1期)2022-04-19 13:47:32
幾樣概念店
現代裝飾(2020年2期)2020-03-03 13:37:44
忠誠的標準
當代陜西(2019年8期)2019-05-09 02:22:48
美還是丑?
學習集合概念『四步走』
你可能還在被不靠譜的對比度標準忽悠
聚焦集合的概念及應用
論間接正犯概念之消解
一家之言:新標準將解決快遞業“成長中的煩惱”
專用汽車(2016年4期)2016-03-01 04:13:43
主站蜘蛛池模板: 国产91小视频在线观看| 久久精品娱乐亚洲领先| 日韩在线播放欧美字幕| 日本免费福利视频| 夜夜爽免费视频| 久久99国产综合精品女同| 久久精品电影| 制服无码网站| 国产在线第二页| 午夜三级在线| 精品久久香蕉国产线看观看gif| 在线网站18禁| 亚洲性色永久网址| 亚洲热线99精品视频| 免费一级成人毛片| 黄色a一级视频| 免费一极毛片| a毛片在线| 一级毛片免费观看久| 欧美日韩免费在线视频| AV老司机AV天堂| 综合色区亚洲熟妇在线| 最新无码专区超级碰碰碰| 97se综合| 欧美.成人.综合在线| 日韩在线第三页| 99成人在线观看| 亚洲天堂日韩在线| 亚洲乱码视频| 日本伊人色综合网| 国产区免费| 日韩视频福利| a级毛片一区二区免费视频| 欧美精品高清| 毛片视频网| 黄色网站不卡无码| 91免费国产高清观看| 亚洲成人网在线播放| 一级毛片免费不卡在线视频| 免费激情网站| 中文字幕亚洲乱码熟女1区2区| 国产va欧美va在线观看| 一级爆乳无码av| 在线看国产精品| 91蜜芽尤物福利在线观看| 亚洲女同欧美在线| a色毛片免费视频| 国产成人av一区二区三区| 亚洲欧美不卡| 亚洲精品在线影院| 国产精女同一区二区三区久| 亚洲人成人无码www| 四虎永久免费在线| 国产精品男人的天堂| 日韩最新中文字幕| 欧美a在线看| 日本少妇又色又爽又高潮| 综合网久久| 国产美女精品一区二区| 国内精品91| 国产素人在线| 国产精品无码AV中文| 制服丝袜无码每日更新| 日本黄网在线观看| 国国产a国产片免费麻豆| 日韩无码真实干出血视频| av在线手机播放| 亚洲精品无码人妻无码| 爆乳熟妇一区二区三区| 亚洲九九视频| 欧美日韩北条麻妃一区二区| 亚洲综合九九| 国产最爽的乱婬视频国语对白| 免费人成在线观看成人片| 视频二区欧美| 99re热精品视频国产免费| 九九精品在线观看| 免费看黄片一区二区三区| 99激情网| 国产91高跟丝袜| 高h视频在线| 国产精品微拍|