999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于EMPI心肌病專病數據庫的構建

2022-06-27 06:45:28尚詩袁駿毅岑星星
中國醫療設備 2022年6期
關鍵詞:系統

尚詩,袁駿毅,岑星星

上海交通大學附屬胸科醫院 信息中心,上海 200030

引言

心肌病是一組異質性心肌疾病,嚴重的心肌病會引起心血管性死亡或進展性心力衰竭。隨著人們生活條件的提高,飲食結構發生變化,加上多數人缺乏鍛煉,造成心肌病發病率呈逐年上升趨勢,及早確診和預防顯得尤為重要。規范治療過程、評定病情程度、指導急性心肌梗死患者治療和用藥等有效措施的實現,離不開對大量相關臨床數據的研究和探討[1]。醫療行業以驚人的速度生產和收集數據,但不同的電子健康記錄以不同的結構收集數據,包括結構化數據、非結構化和半結構化數據,使得醫生做回顧性研究時費時費力[2]。Kruse等[3]指出,利用大數據進行專病研究的分析和挖掘,有助于提高對疾病機制的理解,實現個性化醫療保健。本文以上海市胸科醫院為研究背景,心肌病專病數據庫(簡稱專病庫)為研究對象,明確結構化模板和數據標準,分析數據的入庫來源和管理方式,使得醫療數據被進一步深度利用,為心肌病臨床研究提供支持。

1 建設過程

上海市胸科醫院是集醫療、科研、教學為一體的三級甲等專科醫院,擁有海量的醫療數據,但分散在不同的業務系統中,并且部分數據以文本的形式進行存儲,使得大量的醫療數據無法滿足科研需求。專病庫建立的目的是:① 將分散在不同系統的數據整合為一個邏輯完整的信息整體,實現跨系統、跨業務的協同[4];② 將文本數據結構化,滿足醫療相關人員的需要。

1.1 設計前期

采取討論的方式,對臨床醫學、流行病與衛生統計學、信息技術等多學科專家針對數據集來源和結構化模板進行需求調研。

1.2 設計過程

專病庫設計過程中參照相關標準,保證數據的可用性和可靠性,設計過程中參考了國際疾病分類ICD-10、手術與操作分類ICD-9-CM-3、HL7ChinaCDA、國家標準(如行政區域代碼)、院內標準(如科室代碼)以及心肌病相應的字典表(如肥厚型心肌病室間隔消融治療方式)等規范[5]。

1.3 數據集確認

明確數據來源,字段集來源于超聲系統、電子醫囑系統、隨訪系統等18個院內業務系統,涉及門診病歷、檢查報告、出院小結等19個醫療記錄單,確保數據的可靠性。

1.4 專病庫形成

心肌病專病庫具體設計形式為“模塊-子模塊-字段”三級數據結構,共分為患者人口學信息、就診記錄、病例信息、檢查、病理、醫囑、診斷、治療、不良事件和隨訪10個模塊,下設33個子模塊,共包含362個數據字段,每個字段對于數據類型、數據長度和可否為空等均有相應的設定,以保證數據集的標準化和可溯性[6]。專病庫字段集來源于超聲系統、電子醫囑系統、隨訪系統等18個院內業務系統,涉及門診病歷、檢查報告、出院小結等19個醫療記錄單。數據集結構如圖1所示。

圖1 數據集來源架構分析

2 系統架構

將原始數據形成醫院臨床數據中心(Clinical Data Repository,CDR),在此基礎上通過后結構化、數據脫敏等治理過程,形成專病庫的數據集。專病庫采用微服務結構的分布式網絡架構[7],使得原有的單個業務系統拆分為多個可以獨立部署、設計、運行的組件,組件之間通過服務完成交互和集成[8]。相比于面向服務體系結構的分布式網絡架構,微服務在圍繞服務的概念創建架構方面提供了更清晰、定義更良好的方式[9]。在CDR的基礎上利用數據治理、數據質控建立了符合疾病特點和科研需求的專病庫,專病庫系統架構圖如圖2所示。

圖2 專病庫系統架構圖

(1)CDR架構。主要包括兩項:① 通過編碼映射、信息整合等操作將醫院信息系統(Hospital Information System,HIS)、 放 射 信 息 系 統(Radiology Information System,RIS)等院內業務系統產生的數據和測序平臺等產生的實驗數據進行匯總統編,打破數據壁壘,實現信息互聯互通;② 將數據集進行過濾抽取,確定心肌病病種數據集定義范圍。

(2)數據治理過程中利用自然語言處理(Natural Language Processing,NLP)、基于轉換器的雙向編碼表征(Bidirectional Encoder Representations from Transformers,BERT)的條件隨機場(Conditional Random Fields,CRF)模型等機器學習方法實現對文本數據的后結構化處理。結構化的數據以患者主索引(Enterprise Main Patient Index,EMPI)為唯一標識進行數據關聯,通過建立脫敏算法中間映射表進行去隱私化和加密處理,得到標準化數據集。

(3)數據質控是對數據的真實性、準確性、完整性、關聯性、一致性進行管理。以EMPI為監測主線,六西格瑪改進模型改善監測管理流程[10],定期生成質量監測報告。

(4)將通過質控管理的數據正式入庫,形成由人口信息學、就診記錄、病歷信息等10個模塊組成的心肌病專病庫。

(5)應用層分為數據挖掘、科研管理、科研項目執行、智能預測4個方面。為便于科研人員和醫生后續操作,數據可選擇以SAS、SPSS形式導出[11],接口采用WebService格式封裝,符合微服務的封裝形式,可實現異構的程序相互訪問。

3 數據分析

3.1 數據治理

專病庫的數據治理過程包括CDR建設、后結構化處理、數據關聯和數據脫敏4個方面。

(1)CDR建設。院內于2018年完成了CDR的建設,以行業標準疾病代碼、藥品字典為映射集合,通過數據清洗、設立統一編碼和編碼映射等處理進行信息匯集,達到信息互聯互通、數據標準化的目的。

(2)后結構化處理。對于非結構化或半結構化的數據,后結構化處理決定了醫療文本數據的可利用率和準確性[12],通過對病歷、病理等文本數據預處理、序列標注完成前期準備工作,采用BERT預訓練的詞嵌入手段,以Bi-長短期記憶網絡-CRF模型作為基準特征提取模型,結果顯示多個實體標簽的預測準確率和召回率達到1,且“癥狀”這一相對其他實體類型較為復雜的命名實體取得了87.16%的準確率和72.50%的召回率,后結構化處理過程如圖3所示。相比于其他NLP算法,BERT模型是將預訓練模型和下游任務模型結合在一起,即在進行下游任務時仍然用BERT模型,而且BERT模型天然支持文本分類任務,在做文本分類任務時不需要對模型做修改[13]。

圖3 后結構化處理過程圖

(3)數據關聯。由于院內業務系統中各編碼更新時間不同,出現一對多或多對一的場景,如同一藥品名稱對應一個院內代碼但對應兩個醫保編碼,需要進行數據關聯,將數據進行歸一化處理,根據時間順序和其他邏輯合并,通過計算信息增益的方式決定處理方向。

(4)數據脫敏。由于醫療數據涉及患者隱私,入庫前需進行數據脫敏處理,數據脫敏是指將數據中較敏感的信息做進一步變形、轉換和混淆的漂白處理,從而達到保護患者隱私的目的,保證隱私信息的安全性和可靠性[14]。2020年,國內制定了《中華人民共和國個人信息保護法(草案)》,強調隱私信息保護的重要性。為更好地保留復雜語義下高敏感度的屬性值,采用對敏感屬性值進行分類加權后,使用DES對稱加密算法實現數據脫敏,脫敏后以EMPI或患者在醫院就診的身份號為關聯字段。

3.2 數據整合

隨著醫院信息化的進一步發展,對于醫療信息互聯互通的要求隨之提高,院內業務系統中建立患者身份的唯一標識顯得尤為重要。EMPI是指采用微軟特有算法和技術在信息系統中表達患者身份的唯一識別,是醫療數據可以共享的基礎。唯一標識的建立過程為:① 每個患者創建一個唯一標識符,作為各業務系統進行信息傳遞時的標志;② 與相關系統醫療記錄的標識之間建立映射,確保同一患者分散在不同系統中的醫療信息可以完整且準確地關聯、整合在一起。EMPI架構如圖4所示。此外,EMPI還提供了搜索引擎,可以智能地協助醫務人員對患者進行有效搜索;同時,也會存儲患者屬性的部分子集,以便作為患者檢索“單一最佳紀錄”的權威來源。EMPI的關鍵組件是匹配引擎,通常配置的屬性包括姓名、生日、性別、身份證號和地址等,匹配引擎的準確性和性能是決定EMPI解決方案價值的關鍵因素。

圖4 EMPI架構圖

3.3 數據質控

質量控制是對數據的真實性、準確性、完整性、關聯性和一致性進行管理,決定了專病庫的可用性和可靠性。由于源數據或數據拉取的問題,數據入庫前仍存在主要診斷選擇錯誤或名稱不規范、確診日期未填寫等現象。采用DMAIC模型改善監測管理流程,數據質控分為數據智能質控、數據核查補錄、生成質量監測報告和數據定時更新4個方面[15]。

(1)數據智能質控以EMPI為監測主線,數據字典表作為參考標準,梳理數據中的名稱、編碼等規范性錯誤。后結構化數據采用上下文聯動的方式,根據語義關系進行數據更改或填充;對于不合理數據(如性別為男但有月經史)進行智能化更正后,同時也將業務系統中的源數據進行修改。

(2)數據核查補錄是人工隨機抽取少量數據,與院內系統中的病案首頁等業務報表比對核查,判斷是否存在數據不對應或不合理。

(3)生成質量監測報告。經過以上兩個步驟,生成心肌病入庫數據的質量檢測報告,包括質量匯總、完整度等評分細項,并將質檢報告交由醫務部考量。

(4)數據定時更新。生成數據質量問題的具體原因,做到數據可回溯,利于有關部門針對問題進行更正,避免再次發生,提高數據入庫效率[16]。

4 建設成效

參照國際疾病分類標準,心肌病患者是指診斷名稱中包含心肌病或ICD-10診斷編碼為I42的患者,專病庫已完成自2012年1月至2021年9月心肌病患者數據的導入工作,共12023例。其中男性8121例,女性3902例,平均年齡(64.85±13.61)歲,診斷名稱為擴張型心肌病5511例、缺血性心肌病2152例、肥厚型梗阻性心肌病973例,占總患者數的71.83%。由于專病醫療數據的特殊性,針對專病庫的使用設定了相應的管理機制,科研人員通過院內OA辦公系統提出提取科研數據申請,經科室領導、科教部、臨床研究中心批準后可導出相應脫敏后的心肌病數據,專病庫的應用界面如圖5所示。到目前,專病庫已配合完成2項心肌病臨床研究,專病庫中提供了患者住院號、性別、年齡、診斷記錄、檢查檢驗記錄、手術記錄等患者信息和臨床數據,便于研究人員做回顧性或其他臨床數據分析。基于專病庫,科研人員開始嘗試建立心肌病預后模型,如對心肌病確診前的文本數據進行分類預測,研究成果有助于對患者實現更為精準的差異性治療。專病庫的實現一方面利用機器學習方法將病歷病理等文本數據后結構化,提高了醫療數據的收集范圍,全面發揮醫療數據的作用;另一方面簡化研究人員手工統計數據和預處理的操作,有利于提高數據的準確性和研究人員的工作效率,增加了時序數據,可以有效避免多源數據相互矛盾的現象。

圖5 專病庫應用界面

5 討論

近年來,“互聯網+健康醫療”觀念逐漸深入,建立互聯互通、開放共享的醫療大數據平臺成為焦點。就專病庫的有效性而言,將原本大量不規律的臨床文本通過處理形成專病數據庫,為臨床研究和疾病研究提供了信息服務和數據支撐,使得醫生做回顧性研究更加方便快捷。就專病庫的優越性而言,在院內CDR的基礎上經過后結構化、去隱私化等處理建立了以EMPI為唯一索引的心肌病專病數據庫,EMPI使得數據更加清晰,方便研究人員通過數據將EMPI進行分類,有利于推進該病種的基礎學科研究。就專病庫的創新性而言,增加了醫療數據利用率,有利于醫生對心肌病進行風險評估并進行預后評價。

目前專病數據集處在病種擴展階段,對出現的原始數據中一對多或多對一的映射問題,需及時改進院內業務系統。未來,隨著人工智能在醫療領域不斷深入,后結構化精度不斷提高,建立依托于大數據、數據挖掘等技術面向醫生、患者、科研人員和行政管理人員的醫療大數據綜合服務平臺指日可待。

猜你喜歡
系統
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
基于PowerPC+FPGA顯示系統
基于UG的發射箱自動化虛擬裝配系統開發
半沸制皂系統(下)
FAO系統特有功能分析及互聯互通探討
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
一德系統 德行天下
PLC在多段調速系統中的應用
主站蜘蛛池模板: 日日碰狠狠添天天爽| 国产白浆视频| 欧美精品导航| 性视频一区| 在线精品欧美日韩| 无码丝袜人妻| 成人日韩欧美| 91小视频在线观看免费版高清| 欧美日韩在线亚洲国产人| 亚洲精品va| AV在线麻免费观看网站 | 国内精品久久九九国产精品| 性色一区| 亚洲欧美另类视频| 午夜啪啪网| 欧美日韩中文字幕在线| 精品综合久久久久久97超人| 欧美亚洲香蕉| 国产一区免费在线观看| 亚洲视频一区| 无码国产偷倩在线播放老年人 | 热99精品视频| 毛片免费网址| 国产网站免费| 亚洲成人高清无码| 亚洲成人播放| 亚洲男人在线| 又粗又硬又大又爽免费视频播放| 无码高清专区| 日本不卡在线播放| 久久精品无码一区二区国产区| 久久免费视频6| 欧美国产在线精品17p| 国产综合亚洲欧洲区精品无码| 无码专区国产精品一区| 成人综合网址| 国产综合另类小说色区色噜噜| 亚洲天堂啪啪| 国产剧情国内精品原创| 亚洲天堂.com| 色婷婷亚洲十月十月色天| 亚洲国产精品日韩av专区| 久久久亚洲国产美女国产盗摄| 波多野衣结在线精品二区| 午夜精品久久久久久久无码软件| 狠狠做深爱婷婷综合一区| 午夜国产理论| 亚洲精品图区| 国产区成人精品视频| 国产手机在线观看| 网久久综合| 国产性生大片免费观看性欧美| 五月婷婷综合色| 久草中文网| 5555国产在线观看| 国产精品青青| 99视频在线免费观看| 国产亚洲欧美另类一区二区| 国产白浆在线| 又爽又黄又无遮挡网站| 真人高潮娇喘嗯啊在线观看| 91视频首页| 久久久久久久久久国产精品| 欧美日韩免费观看| 国产福利大秀91| 国产成人在线无码免费视频| 久热这里只有精品6| 综1合AV在线播放| 国内a级毛片| 国产成人毛片| 中文字幕资源站| 欧美成人一级| 白浆视频在线观看| 亚洲成a人片| 欧美日韩高清在线| 亚洲午夜福利精品无码| 国产男女免费视频| 青青久在线视频免费观看| 超碰色了色| 国产在线精品99一区不卡| 91成人免费观看| 国产精品福利导航|