999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

省級腫瘤大數據中心規(guī)劃與建設*

2021-01-15 10:27:18吳睿豪
醫(yī)學信息學雜志 2020年11期
關鍵詞:數據庫

閆 慈 王 鵬 楊 越 任 勁 吳睿豪 管 音 張 茜

(新疆醫(yī)科大學附屬腫瘤醫(yī)院 新疆 830000) (神州數碼醫(yī)療科技股份有限公司 北京 100000) (新疆醫(yī)科大學附屬腫瘤醫(yī)院新疆 830000) (神州數碼醫(yī)療科技股份有限公司北京 100000) (新疆醫(yī)科大學附屬腫瘤醫(yī)院新疆 830000)

1 引言

1.1 腫瘤大數據平臺推動數據治理和轉化

腫瘤大數據治理和應用是推進腫瘤防控的一項基礎事業(yè)[1]。我國人口眾多,每年產生大量臨床數據,數據已成為醫(yī)院重要資產,電子病歷、醫(yī)學影像、基因組學等海量數據的有效利用將是開展臨床科研和發(fā)展醫(yī)學人工智能的必備基礎方法和手段[2-3]。然而惡性腫瘤臨床診療信息采集等方面缺少規(guī)范化操作規(guī)程,尚無統一的腫瘤數據采集平臺,各醫(yī)療單位之間信息數據難以交換、共享和整合,導致無法進行大規(guī)模、有代表性的腫瘤診斷、治療及預后相關信息收集和分析,臨床研究資源浪費情況極為嚴重。醫(yī)院建立統一的大數據平臺將有利于實現數據資產價值轉化、診療服務模式革新以及創(chuàng)新成果孵化。

1.2 常見醫(yī)學大數據平臺架構

不同病種特點導致數據治理流程和需求各不相同,數據平臺建設架構也存在差異。對于罕見病,因發(fā)病率較低,病例數較少,適合采用病例注冊登記和直報系統相結合的數據中心形式[4-5]。在各個區(qū)域建立省級數據中心,采用相同一套登記表單和數據接口,再由各省級中心按周期上傳至國家中心,避免病例漏報、少報和數據質量把控不嚴等問題。國家罕見病中心綜合全國數據來制定罕見病目錄和診療指南。對于以提升院內數據科研利用率為需求的醫(yī)院,通常建設專科疾病數據庫,針對一個病種制定標準化字段目錄,涵蓋門診、人口學、住院信息以及病程、用藥、檢查等多種字段,這種僅限院內使用的大數據平臺建設方案,由于接口通用,行政調動能力強,構建方式簡單,已經廣泛地被臨床醫(yī)院或科室所采納。另外一種是針對突發(fā)性傳染性疾病,可由政府衛(wèi)生監(jiān)管部門主導,建設區(qū)域性傳染病大數據防控平臺,例如洪湖市COVID-19大數據防控平臺[6],通過整合個人每日上報、檢測機構、臨床醫(yī)院數據,構建人群健康畫像,實時監(jiān)控疫情傳播動態(tài),協助疫情資源調配和防控政策制定。對于腫瘤來說,發(fā)病率較高,數據量大,院內診療流程長,同時包含不同癌種,對于一家醫(yī)院來說,尚不足以承載如此大量數據治理和轉化,因此構建區(qū)域性或省級以上數據中心更符合現實國情。

1.3 建設區(qū)域性腫瘤大數據中心意義重大

區(qū)域腫瘤大數據中心建設是提升我國腫瘤臨床診療水平的基礎步驟。通過設計合理的平臺架構和通用數據模型,實現多種類型數據存儲、傳輸和共享;收集肺癌、食管癌、肝癌、胃癌、結直腸癌、乳腺癌、宮頸癌和鼻咽癌等常見腫瘤的病理學、細胞學、檢驗學和影像醫(yī)學等多種類型電子病歷數據,實現醫(yī)療大數據標準化采集和分析處理[7-8];借助病理和影像數據的人工智能分析算法可以極大提升區(qū)域腫瘤診斷水平和準確度,降低醫(yī)療成本[9-10]。本研究以新疆醫(yī)科大學附屬腫瘤醫(yī)院腫瘤大數據平臺建設為例,探討臨床研究大數據平臺建設架構以及面臨的技術挑戰(zhàn)、應對策略,對于惡性腫瘤防治事業(yè)具有重要作用。

2 體系規(guī)劃

2.1 總體架構

腫瘤大數據中心在建立共享機制的情況下,通過腫瘤大數據采集與集成系統與各級醫(yī)院信息平臺(集成平臺)或業(yè)務系統進行業(yè)務層與數據層對接,建立全系統協同與共享機制,總體框架,見圖1。通過各級醫(yī)院集成平臺收集不同院內系統數據并進行整合,利用腫瘤大數據采集與集成平臺對接各級醫(yī)院信息平臺或臨床數據中心實現數據集成,與通用數據模型(Common Data Model,CDM)相映射形成大數據中心。基于腫瘤病例特征、電子病歷和HL7等醫(yī)療標準,建立包括腫瘤業(yè)務區(qū)(涵蓋肺癌、食管癌、肝癌、胃癌、結直腸癌、乳腺癌、宮頸癌和鼻咽癌等)、共享交換區(qū)、基礎區(qū)、科研區(qū)為核心的腫瘤大數據平臺中心數據庫。基于腫瘤大數據管理平臺,實現與國家癌癥中心、醫(yī)院及科研機構、其他第3方機構等的共享協作并提供相應服務。腫瘤大數據中心物理環(huán)境采用虛擬化和超融合技術實現,為各機構數據互聯互通、開展遠程協作和數據采集等工作提供基礎支撐環(huán)境。

圖1 總體框架

2.2 數據資源架構(圖2)

圖2 數據資源架構

2.2.1 臨時數據存儲區(qū) 存放接入的各機構原始數據,具體包括臨床、業(yè)務服務、實時監(jiān)測數據等。

2.2.2 交換緩沖數據區(qū) 機構提供的原始數據進入平臺核心數據區(qū)之前的數據交換緩沖區(qū),出現數據處理錯誤或丟失時便于溯源追蹤。

2.2.3 核心數據區(qū) (1)基礎數據區(qū)。數據中心的基礎,主要存放標準規(guī)范、基礎數據字典、患者索引信息、平臺日志用戶管理信息等用來支撐平臺元數據區(qū)。(2)臨床業(yè)務區(qū)。為臨床診療業(yè)務應用(智能檢索、診療輔助決策等)提供支撐,主要包含患者就診活動中產生的醫(yī)療服務信息即臨床業(yè)務數據庫,按腫瘤種類進行劃分的單病種數據庫及業(yè)務開展的應用數據庫。(3)科研數據區(qū)。基于臨床業(yè)務區(qū)建立科研通用數據模型,過濾出適合進行科研研究的人群信息,建設知識庫服務與科研分析研究。(4)共享交換數據區(qū)。基于臨床業(yè)務區(qū)分離出需要機構之間共享交換的信息單獨進行隔離,提高共享協作效率,同時可按不同主題進行劃分及記錄共享交換的日志。

2.2.4 運營數據區(qū) 存放用戶、運營管理、運營監(jiān)控、業(yè)務服務數據。支撐大數據中心的運營監(jiān)控。

3 腫瘤大數據管理

3.1 概述

腫瘤大數據中心建設是開展臨床與科研應用的基礎,影響應用效果的核心是數據管理與處理,因此良好的數據管理與治理是重中之重。腫瘤大數據管理平臺技術架構,見圖3。基于數據管理技術架構,數據處理流程,見圖4。

圖3 數據管理技術架構

圖4 數據處理流程

3.2 異構復雜數據采集與管理

3.2.1 數據采集 針對各醫(yī)療機構所處位置、使用數據庫類型不同,數據模態(tài)多樣性這種復雜異構情況,充分利用政務云資源在云端架設大數據集群環(huán)境,在云端以備份數據庫、Web Service或視圖等多種方式主動獲取各機構增量數據,保證數據完整性、準確性及與原生產系統的一致性。另外根據業(yè)務類型不同采用實時和定時兩種方式獲取數據。支持將分析成果返還區(qū)內醫(yī)療機構進行應用展現。通過中間表視圖,醫(yī)院臨床業(yè)務系統中的數據以符合通用數據模型需求的格式呈現出來。中間表是指連接通用數據模型和醫(yī)院臨床業(yè)務系統數據內容的數據庫表。數據庫中的視圖是一個虛擬表,其內容由查詢定義,可以提供與真實表相同的數據內容和字段。中間表視圖能夠在幾乎不增加數據庫負擔的情況下,實時、準確地將臨床、科研、管理所需的臨床數據從不同臨床業(yè)務系統中以滿足OMOP通用數據模型需求的方式查詢顯示出來。Kettle是數據抽取過程中常用的提取-轉換-加載(Extract, Transform and Load,ETL)工具。Kettle通過可視化的方式提供便捷、高效的數據提取方式。通過在Kettle中配置輸入輸出數據庫的接口和數據表并設置互相映射的字段,中間表視圖中的臨床數據被完整地抽取到通用數據模型的數據表中。

3.2.2 數據校驗 數據采集過程中由于人工或者醫(yī)院業(yè)務系統自身原因,抽取至數據中心的數據并非完全正確、可用、一致。為解決該問題,提高數據中心存儲信息的準確性,本方案特設置數據質量校驗平臺。該平臺通過設置一系列數據檢驗規(guī)則,對采集的數據進行校驗,從而提高數據中心的數據質量。通過數據質量校驗平臺可進行原始數據關聯性檢查、分布檢查以及清洗后數據與原始數據一致性檢查,在此過程中引入美國最權威的臨床數據質控標準以及14大類超過1 200條的數據檢測規(guī)則。對數據完整性、一致性、準確性、及時性4個方面進行校驗,定期迭代優(yōu)化數據采集流程。

3.3 數據標準化處理

3.3.1 概述 基于電子病歷和信息集成平臺系統收集包含病理學、細胞學、檢驗學和影像醫(yī)學等多種類型電子病歷數據,數據標準化處理是進行數據分析與應用研究的關鍵,即原始數據進入數據緩沖區(qū)后經歷結構化處理、通用數據模型映射、術語綁定、數據質控的一系列過程[11]。

3.3.2 數據結構化處理 對于非結構化文本數據,采用先進的自然語言處理(Natural Language Processing, NLP)和語義分析技術,通過文本預處理、人工標注、機器學習、模型構建及模型應用5個步驟進行處理,實現非結構化數據的結構化。

3.3.3 通用數據模型 構建多源異構臨床樣本與生命組學通用數據模型, 完成從區(qū)內不同醫(yī)院/隊列的數據標準向惡性腫瘤臨床與科研大數據采集與共享平臺數據標準轉化與映射。抽取來自區(qū)內不同醫(yī)院/隊列數據,構建原始數據存儲庫。研究基于質量控制數據抽取與篩選和基于角色控制的數據安全與訪問方法。數據模型選擇上,構建多源異構臨床樣本與生命組學的國際通用數據模型 OHDSI OMOP,完成從區(qū)內不同醫(yī)院/隊列的數據標準向腫瘤大數據中心平臺的數據標準轉化與映射。OHDSI是一個開放的全球醫(yī)療科研協作網絡,聚焦于醫(yī)學數據標準化、醫(yī)療產品安全監(jiān)控、比較有效性研究、個性風險預測、數據特征化、質量改進。目前數據網絡包括來自19個國家和地區(qū)的12億條患者記錄,超過100個數據庫。該模型以人為中心構建生命全息視圖,相關數據表的定義及表結構字段的規(guī)范均以國際標準為前提,將健康醫(yī)療數據轉化成研究用的數據模型,便于快速、有效分析醫(yī)療大數據。支持多中心、跨區(qū)域、跨國家的多中心科研,允許對不同觀測數據庫進行系統分析,實現數據互聯互通。

3.3.4 醫(yī)學術語綁定 對于術語綁定,采用世界上最復雜、最豐富的一體化中文醫(yī)學術語本體技術SNOMED CT,該術語庫涵蓋40 000余條疾病信息、20 000余條藥品信息及500余條檢查檢驗項目信息,與ICD10體系相比,疾病或項目的描述與分類更加細化,更適合于后期基于數據中心進行臨床科研研究[12-13]。

3.3.5 數據質控流程 數據質控采用自動與人工兼并方式進行,主要聚焦數據完整性、規(guī)范性、一致性、準確性、唯一性、及時性方面,通過質控規(guī)則設置、數據稽查、質量報告、問題分配管理實現質控過程的閉環(huán)管理。

3.4 數據存儲與傳輸安全

3.4.1 Hadoop分布式與關系型數據庫結合 對于龐大的數據資源,采用Hadoop 分布式與關系型數據庫相結合方式存儲,支持對PB級數據量的快速處理、大規(guī)模數據的秒級檢索,采用安全套接層(Secure Sockets Layer,SSL)加密,分離密鑰和加密數據,使用過濾器和數據備份等方式,構建數據存儲安全策略。利用隔離區(qū)(Demilitarized Done,DMZ)策略,保證數據傳輸安全。

3.4.2 數據安全隱私技術 為保護醫(yī)院數據安全,需要進行數據隱私處理。首先整理原始數據,產生中間表視圖。臨床數據大致可分為兩種類型:結構化和非結構化。結構化數據,首先對個人信息進行脫敏處理,對原始數據進行二次編碼,防止其逆向回溯源數據。使用成熟的醫(yī)學數據脫敏算法識別信息中有關患者隱私的重要信息,如姓名、身份證號、生日等,進行脫敏處理。非結構化數據,首先根據文本類型選擇自然語言處理,再根據中文本體庫建設和通用數據模型進行數據合并和映射,將數據脫敏后導入數據倉庫中。最后對脫敏后的數據使用預定的規(guī)范進行標準化。脫敏后的數據可最大限度地方便醫(yī)學研究,避免用戶隱私信息泄漏。

3.4.3 數據安全制度 構建人員管理層面的數據安全管控制度,嚴格控制數據共享和傳輸操作。涉及多中心研究情況,需由需求發(fā)起方提出數據使用書面申請并簽字留存,該書面申請涵蓋數據大小、范圍、使用目的、使用場景、使用時間等內容,院方管理人員審批通過后,經過技術人員對數據進行脫敏,然后由技術方評估數據需求安全性,達到要求后審批通過才可使用,留存?zhèn)浞萆暾埍砗蛯徟恚摂祿_到使用時限后需清除院外拷貝,防止超需使用或泄漏風險。該流程從制度層面強化數據安全和共享機制,責任到人。

3.5 數據共享

基于中心交換系統(企業(yè)服務總線為核心)與可定制的前置交換軟件系統來實現區(qū)內各醫(yī)療機構間臨床及組學數據交換與共享。基于協作網絡共享平臺,定義臨床表型數據共享標準規(guī)范,為腫瘤醫(yī)學數據共享提供完善的標準。通過統一的接口管理方式對接口標準進行封裝,對接口申請單位采用統一標準進行流程審核、接口調用、系統監(jiān)控。最終實現數據共享、統一數據標準,促進各隊列業(yè)務協同及研究成果共享。

4 結語

腫瘤臨床數據包括電子病歷、醫(yī)學影像、臨床檢驗等多種類型,這些數據多處于歸檔狀態(tài),又分散存儲于不同業(yè)務系統中,且多為半結構化和非結構化數據,具有多源異構、多模高維的特點,依靠傳統數據分析、處理技術無法滿足實際需求,數據歸檔和處理存在難度。研究和分析腫瘤疾病發(fā)病模式和影響因素,為早期篩查、診斷和藥物研發(fā)提供重要依據,為醫(yī)護人員提供臨床指導,為患者提供最佳診療方案,為腫瘤精準醫(yī)療的實施奠定基礎。本研究以新疆醫(yī)科大學附屬腫瘤醫(yī)院腫瘤大數據科研平臺建設為案例,探討大數據架構、作業(yè)流程以及在數據采集、標準化、共享和安全保護等方面的挑戰(zhàn)和應對措施,使大數據在腫瘤防治、臨床診斷、科學研究、指南制定等方面落地賦能。醫(yī)療大數據平臺構建面臨諸多挑戰(zhàn),需以傳統臨床經驗為基礎,以高新技術為依托,制定合理長遠的計劃,進一步推動大數據在醫(yī)療等領域的應用。

猜你喜歡
數據庫
數據庫
財經(2017年15期)2017-07-03 22:40:49
數據庫
財經(2017年2期)2017-03-10 14:35:35
兩種新的非確定數據庫上的Top-K查詢
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
數據庫
財經(2015年3期)2015-06-09 17:41:31
數據庫
財經(2014年21期)2014-08-18 01:50:18
數據庫
財經(2014年6期)2014-03-12 08:28:19
數據庫
財經(2013年6期)2013-04-29 17:59:30
主站蜘蛛池模板: 在线观看无码a∨| 国产无码性爱一区二区三区| 国产chinese男男gay视频网| 国产在线视频欧美亚综合| 青草精品视频| 国产精品尤物铁牛tv| 亚洲无码37.| A级全黄试看30分钟小视频| 免费A级毛片无码免费视频| 72种姿势欧美久久久久大黄蕉| 久久精品中文字幕免费| 欧美精品亚洲精品日韩专区va| 亚洲精品无码专区在线观看| 国内精品久久久久久久久久影视| 视频二区国产精品职场同事| 国产中文一区二区苍井空| 精品久久久无码专区中文字幕| 97亚洲色综久久精品| 亚洲无码高清免费视频亚洲| 制服无码网站| 在线观看国产一区二区三区99| 亚洲中文久久精品无玛| 91国内外精品自在线播放| 日本精品视频| 无码'专区第一页| 欧美一区二区啪啪| 中文字幕av无码不卡免费| 少妇精品网站| 国产黑丝视频在线观看| 热99re99首页精品亚洲五月天| 午夜精品久久久久久久无码软件| 久久特级毛片| 波多野结衣无码视频在线观看| 国产91导航| 中文字幕2区| 国产内射一区亚洲| 国产精品香蕉| 喷潮白浆直流在线播放| 99久久国产综合精品2020| 亚洲av综合网| 色丁丁毛片在线观看| 欧美亚洲日韩不卡在线在线观看| 久久久精品无码一二三区| 色悠久久久| 亚洲第一综合天堂另类专| 亚洲综合亚洲国产尤物| 婷婷久久综合九色综合88| 影音先锋丝袜制服| 国产香蕉在线视频| 欧美啪啪精品| 综合色88| 欧美日在线观看| 欧美另类第一页| 天天干天天色综合网| 中文天堂在线视频| 久久亚洲国产一区二区| 精品久久高清| 国产午夜精品一区二区三| 毛片在线播放a| 9啪在线视频| 99热这里只有精品国产99| 日韩免费毛片视频| 婷婷色狠狠干| 青青久在线视频免费观看| 欧美色伊人| AV不卡无码免费一区二区三区| 久久精品国产精品一区二区| 日本欧美一二三区色视频| 色男人的天堂久久综合| 免费jizz在线播放| 国产成人永久免费视频| 亚洲成aⅴ人片在线影院八| 亚洲av无码久久无遮挡| 亚洲精选高清无码| 免费无码又爽又黄又刺激网站| 91色国产在线| 男人天堂亚洲天堂| 国产成人无码AV在线播放动漫| 99热这里只有精品久久免费| 亚洲三级网站| 精品国产免费第一区二区三区日韩| 99热这里只有精品免费国产|