999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向DataOps的醫院臨床數據中心設計

2024-12-31 00:00:00俞高劉燃峰
醫學信息 2024年19期

摘要:隨著“三位一體”的智慧醫院建設的開展,醫院臨床數據中心在醫院信息化建設中扮演越來越重要的角色,當下很多臨床數據中心的整體架構設計的出發點多是面向評審評級,而忽略數據平臺本身的特性及平臺的可實施性。本文借鑒研發運維一體化DataOps理念,采用微服務架構、面向敏捷交付構建臨床數據中心,從而有效解決臨床數據中心的架構理想實施艱難的問題。

關鍵詞:DataOps;臨床數據中心;敏捷

中圖分類號:R107" " " " " " " " " " " " " " " " " " 文獻標識碼:B" " " " " " " " " " " " " " " " DOI:10.3969/j.issn.1006-1959.2024.19.007

文章編號:1006-1959(2024)19-0048-06

Hospital Clinical Data Centre Design for DataOps

YU Gao1,2,LIU Ranfeng3

(1.Data Centre Ramp;D Department,Ewell Technology Co., Ltd.,Hangzhou 310051,Zhejiang,China;

2.MBA Center,School of Management,University of Science and Technology of China,Hefei 230000,Anhui,China;

3.Information Department,the First People's Hospital of Lianyungang,Lianyungang 222002,Jiangsu,China)

Abstract:With the construction of the trinity smart hospital, the hospital clinical data center plays an increasingly important role in the construction of hospital information technology. The starting point of the overall architecture design of many clinical data centers is mostly oriented to the evaluation of ratings, while ignoring the characteristics of the data platform itself and the implementability of the platform. In this paper, we propose to draw on the concept of integrated DataOps for Ramp;D, operations and maintenance, adopt microservice architecture, and guide the design of clinical data center products for agile delivery, so as to effectively solve the problem of difficult implementation of the architectural ideals of clinical data centers.

Key words:DataOps;Clinical data center;Agile

伴隨公立醫院高質量發展改革的推進,尤其是電子病歷應用水平功能測評和醫院互聯互通成熟度測評的普及,醫院臨床數據中心已經成為了三級醫院信息系統的標配。由于診療數據涉及業務系統多、格式與質量參差不齊,難以有效地進行數據收集、應用,導致臨床數據的價值無法高效完成提升與轉化。醫院臨床數據中心主要用于匯聚、加工和分析臨床診療數據,實現診療數據在系統間的互通和共享,以支持醫療機構的管理和決策。不過,在醫院臨床數據中心實施過程中,既需要對接多個第三方廠商的若干信息系統,又需要滿足包括實時和非實時的各種數據服務需求,因此數據中心交付難的問題一直困擾項目甲乙雙方。當前建設臨床數據中心面臨的主要難題有:①數據整合困難:由于醫療機構信息建設通常缺乏長期整體規劃[1],業務信息系統之間數據不相通、離散分布,使得在收集圍繞疾病事件/患者就診的全面數據時,遭遇不少困難。即使已從多個業務系統中獲得數據,如何將醫院數據進行關聯與整合,也是醫院數據應用面臨的難題之一。②數據清洗流程繁瑣:臨床業務系統中許多數據存在錄入不規范、不一致、缺失、重復、混亂、格式不規范、非結構化等情況[2],因此在從各個業務系統中獲取海量臨床專病科研所需的數據時,對數據的清洗、轉化處理較為困難。要讓醫療數據生根發芽實現數據驅動,上述問題的解決則需要依靠數據治理來解決。③數據標準化程度低:醫療機構通常由多個系統供應商提供信息系統,各公司系統數據庫缺乏通用數據元素,系統術語缺乏臨床實用性[3]。各類醫學與醫技術語使用不規范、命名不一致,想將全部歷史病歷數據(非結構化和結構化數據)進行標準化、歸一化處理、存儲,從而獲得高質量數據,是一件費時費力的工作。④缺乏搜索臨床數據的入口:醫院存儲有大量可利用的臨床數據尤其是中文電子病歷數據,缺少準確地檢索到所需數據的中文相似電子病歷檢索工具[4],形成“物不能盡其用”的現狀。

DataOps方法在各個行業的應用研究也取得了一定的進展。在制造業和公共事業行業,公共事業組織考慮采用DataOps來建立數據驅動的文化并在市場上獲得競爭優勢[5]。在醫療健康領域,Bahaa S等[6]為數據科學和分析項目提出了一種新的DataOps生命周期,并應用于使用加州大學歐文分校的心臟病數據集的醫療保健案例研究。提倡協作、質量控制和更快地交付的DataOps,在汲取了軟開發中的DevOps方法并與敏捷和精益生產等相結合之后,可以有效的促進臨床數據中心的建設。因此,本文試圖利用DataOps理念構建一套科學、標準、規范的面向醫院的臨床數據中心,解決臨床數據中心建設過程中遇到的數據整合難、清洗流程繁瑣等問題,從而提升醫院臨床數據中心項目的交付質量和效率。

1 DataOps簡述

1.1 DataOps定義" DataOps由Lenny Liebmann[7]在2014年首次提出,Ereth J[8]、Atwal H[9]、Vargas-Rueda L[10]、Mainali K[11]等學者在其研究中都提到了自己對DataOps概念的理解,表1為各個學者對DataOps的理解。總體來說,DataOps是一種面向流程的方法,它由人驅動,而不是技術驅動。對于專注于數據的數據科學家和開發人員來說,它允許其在不放棄數據治理要求的情況下開展敏捷的數據處理流程。DataOps為數據編排、自動化和協作提供了最佳實踐,旨在提高工作效率。作為新興的概念,DataOps正成為熱點。

1.2 DataOps的實施準則" 綜合上述專家的論述,可以看出DataOps與敏捷軟件工程、DevOps實踐、精益生產等概念相近。如圖1 所示,DataOps將敏捷、DevOps、精益生成等技術用于數據科學或數據分析項目中,來提升數據處理質量獲取更大收益。相比傳統的數據處理方式,DataOps更強調數據過程的自動化和協同化。

數據類項目具有區別其他項目的特異性,數據分析的需求往往變化很快。以前處理的一些數據管道對于新的業務很容易過時而不適用,因此,往往需要從頭開始一個新的數據任務來處理新需求。為了應對不斷變化的需求和數據,敏捷和DevOps等被引入數據分析項目中,形成DataOps方法。其落地過程還需要結合人、技巧、技術、流程、文化等。總體來說,DataOps的實施準則主要涉及以下幾點:①DataOps文化:首先,通過確定組織中的人員和文化來啟動DataOps;其次,針對DataOps建立與組織內部的流程和工具一致的管理機制。②自動化:通過各種工具和技術將數據處理分析過程進行集成,從使數據分析流程自動化運行。③版本控制:版本控制對于數據、文檔和代碼的跟蹤是必不可少的。通過版本控制,不同的團隊成員可以方便溝通數據分析工作,避免由于版本原因導致的問題。④容器化和復用:有復用的可能性,就不必要浪費時間重做同樣的事情。通過將程序容器化提升數據分析過程的復用有助于減少因外部環境而導致的失敗風險。⑤設置多個環境:為生產環境和開發環境設置一個獨立的環境,頻繁的需求更新在開發環境進行,這不會對正在生產環境產生影響。在開發環境中,每個團隊成員有自己的工作環境,這樣每個人都可以獨立工作而不影響其他環節。⑥測試和試驗:在將開發環境發布到生產環境之前,需要做一個充分的測試。沒有測試,就無法保證數據處理過程的質量。⑦持續集成和部署:在測試環境就將各數據流程的工作集成起來,在通過測試后,使用持續部署,將其發布到生產環境中。⑧持續監控:定期監控開發環境和生產環境,以跟蹤追溯各個數據處理流程的性能、輸入和輸出質量。通過統計分析持續監測的數據,進一步改進各個數據處理流程。⑨溝通與合作:不斷地與客戶、團隊成員及利益相關者溝通,使信息能夠更快地傳遞。在工具、作業任務和人之間建立協作工作平臺,保障得到更好的結果。

總之,DataOps提倡協作、質量控制和更快地交付項目。在汲取了軟開發中的DevOps方法,并與敏捷和精益生產等相結合之后,再加上落地實施過程中需要遵守的原則和指南,DataOps的推廣落地已經是有章可循。

2基于DataOps的臨床數據中心設計

2.1建設思路" 面向數據全生命周期的DataOps是一種以價值最大化為目標的最佳實踐,該方法聚焦于協同從數據需求輸入到交付物輸出的全鏈路過程,包含了敏捷化、標準化、自動化、智能化的特征。基于DataOps的系統開發遵循迭代和增量的方法,允許管理者和利益相關者在軟件的開發期間優先考慮用戶價值的特性,并跟蹤用戶的反饋。根據客戶的持續反饋進行的小迭代,確保項目保持令人滿意的進展。

DataOps 倡導協同式、敏捷式的數據資產管理[12](圖2)。它需要通過建立數據管道,明確數據流轉過程及環節,并且該過程能夠自動化進行,從而可以縮短數據項目的周期,并持續改進數據質量,降低管理成本,加速數據價值釋放。具體到醫療機構,業務部門對應了醫務科、質控科及臨床業務科室等提出數據需求的業務部門;IT部門則對應信息部門或者醫院IT供應廠商;如今越來越多的醫療機構開始成立專門的數據管理部門,部分醫療機構成立“醫學大數據或人工智能中心”“運營部”等承擔對應的數據管理工作。

2.2系統架構" 為了實現圖2的DataOps敏捷協同一體化管理機制,需要特定的臨床數據中心平臺來支撐,它需要包括工作流業務流程工具、測試和監控工具、部署自動化工具,也會涉及代碼和數據版本控制工具、數據分析和可視化工具、數據治理工具等。為了滿足DataOps產品架構方面采用基于微小化的整體建設架構理念,以支撐自動化運維管理、靈活、動態、安全的基礎架構,將數據中心管理平臺和數據應用分解成為模塊化應用,見圖3。通過這種模式的建設,能夠隨著整體系統運營時間的增長,從而使得醫院有效分析和利用醫療大數據的能力不斷提升[13]。

平臺采用Spring Cloud微服務框架,在該框架基礎之上開發了數據服務配置功能。Spring Cloud提供了微服務的配置管理、服務發現、斷路器、智能路由、微代理、控制總線、全局鎖、分布式會話和集群狀態管理等,基于Spring Cloud微服務框架的數據平臺滿足了各類院內、互聯網、醫聯體等服務的高并發、穩定性等需求。微服務基礎底座依托Kubernetes資源配額管理、容器編排、應用部署、集群管理等能力,采用了國內外先進、多源豐富的云原生開源社區與企業服務技術棧兼容融合,構建微服務基礎底座,實現對整體系統的徹底塊間解耦,提供靈活的軟件復用和服務重構能力。

2.3核心模塊" 能夠支撐DataOps落地的臨床數據中心平臺需要具備敏捷開發、快速迭代的要求。為了滿足上述要求,本臨床數據中心設計了數據集成引擎、數據可視化引擎、自然語言處理引擎和數據治理引擎4個模塊,它們以低代碼、易操作的優勢被公司實施人員和醫療機構技術人員所接納。

2.3.1 集成引擎模塊" 面向DataOps的數據研發環節,需要通過串聯數據模型設計、數據標準設計、數據質量設計、數據集成、數據存儲、數據加工等流程[14],建成數據研發一體化能力,為此需要一個集成上述功能的數據集成引擎工具。如圖4所示,數據集成引擎模塊是結合數據倉庫建模、采集和實施的方法論,滿足Oracle、SqlServer等各種主流數據源數據的整合要求,提供了更加便捷、更智能的服務。數據集成的核心任務是要將互相關聯的分布式異構數據源集成到一起,使用戶能夠以透明的方式訪問這些數據源。有別于其他行業的數據集成工具,該工具通過內置醫療行業臨床、運營和科研倉庫數據采集模板,降低了數據采集的運維門檻,使得復雜的工作簡單化,雜亂的流程統一化。

2.3.2 數據可視化引擎" 商業智能可視化技術在對醫院抗菌藥物應用、公立醫院績效考核管理等醫院數據分析領域有廣泛的應用[15,16],但指標的統計分析往往會根據需求的變化而變化,DataOps倡導的持續集成和部署正是解決該問題的有效方式,因此便于用戶自助分析的可視化引擎必不可少。

可視化集成引擎采用asp.net、bootstrap等技術,汲取Echart、FineRepor等第三方可視化庫開發而成。其核心功能主要包括對柱形圖、折線圖等圖例的封裝,根據不同需求自由定義展示模塊,然后用不同模塊自由設計數據分析報表。此外,引擎基于運營數據倉庫實現可視化報表的自助設計,可以可快速生成、方便操作,可根據醫院、個人喜好生成各種儀表盤,見圖5。基于可視化數據分析平臺,可以開發出適配電腦端和移動端的各種應用產品,這樣就可以大大節約數據產品應用開發工作。

2.3.3自然語言處理引擎" 精準醫學的核心是廣泛收集患者個體相關的數據,其中電子病歷數據是最重要的數據之一[17]。以電子病歷為主體的醫療大數據被廣泛應用于醫藥研發、臨床決策支持、個性化醫療、流行病監測和預警等[18],上述數據應用的前提都需要經歷非機構化的病歷數據進行結構化的過程,因此自然語言處理不可或缺。自然語言處理引擎由算法標注平臺、機器學習平臺、自然語言處理平臺、結構化抽取平臺以及可視化展示5大板塊構成,實現對電子病歷非結構化數據的文檔分類、段落分類、醫學術語和實體屬性關系識別,將臨床數據中的文本段落信息轉化成可以被醫院數據分析項目有效利用的結構化標準數據。

2.3.4 數據治理引擎" 數據治理可以有效地提高數據質量、共享信息和保護敏感數據,而且數據治理是貫穿數據整個生命周期。在DataOps概念中,數據治理可以作為開發、部署、操作和監控工作流的一部分,它是DataOps最重要的組成部分之一[19]。數據治理引擎模塊通過數據標準管理、元數據管理、數據質量管理、數據資產管理等功能實現數據標準規范化、數據關系脈絡化、數據質量度量化的目標,最終實現醫院數據資產規范化管理,使得醫院數據資產更加穩定,更可靠,可管理,更易懂,提高醫院的信息化管理水平。

通過上述4個模塊實現代碼線上流轉,構建了CI/CT/CD能力,支持自動化集成、部署和測試,支持對數據全鏈路的監測和預警,建立全鏈路數據安全管控,實現面向DataOps的全周期的數據管理。

3總結

當前,DataOps實施是研究者重點關注的領域。Vargas-Rueda L等[3]分析了DataOps概念及其在數據管道中的實現,為了解和實施DataOps提供了指導。Demchenko Y[20]采用敏捷服務和應用程序開發模式來快速響應市場需求和技術變化的情況,并提供了用于DevOps和DataOps的基于云服務的平臺和工具的示例,介紹了通過云服務開發及基于云原生微服務的自動化配置加速DevOps軟件開發實踐。可以說,DataOps的實踐和推廣已經沒有了技術壁壘。

醫療行業內構建基于DataOps的臨床數據中心平臺,在產品功能、交付流程等方面也可以取得一定效果。產品功能方面,更加貼近用戶需求,產品設計更加科學合理。如可視化的數據集成功能,提供了一體化的數據流水線作業平臺,降低了交付門檻;數據可視化分析工具為客戶自助分析提供了有效工具,增強了產品的可擴展性,也有利于拓展更多的數據應用。交付流程方面,構建數據開發運維一體化(DataOps)的數據開發交付運維范式,將敏捷、精益等理念融入數據開發交付過程,通過對數據相關人員、工具和流程的重塑,打破協作壁壘,構建新的數據開發、治理、運營、交付一體化的流水線,提高數據產品交付效率和質量。

此外,伴隨醫療云平臺的發展,醫療行業內的DataOps發展更將提速。受限于醫療機構的內外網分離的影響,當前臨床數據中心平臺在持續迭代、持續集成和持續發布交付的流程仍有很大提升空降。基于醫療云平臺的DataOps可以完全落實DevOps軟件開發實踐。

參考文獻:

[1]陸斌杰,孔憲明,翁子寒,等.上海仁濟醫院數據中心建設探索[J].中國數字醫學,2010,5(8):71-73.

[2]王強,易應萍.臨床醫療大數據治理和應用[J].醫學信息學雜志,2018,39(8):1-6.

[3]賴俊愷,廖茜雯,姚晨,等.臨床研究中真實世界數據標準化的障礙以及建議:一項定性研究[J].英國醫學雜志中文版,2022,25(11):640-646.

[4]于家畦,康曉東,白程程,等.一種新的中文電子病歷文本檢索模型[J].計算機科學,2022,49(z1):32-38.

[5]Sahoo PR,Premchand A.Dataops in manufacturing and utilities industries[J].International Journal of Applied Information Systems,2019,12(6):1-6.

[6]Bahaa S,Ghalwash AZ,Harb H.DataOps Lifecycle with a Case Study in Healthcare[J].International Journal of Advanced Computer Science and Applications,2023,14(1):136-144.

[7]Liebmann L.3 reasons why DataOps is essential for big data success[J].IBM Big Data amp; Analytics Hub,Retrieved October,2014,28:2020.

[8]Ereth J.DataOps-Towards a Definition[J].LWDA,2018,2191:104-112.

[9]Atwal H.Practical DataOps:Delivering agile data science at scale[M].Berkeley:Apress,2019.

[10]Vargas-Rueda L,Pongutá-Díaz S,González-Sanabria JS.DataOps,una alternativa para la gestión de Data Pipelines[J].Revista Ibérica de Sistemas e Tecnologias de Informa??o,2020(E38):259-269.

[11]Mainali K.DataOps:Towards understanding and defining data analytics approach[D].Stockholm:KTH Royal Institute of Technology,2020.

[12]大數據技術標準推進委員會.數據資產管理實踐白皮書(6.0 版)[M].北京:現代出版社,2023.

[13]馬獻,陳麗,郝冀皖,等.利用kubernetes集群搭建基于容器技術的分布式架構數據中心研究[J].中國數字醫學,2021,16(12):43-48.

[14]Tamburri DA,Heuvel WJVD,Garriga M.DataOps for Societal Intelligence: a Data Pipeline for Labor Market Skills Extraction and Matching[C]//2020 IEEE 21st International Conference on Information Reuse and Integration for Data Science (IRI).2020:391-394.

[15]趙雨,李哲青,張波,等.基于Power BI的數據分析在三級公立醫院績效考核管理中的研究與應用[J].現代醫院,2023,23(5):741-746.

[16]錢進,張勁松.醫院門診抗菌藥物應用管理中大數據可視化分析方法的應用和探索[J].中國醫院藥學雜志,2017,37(18):1850-1856.

[17]韋玉芳,施維,尚于娟,等.基于電子病歷數據的臨床表型提取及其應用進展[J].醫學信息學雜志,2017,38(8):6-10.

[18]孟琳,馬金剛,劉靜,等.醫療大數據的應用與挑戰[J].醫療衛生裝備,2018,39(10):71-74,88.

[19]Torre-Bastida AI,Gil G,Mi?ón R,et al.Technological Perspective of Data Governance in Data Space Ecosystems[M]//Data Spaces:Design,Deployment and Future Directions.Cham:Springer International Publishing,2022:65-87.

[20]Demchenko Y.From DevOps to DataOps: Cloud based Software Development and Deployment[C]//The International Conference on High Performance Computing and Simulation(HPCS 2020).2020:10-14.

收稿日期:2023-09-20;修回日期:2023-10-09

編輯/成森

作者簡介:俞高(1986.12-),男,安徽定遠縣人,碩士,高級工程師,主要從事醫療大數據研究

主站蜘蛛池模板: 中文字幕 欧美日韩| 噜噜噜综合亚洲| 国产在线一二三区| 欧美黄网在线| 色悠久久久久久久综合网伊人| 台湾AV国片精品女同性| 十八禁美女裸体网站| 无码AV动漫| 国产中文一区二区苍井空| 精品国产自在在线在线观看| 日韩无码黄色| 91po国产在线精品免费观看| 亚洲欧美日韩成人高清在线一区| 老色鬼欧美精品| 找国产毛片看| 午夜精品影院| 亚洲午夜18| 性色一区| 日本影院一区| 麻豆精品国产自产在线| 精品人妻AV区| 亚洲啪啪网| 国产专区综合另类日韩一区 | 国产va在线| 2020久久国产综合精品swag| 超级碰免费视频91| 国产成人成人一区二区| 国产成人一区二区| 三上悠亚精品二区在线观看| 91外围女在线观看| 精品国产欧美精品v| 亚洲日韩高清无码| 欧美69视频在线| 亚洲激情99| 精品国产成人av免费| 久久黄色小视频| 无码高清专区| 91在线播放国产| 1级黄色毛片| 久久性视频| 国产欧美日韩专区发布| 亚洲三级影院| 丁香综合在线| 国产乱论视频| 亚洲精品少妇熟女| 日韩欧美国产另类| 日a本亚洲中文在线观看| 亚洲国产精品国自产拍A| 亚洲欧美日韩视频一区| 欧美日韩国产在线观看一区二区三区| 91成人精品视频| 欧美19综合中文字幕| 在线欧美国产| 国产成人精品免费视频大全五级| 91精品国产一区自在线拍| 亚洲码一区二区三区| 久久99久久无码毛片一区二区 | 一级黄色欧美| 青草视频在线观看国产| 国产欧美日韩资源在线观看| 国产精品99久久久久久董美香| 亚洲国产综合精品一区| 亚洲国产黄色| 国产视频 第一页| 亚洲av无码成人专区| 国产第八页| 97在线国产视频| 狠狠v日韩v欧美v| 国产成人综合亚洲欧洲色就色 | 色一情一乱一伦一区二区三区小说| 成人在线综合| 欧美色图久久| 中文字幕人成乱码熟女免费| 国产在线第二页| 在线亚洲精品自拍| 国产毛片不卡| 亚洲欧洲美色一区二区三区| 国产高清在线观看91精品| а∨天堂一区中文字幕| 日本高清免费一本在线观看| 亚洲天堂.com| 激情無極限的亚洲一区免费|