999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于大數據平臺的科研病種庫系統設計與實現

2021-09-24 03:39:22王覓也李言生龔后武
醫療衛生裝備 2021年9期
關鍵詞:系統管理

王覓也,劉 然,王 堯,李言生,葉 琳,龔后武

(1.四川大學華西醫院信息中心,醫療信息化技術教育部工程研究中心,成都 610041;2.西部戰區空軍醫院,成都 610065;3.東華醫為科技有限公司,北京 100089)

0 引言

近年來,隨著信息化技術的發展,大數據技術在工業制造、智能交通、醫療科研等多個領域得到廣泛應用[1]。臨床科研作為醫療科研的重要組成部分,其形式有臨床科研課題立項、臨床案例分享、臨床經驗總結等。在各種形式的臨床科研實施過程中,科學循證是關鍵,其強烈依賴于大量臨床真實數據支撐。目前,建立科研病種庫逐漸成為臨床科研數據收集、整理和分析的主流模式,而如何將大數據技術與科研病種庫結合利用,更加方便地實現科研數據需求的采集、提取和分析,是目前面臨的一個重要難題。

20世紀中葉,西方發達國家便開始了對醫學臨床科研病種庫的研究和建設。Greenes等[2]于1969年首次利用數據庫技術對臨床診療數據進行管理和利用。截至目前,國外已形成了大量的多中心單病種數據庫,如美國CIRS急診醫學數據庫(CIRSEmergency Medicine Databank)、日本心血管外科數據庫(Japan Congenital Cardiovascular Surgery Database)等,大大促進了相關學科發展。國內的病種庫建設與國外相比還有很大差距,但也呈迅速增長的態勢。專業的臨床醫療科研人員根據專科常見疾病建立起疾病的相關因素、預期目標和質量評價知識庫等,越來越多的醫院開始將臨床科研數據庫的建設工作從線下遷至線上,從單中心研究向多中心研究轉變,如南方醫科大學建立的在線肺癌病歷數據庫[3]、軍事醫學科學院附屬醫院建立的消化系統腫瘤數據庫[3]、中國醫科大學附屬第一醫院建立的基于醫療大數據的省市級肺癌專病庫平臺[4]等。這些傳統的多中心病種庫系統大多是圍繞某一特定的疾病構建,數據采集工作大多依靠臨床醫師人工錄入,工作量大,數據易出錯,數據庫運維成本高,數據持續性弱。

本文提出將科研病種庫系統搭建于大數據平臺上,通過大數據技術全維度治理后的標準數據資源池實現數據的自動采集,達到減少人工工作量、保障數據質量、降低運維成本的目的。大數據平臺的支撐解決了數據獲取難的問題,臨床科研所需數據變得可見、可得,為全院各科室使用系統自行構建病種庫提供了很好的應用基礎。打造院級層面的科研病種庫系統,不僅需要臨床科室參與,更需要醫院信息部門的技術投入,共同構建“醫學+信息”交叉合作的工程應用模式。

1 系統設計

1.1 需求分析

我院是一所綜合性研究教學醫院,為了給院內大數據的應用服務提供數據能力支撐[5],構建了醫療大數據平臺。大數據平臺基于先進的大數據系統框架、分布式數據庫、人工智能等技術構建,在大數據處理分析方面很具優勢[6-7]。

長期以來,很多科室憑借課題和項目的機會構建了一些獨立封閉的科研數據庫系統,當整個科研項目結題后,這些科研數據庫便進入了無持續資金投入、無人維護的狀態,造成了數據資源的浪費。因此科研病種數據庫系統需納入醫院統一管理,同時為提升科研效率、減少醫生工作量并保障數據的持續性和穩定性,臨床數據采集需自動化,且數據范圍應納入全院所有臨床業務系統的數據。為滿足上述需求,亟須構建面向全院的基于大數據平臺的科研病種庫系統。

科研病種庫系統需要集成專病患者全周期數據。患者診療過程中的數據,如影像、病理、病歷文本等可從電子病歷系統中獲取到,而患者診前和診后的數據需要進行隨訪采集,隨訪表單的設計一般通過病例報告表(casereport form,CRF)實現[8]。傳統的科研病種數據庫構建方式無法同時納入醫院多個系統接口數據,無法實現文本資料的結構化[9-10]。基于大數據技術的科研病種數據庫可對全維度臨床數據進行數據治理,實現結構化和術語化[11],形成臨床科研資源中心,為科研病種庫系統的構建提供豐富而完善的數據資源,使科研數據提取效率成倍提升,大大減少科研流程中的人力勞動,滿足科研應用需求,為臨床輔助、疾病研究和產品孵化等領域提供支撐。

1.2 架構設計

基于大數據平臺的科研病種庫系統的整體架構如圖1所示。醫院大數據平臺集成電子病歷系統、醫院信息系統(hospital information system,HIS)、檢驗系統等數據,基于大數據相關技術,整合、清洗醫院多源異構數據,并基于臨床科研所需要的數據構建科研數據中心(research data repository,RDR),形成科研病種庫系統的數據源。醫院大數據平臺數據治理的主要工作包括進行數據建模、數據后結構化、數據標準化、元數據管理、主數據管理和數據質量控制等。同時,該平臺也匯集了四川大學華西醫院醫聯體的臨床數據資源,在開展多中心研究時,通過RDR中的醫院標識可自動提供不同醫院的數據支持。科研病種庫系統根據用戶的科研需求實現科研應用,可按病種、項目、科室層面、醫院層面多學科聯合構建病種庫,也可部署外網版支持跨醫院的多中心聯合共建病種庫。系統提供用戶管理、項目組管理、項目組成員管理、項目屬性維護、CRF設計、隨訪設計、病例入組、病例瀏覽、訪視進度總覽、人工智能(artificial intelligence,AI)隨訪、大數據檢索、CRF檢索、數據導出等模塊實現臨床數據的科研分析,發現病種規律,發掘病種新特征。系統的數據可導出到大數據平臺數據挖掘模塊,進行數據統計、分析模型的算法開發以及模型的管理和發布等科研活動。

圖1 科研病種庫系統整體架構圖

本系統采用瀏覽器/服務器(Browser/Server,B/S)體系結構,采用ASP.NETMVC4實現分層技術架構,將展示層、業務層和數據訪問層分離。Bootstrap+JQuery呈現用戶界面展示層,提供對IE、Chrome、Firefox的全面兼容。在數據訪問層,根據Cache特性開發的ORMapping實現基礎業務數據訪問。針對Greenplum構建的RDR,采用Spring Boot組建數據讀取服務,為表單外部數據和數據查詢導出提供數據服務支持。將業務層和數據訪問層的通用處理能力提煉出來,成為另外一種通用的機制,包括系統授權機制、異常處理機制、日志記錄機制、緩存機制和安全控制機制。此外,采用插件機制實現客戶化定制功能,如自定義CRF,采用Vue.js+MySQL組合完全解除對科研系統的依賴,除易于維護之外,也便于后續無縫對接移動端隨訪。

2 系統實現

2.1 系統運行流程

為解決傳統專病科研遇到的“科研構思難、數據獲取難、想法驗證難、數據處理難”等系列問題[12],我院將臨床科研全流程進行深度解析和優化改造,包括數據獲取、專病庫建立、發現問題和提出假設[13]等各環節,設計了面向全院的基于大數據平臺的科研病種庫系統。本系統以數據為驅動,基于各專科專病進行病種庫構建,臨床科室根據其需求自行配置專病數據庫的數據采集表單、隨訪模式,信息科負責大數據平臺數據治理,為各專病庫提供數據接口,輔助臨床醫生便捷、高效地完成整個科研過程。系統運行流程如圖2所示。

圖2 科研病種庫系統運行流程圖

2.2 功能模塊

科研病種庫系統主要包括項目管理模塊、病例管理模塊、隨訪管理模塊和數據利用管理模塊,具體功能模塊結構圖如圖3所示。

圖3 科研病種庫系統功能模塊結構圖

2.2.1 項目管理模塊

2.2.1.1 項目屬性維護

系統以低耦合的設計方式將病種項目的常規管理和科研數據應用分析分離,確保了系統穩定和科研項目的安全。系統管理員負責各個病種庫項目的創建和屬性維護,項目屬性包括項目名稱、級別、責任科室、項目負責人等,項目屬性維護界面如圖4所示。科研項目管理員負責處理病種數據的增刪查改和分析統計。系統提供用戶管理和角色管理功能,將不同用戶和角色在操作權限上區分和隔離,通過統一授權驗證將登錄用戶信息與對應的配置權限關聯,確保在系統使用過程中的權限單一和安全。

圖4 項目屬性維護界面

2.2.1.2 CRF設計

不同科研項目需要采集不同的病種相關數據,傳統由文件導入或由工程師完成采集會導致數據質量和數據關聯較差。科研病種庫系統提供一個全面的CRF設計模塊,包括表單數據項組件管理、表單設計管理、表單版本發布管理和表單權限管理4個內容。表單數據項組件管理是將CRF的每一個數據項組件作為全局的元數據項目進行統一維護和管理,確保不同表單中的數據項概念一致。表單設計管理是專科醫生將相應的數據項組件進行布局和配置,如圖5所示。每個數據項組件根據不同科研需要,設置相應的位置、對齊、字體、顏色、名稱、函數事件、字典值域等屬性信息。同時,組件還可以設置大數據平臺業務數據接口,實時抓取數據,減少手工操作誤差。在一張完整的CRF中,可配置組件間的數據校驗規則,確保表單填寫的數據質量。表單版本發布管理和表單權限管理功能可確保每個CRF在限定的權限下,通過標準應用程序接口(application programming interface,API)與不同科研項目、不同病種庫的數據進行交換。

圖5 CRF設計界面

2.2.1.3 隨訪流程設計

系統提供多種隨訪類型以支持不同的科研需要,有參考點隨訪、統一隨訪、自定義隨訪、無計劃隨訪、參考點和無計劃相結合隨訪等,不同類型的科研項目可選擇不同的隨訪類型。每一種隨訪類型都可以自定義隨訪流程,隨訪流程設計界面如圖6所示。隨訪流程是基于用戶常用的5種場景建立數據模型:(1)基于開始時間,完全按計劃時間隨訪;(2)基于開始時間,根據實際隨訪時間調整計劃隨訪;(3)本次隨訪完成后,指定下次隨訪內容和時間;(4)隨到隨訪;(5)第一個階段按計劃隨訪,第二個階段隨到隨訪。由于每個隨訪數據模型差異較大,采用JSON(JavaScript object notation)存儲和傳遞,后臺業務處理層通過對象反射機制識別隨訪模型并計算隨訪時間計劃和表單綁定,從而對每個病種患者生成隨訪日期排程。

圖6 隨訪流程設計界面

2.2.2 病例管理模塊

2.2.2.1 病例入組

系統支持利用大數據平臺上的病歷檢索引擎查詢大數據資源池的臨床數據,查詢符合條件的專病病例進行批量入組。大數據檢索的建立,可以實現在千萬份病例中的秒級查詢,如圖7所示。

圖7 大數據病歷檢索引擎界面

系統還支持其他多種入組方式:HIS直接入組、手工通過病歷號入組、批量導入病歷號入組等。系統通過Web Service方式根據病歷號、醫院編碼獲取基本信息;通過JQuey綁定驗證函數對姓名、性別、身份證號等字段進行驗證,病例具有唯一性驗證,重復病例不入組。病例入組后系統根據隨訪流程自動生成該病例的隨訪計劃。在病例列表清單中可配置顯示數據表單的填寫率,以提醒科研工作者及時進行隨訪工作。病例入組和列表界面如圖8所示。

圖8 病例入組和列表界面

2.2.2.2 基線數據采集

將設計完成的CRF導入基線數據采集模塊,如圖9所示。根據基線數據的要求輸入相應的患者唯一ID、訪視關聯就診ID和觀測階段3個基線條件,并將基線數據類型、基線值校驗、關聯校驗和規則校驗根據科研項目需求進行相應配置,系統提供的基線數據采集模塊自動調用標準的Web Service服務完成所有基線數據的采集。基線數據類型和基線值校驗可確保每一個單獨的基線數據質量,關聯校驗和規則校驗可進一步確保基線數據間的質量,如性別選擇“男”時,不顯示月經初潮年齡等。基線數據采集模塊將數據讀出、數據校驗、數據處理和數據寫入的完整流程按照系統要求實時記錄日志,并提供每一個細致步驟的查詢和分析。

圖9 基線數據采集界面

2.2.3 隨訪管理模塊

2.2.3.1 隨訪數據采集

系統提供人工采集和機器智能采集2種模式的隨訪數據采集。傳統的人工采集方式是科研人員根據所設定的計劃撥打隨訪電話,逐一問詢情況并完成CRF的數據填寫。機器智能采集提供話術管理、隨訪執行、語音識別處理和隨訪結果管理4個功能。科研人員在話術管理中設定隨訪的問詢流程和邏輯處理預案,通過系統提供的環境測試并保存。系統根據隨訪計劃,自動撥號并以保存的話術模板啟動人機交互的語音機器人完成隨訪。通過智能語音識別處理功能,使人機交互的對話信息形成對應的隨訪信息。最后,隨訪結果管理將隨訪信息按照CRF要求完成隨訪結果的自動填充。AI隨訪界面如圖10所示。所有機器智能采集的語音信息和文字數據均保存在大數據平臺的安全存儲環境中。隨訪結果管理還提供語音復播功能,便于科研人員對智能語音識別結果存疑時的復審和修正。

圖10 AI隨訪界面

2.2.3.2 訪視進度管理

系統提供全角度的訪視進度管理,在授權的科研項目組下所有患者的訪視進度和隨訪狀態以不同顏色區分顯示,如圖11所示。科研用戶可以根據參考點隨訪、無計劃隨訪、回顧性隨訪、觀測階段等不同的隨訪類型進行管理和查看,也可以根據研究方向自定義分組規則并管理滿足規則的患者當前的隨訪進度和狀態。系統提供已完成、窗口期內、窗口期外、超期、未指定方式5種隨訪狀態的查詢。根據不同的隨訪類型和狀態,訪視進度管理模塊還提供預警提醒和主動干預功能。預警提醒與大數據平臺的消息中心實時對接,將訪視的異常情況以消息方式實時推送給科研用戶,科研用戶可以使用主動干預功能,對訪視情況特殊的患者及時調整隨訪計劃和隨訪方式。

圖11 訪視進度總覽界面

2.2.4 數據利用管理模塊

數據利用管理模塊提供科研病種庫數據的查詢和導出,授權后的科研用戶可以以任意維度檢索和導出病種庫數據,CRF檢索和導出界面如圖12所示。不管是實時接入的基線業務數據,還是通過CRF采集的數據,在表單數據項組件的統一管理下,以元數據統一技術實現數據概念層的一致。科研用戶可以自定義組合各種檢索條件,也可以手動輸入結構化查詢語言(structured query language,SQL)進行檢索。所有檢索結果可以直接導出為Excel表格,也可以直接形成含有項目組權限的數據集供外部調用。系統還提供標準的軟件開發工具包(software development kit,SDK),第三方系統通過標準API與科研病種庫進行對接。為確保數據安全,防止惡意的SQL注入攻擊,系統優化SQL語句的智能拼接,并全面采用語言集成查詢(language-integrated query,LINQ)技術實現病種庫數據動態的查詢。

圖12 CRF檢索和導出界面

3 應用效果

3.1 整體情況

基于大數據平臺的科研病種庫系統于2020年5月在我院成功上線。醫院信息科統一規劃信息數據集成工作,負責整合臨床診療過程的信息數據,實現RDR數據集成和數據治理,在此基礎上培訓臨床科室使用本系統。臨床科室主導實施具體科研病種庫系統搭建,構建各自的科研項目數據庫。迄今為止,累計使用科室數量達45個,用戶600余個,累計項目數量達到110個,入組病例數達到80多萬例,優化了科研流程,提升了科研效率。同時,數個多中心病種庫正在開展,幾十家醫院參與共建。本系統由于嫁接在大數據平臺上,因此具有以下特點:

(1)全新的管理模式。系統支持對全院科研項目的統一集成管理。

(2)靈活的CRF定制。系統支持科研用戶自行配置數據表單,無需技術人員參與。

(3)全面的數據集成。系統支持從大數據平臺RDR自動獲取數據,不需轉錄,大大減少了科研工作量。大數據平臺的數據治理能力使得半結構化和非結構化的數據都能得到充分利用。

(4)精準的檢索入組設計。由于大數據平臺已經從電子病歷系統、HIS、檢驗系統等獲取了海量多維變量,可直接用于多條件檢索,因此通過大數據檢索引擎進行檢索入組,可以更精準地設計患者入組條件,使入組患者更加準確和完整。

(5)便捷的事件流程管理。系統關鍵事件可以是某次隨訪,可以是某次就診,甚至可以是某次服藥或者某次手術等,可靈活設置,支撐不同研究目的的科研項目。基線參考點時間可自定義選擇或者根據數據采集邏輯自動生成,通過時間線串聯各個關鍵事件節點,以更加直觀的方式展示患者從研究開始到結束全程的狀態轉變。

(6)可支撐多中心項目開展。B/S架構支持在院內跨專業共建科研病種庫系統,還支持互聯網的部署,支撐異地多中心科研項目的實施和管理。

(7)可支撐醫聯體數據自動接入。大數據平臺不僅集成了本院各系統數據,還集成了各領辦型醫聯體數據,因此對于聯盟內開展多中心研究時,其他醫院的數據也可實現自動采集,不需像互聯網多中心項目那樣通過手動錄入或者Excel表格導入來實現。

(8)科研病種庫的集成更有利于多學科科研的聯合開展。當全院科研應用都整合到科研病種庫系統時,此系統集成的數據不僅能支撐單科室、單項目的科研統計分析,還能實現全院科研數據的共享應用,支撐臨床多學科聯合科研。

(9)大數據平臺上的挖掘系統可支撐病種庫數據的數據分析和數據挖掘。科研病種庫的數據可直接導入到數據挖掘系統,該系統集成了常用的統計方法和挖掘工具,方便項目組中的統計師和數據科學家開展模型開發、算法開發工作,醫工結合,形成的統計模型和挖掘模型還可作為知識存儲到知識庫,作為知識積累和傳遞的途徑。

3.2 案例分享

2018年初,國家心血管病中心發布《中國心血管病報告2017(概要)》。據推算,我國心血管病現患人數2.9億,心血管病死亡占居民疾病死亡構成40%以上,居所有病種首位,高于腫瘤及其他疾病[14]。而急性心肌梗死(acute myocardial infarction,AMI)(以下簡稱“心梗”)是冠狀動脈急性、持續性缺血缺氧所引起的心肌壞死。臨床上多有劇烈而持久的胸骨后疼痛,可并發心律失常、休克或心力衰竭,常可危及生命。為盡早發現心梗事件和降低心梗風險,亟須開發一種基于AI的心梗風險預測輔助決策系統,通過該系統,能夠對所有住院患者,特別是非心血管專科的住院患者即時評估預警,以支撐一體化、規范化、統籌化地開展院內心梗高危患者信息匯報及預警、病情主動監控、中心調度指揮、救治信息反饋以及數據匯總分析、救護質量控制工作,以減少院內急性心梗事件的發生,提升救治率,從而改善預后。

該系統的開發依托大數據平臺上的科研病種庫構建心梗患者數據庫,通過大數據病例檢索引擎,查詢RDR數據資源池中診斷關鍵詞包含為心梗、心肌梗死的患者,將查詢到的10 937例患者入組入庫。通過病史、醫囑等將患者劃分為心梗首發患者、心梗復發患者以及1∶1隨機抽取的非心梗對照患者,在心梗患者數據庫中建立3個項目子組,分別為心梗復發組、心梗新發組、非心梗患者組。隨后設計臨床CRF,通過RDR的臨床數據資源中心自動抓取基本信息、診斷信息、手術信息等數據,完成多維特征的數據匯集。最后利用科研病種庫系統的綜合查詢功能,查詢患者維度特征,將數據導出到數據挖掘系統進行機器學習建模。隨著時間的推進,將更多符合條件的患者自動納入病種庫,對已有模型進行增量訓練,使模型的準確度不斷提高。該項目的開展很好地驗證了基于大數據平臺的科研病種庫系統的應用效果。

4 結語

基于大數據平臺的科研病種庫系統可支撐臨床回顧性研究與前瞻性研究,集AI隨訪和大數據采集于一體,可全方面覆蓋臨床科研需求,在實際應用中取得了良好的效果,但仍然存在一些不足。例如,在數據采集方式方面,AI隨訪無論是在語音識別準確率還是在交互智能化方面依然有進步的空間;在數據采集內容方面,大數據平臺雖然已經能夠提供高維度和及時穩定的數據支持,但目前還不能精準實現電子病歷文本數據結構化,仍需用戶進行一定程度的結構化處理;在系統功能方面,還未能實現移動端的部署以支撐更多場景的應用。基于大數據平臺的科研病種庫系統還將繼續進行優化,通過移動端、PC端實現多場景的訪問。此外,還需將影像數據、音頻數據、非結構化數據等多源異構數據納入系統,完善多渠道的自動采集方式,最終實現多模態科研病種庫系統的應用。

猜你喜歡
系統管理
棗前期管理再好,后期管不好,前功盡棄
今日農業(2022年15期)2022-09-20 06:56:20
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
基于PowerPC+FPGA顯示系統
加強土木工程造價的控制與管理
如何加強土木工程造價的控制與管理
半沸制皂系統(下)
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
“這下管理創新了!等7則
雜文月刊(2016年1期)2016-02-11 10:35:51
主站蜘蛛池模板: 国产成人免费高清AⅤ| 亚洲网综合| 九九热免费在线视频| 免费播放毛片| 波多野结衣第一页| 爽爽影院十八禁在线观看| 亚洲成人一区二区三区| 亚洲日产2021三区在线| 国产三级精品三级在线观看| 香蕉eeww99国产精选播放| 色悠久久综合| 欧美激情视频一区二区三区免费| 国产免费观看av大片的网站| 亚洲国内精品自在自线官| 国内精品自在自线视频香蕉| 国产美女在线免费观看| 黑色丝袜高跟国产在线91| 夜夜爽免费视频| 免费毛片a| 91精选国产大片| 国产精品私拍在线爆乳| 狠狠色丁香婷婷综合| 国产女人水多毛片18| 91麻豆精品国产高清在线| 婷婷伊人五月| 18禁不卡免费网站| av在线无码浏览| 日韩A∨精品日韩精品无码| 一本色道久久88综合日韩精品| 99re免费视频| 好紧太爽了视频免费无码| 少妇精品在线| 亚洲va欧美ⅴa国产va影院| 国产亚洲欧美日韩在线一区二区三区| 日韩一区二区三免费高清| 欧美不卡在线视频| 国产亚洲高清视频| 波多野结衣在线一区二区| 国产午夜福利亚洲第一| 国产大片喷水在线在线视频 | 国产91高清视频| 精品国产中文一级毛片在线看| 成人免费网站久久久| 中文字幕无码中文字幕有码在线| 国产精鲁鲁网在线视频| 午夜精品久久久久久久无码软件| 欧美午夜视频在线| 一区二区理伦视频| 亚洲成a人片7777| 亚洲热线99精品视频| 91无码人妻精品一区| 国产成人午夜福利免费无码r| 久久国产精品国产自线拍| 亚洲视频一区| 久草性视频| 71pao成人国产永久免费视频| 亚洲国产高清精品线久久| 久久国产拍爱| 亚洲一级毛片在线播放| 亚洲国产成人久久精品软件| 一级毛片免费的| 亚洲va在线∨a天堂va欧美va| 亚洲精品大秀视频| 国产成人AV男人的天堂| 亚洲国产成熟视频在线多多| 亚洲人成日本在线观看| 久久久久夜色精品波多野结衣| a级毛片网| 九色视频线上播放| 毛片免费试看| 亚洲成aⅴ人在线观看| 日韩毛片在线播放| 麻豆精品在线视频| 狠狠ⅴ日韩v欧美v天堂| 日本中文字幕久久网站| 亚洲无码视频一区二区三区 | 免费AV在线播放观看18禁强制| 日本少妇又色又爽又高潮| 日韩欧美国产成人| 国产午夜人做人免费视频| 91精品日韩人妻无码久久| 久久综合国产乱子免费|