【作 者】毛中亮,馮莉,婁景盛,曹江北,米衛東
1 中國人民解放軍總醫院 信息科,北京市,100853
2 中國人民解放軍總醫院 麻醉科,北京市,100853
基于我院(解放軍總醫院)在老年醫學和老年圍術期診療方面的優勢和特長,以“老年患者圍手術期管理綜合技術方案的研究”為支撐,擬建立完善的圍術期多中心數據中心(下文簡稱“數據中心”),以數據中心為支撐對來源于多中心的圍術期患者數據進行全面的統計分析,從多方面、多角度得出更符合國人的圍術期相關并發癥的預防與控制臨床指南,制定更加有效的臨床診治決策和具有衛生經濟學參考價值的政策[1]。
數據中心由18家醫院組成,基于醫療數據安全考量,現階段不允許直接基于互聯網傳輸醫療數據,因此考慮到各醫院的實際情況與網絡安全技術的發展前景,數據中心的整體物理架構如圖1所示。

圖1 物理架構圖Fig.1 Physical architecture diagram
數據中心以我院圍術期數據中心及隨訪數據中心為主體,包括其他醫院內網建立的圍術期數據庫,以及在互聯網上建立的擬匯集各醫院數據的多中心圍術期數據中心與多中心隨訪數據中心。各醫院統一通過基于互聯網的多中心圍術期隨訪平臺采集患者隨訪數據傳輸至多中心隨訪數據中心。同時利用數據擺渡的方式將醫療數據傳輸至數據中心存儲設備中。未來當網絡安全技術的發展滿足醫療數據安全管理要求時,各醫院可通過互聯網將醫療數據與隨訪數據統一傳輸至基于互聯網的圍術期多中心數據中心。
基于數據中心的需求分析與功能定位,同時考慮到組成數據中心的醫院之間產生的醫療信息多源、異構、格式不統一的現狀[2],我們提出了基于各醫院已有信息化體系的技術架構方案,如圖2所示。

圖2 整體技術架構Fig.2 Overall technical architecture diagram
各醫院以信息科或合作公司為依托,以《圍術期數據規范》為依據,利用KETTLE、SISS、WebService等數據ETL工具、組件或技術方式獲取圍術期患者醫療數據,形成數據文件,數據文件支持TXT、XLS、CSV等多種格式。數據文件首先導入醫療元數據庫(又稱前置庫),經過集成、清洗、質量控制、規范化、標準化、歸一化等相關數據治理工作后導入醫療數據科研庫。醫療數據科研庫與隨訪數據庫中的數據進行整合,形成患者完整的數據鏈,數據治理完成后用戶可在數據中心的支撐下進行數據檢索、隊列創建、特征提取、數據挖掘與探索分析等工作,亦可借助第三方統計分析軟件工具,完成課題研究、成果轉化等工作。
科研大數據應用平臺基于.Net框架,采用B/S架構、MS SQL Server 2016 企業版數據庫。Web端應用采用MVC開發模式,應用分層架構,如圖3所示。

圖3 應用分層架構Fig.3 Hierarchical architecture diagram
表現層:采用ASP.Net MVC5.0+Kendo UI+Jquery的技術實現方式,主要負責用戶交互和結果顯示。其中控制模塊主要負責系統的訪問控制、數據加載和注銷,是系統的核心控制單元。 模型層:實現和數據庫的實體映射以及根據業務需要自定義實體。
業務抽象層:定義各個業務接口。
業務實現層:實現系統的主要業務邏輯,是系統主要的運算單元。
數據訪問層:實現靜態數據和數據庫數據的持久化管理,為業務層提供數據服務。
通用工具模塊:為整個系統提供支持。
訪問控制體系從安全訪問數據的總體設計思路出發,將訪問控制抽象表示成通用的框架模型,包括瀏覽器終端、數據視圖、訪問控制器、實體模型、數據庫等多個部分,通過訪問控制模型為個性化安全訪問數據提供一種通用方法,以滿足數據中心在訪問控制上針對不同需求、不同開放等級的信息訪問控制和授權等具體要求。訪問控制體系邏輯結構設計,如圖4所示。

圖4 訪問控制體系Fig.4 Access control system diagram
為滿足中心建設初期基本業務運行需要,同時考慮到項目建設初期投入經費有限的實際,為充分借鑒合作公司在湘雅三院、南方醫科大等醫院的數據治理經驗,加快項目進度,保障項目質量,我院圍術期主體數據中心服務器部署架構,如圖5所示。

圖5 服務器部署Fig.5 Server deployment diagram
主體數據中心整體采用傳統架構物理機方案[3],采用此方案的主要考量為其性能穩定,合作公司能順利遷移數據治理的經驗,同時避免采用新技術帶來的技術挑戰導致項目進度受阻。當然傳統架構物理機方案容易造成資源浪費、可擴展性差,因此隨著數據中心對于服務器利用效率、可靠性和可擴展性的需求不斷提升,服務器架構升級的需求也將日益得到重視,未來數據中心將隨著應用的推進,采用更符合實際及發展需要的技術架構。
構建數據中心,核心工作在于數據治理,數據治理是一項長期、復雜的工作,涉及到組織體系、標準體系、流程體系、技術體系和評價體系五方面,包含數據標準、數據質量、數據源、數據安全等多個方面的內容[4]。由于醫院各科室的信息化發展和建設水平并不均衡,具體表現為:一各醫院異構系統多;二數據質量層次不齊;三數據交換和共享困難;數據中心數據治理工作面臨著重大挑戰[5]。因此數據中心建立了以公司技術人員為主,臨床醫師為輔,醫院信息科協助的數據治理組織體系;以《圍術期數據規范》《國家衛生行業標準WS445.12-20148》《國家疾病分類ICD_10》《NCCN臨床實踐指南》等多個標準形成既滿足當前實際需求又著眼于未來與國家及國際標準接軌的標準體系;建立了以計算機自動化數據治理為主,技術人員干預為輔,臨床科研人員數據稽查,不斷補充完善治理規則的數據治理流程體系;建立了以自主研發數據治理軟件、SQL Server 腳本技術為主,包括元數據管理、主數據管理、數據標準管理、數據質量管理和數據安全管理的數據治理技術體系;基于真實數據存在的大量缺失值,大量的噪音、異常點的分析,減少數據質量對挖據出有效信息和后續的統計分析造成困擾,我們通過一系列數據預處理,提高數據的質量。具體包括:①數據格式轉化:例如文本類型轉化為數值類型;②數據清洗:處理無效及冗余數據;③數據計算:例如“就診年齡”;④數據標準化:不規范數據轉換為標準化數據存儲;⑤同義詞及歸一:建立疾病、癥狀、藥品、手術、部位同義詞詞庫,歸一疾??;⑥數據填補:通過特定計算規則填補原始數據缺失[6]。建立了以完整性、一致性、規范性、關聯性、準確性、及時性、有效性為評測指標的數據質量評價體系[7]。從管理上,嚴格遵循醫院數據安全管理制度,培養全員數據安全意識;從技術上,保障數據的存儲安全、傳輸安全和接口安全等[8]。總之,從管理和技術兩方面建立數據安全保障體系。
圍術期隨訪平臺針對18家醫院圍術期患者隨訪需求設計,具備用戶管理、機構管理功能、隨訪表單管理功能;隨訪表單靈活配置功能;項目模板、文檔管理功能;病例信息管理功能;隨訪計劃管理功能;數據導入、導出;高級檢索、指標曲線等功能;可以日歷的形式展示患者隨訪進度及完成情況;具備數據質疑功能,數據審核員可對患者隨訪數據進行質疑,保障隨訪數據的質量。
科研大數據應用平臺可展示患者全方位數據視圖,包括醫療數據和隨訪數據。具備復雜檢索功能,可對檢索結果按任意字段進行排序。用戶可在平臺上基于納排規則建立與管理研究隊列,并進行相關特征值提取、標注不同指標;可在平臺上進行不同指標對比和查找數據隊列差異化內容;進行基準時間的規則設定,按基準時間的時間順序導出數據;通過參數配置,尋找數據隊列的對照組;進行患者診療數據的全程追溯;對研究特征數據進行挖掘與探索,以及常規的統計分析操作,復雜的統計分析功能可借助SAS、SPSS等第三方統計分析軟件實現。
現階段,數據中心已完成互聯網、我院醫療網數據中心的建設與部署,已完成互聯網患者隨訪平臺及科研大數據應用平臺的建設與部署,隨訪平臺及科研大數據應用平臺已在解放軍總醫院等18家醫院投入使用,已完成我院2008年1月1日至2018年12月31日54萬住院手術患者醫療數據的導入工作,各醫院已完成八千多例患者隨訪數據采集工作,并已完成入庫數據的數據治理工作,數據中心現已開展科研課題數據研究的支撐工作。
數據中心作為“老年患者圍手術期管理綜合技術方案的研究”項目的核心中樞,保障了“老年患者圍手術期管理綜合技術方案的研究”課題的順利進行,同時,數據中心整合了各醫院圍術期的數據資源,建立圍術期統一的數據標準,提高了圍術期的數據質量,實現了各醫院之間的數據交流和共享[9]。雖然現階段數據中心處于初建階段,但是數據中心未來將成為圍術期復雜海量臨床數據采集、管理和綜合利用的平臺,為“真實世界臨床科研范式”提供技術支撐,為利用臨床大數據實現臨床科研變革提供有力工具。