周 英 魏玉瓊 施 宇 張 曼 帥 文 何 萍
(同濟大學附屬第一婦嬰保健院 上海 201204) (萬達信息股份有限公司上海 201112) (同濟大學附屬第一婦嬰保健院 上海 201204) (上海申康醫院發展中心 上海 200041)
大數據時代各行各業產生并積累大量數據。醫院數據來源多樣、標準化程度低、質量不一,且分析挖掘技術水平較低,對醫療大數據利用有較大影響。為解決婦嬰各業務系統之間數據交換與分析難題,建立面向患者全程管理的婦嬰數據中臺,利用統一接口將醫院海量數據接入,分類處理后對標準化數據進行存儲,形成大數據資產。利用智能算法集中分析數據,將數據模型按照應用要求進行服務封裝,最終高效、快捷地輸出給醫院。本文基于數據中臺分析總結上海市第一婦嬰保健院分時段預約診療服務及應用效果,得出分時段預約診療服務改善門診就診環境,縮短患者候診時間,取得顯著應用成效。

圖1 數據中臺架構
2.1.1 基礎設施層 數據中臺的基礎支撐,提供構建平臺所需的軟硬件設備,包括防火墻、交換機、存儲器、服務器等。
2.1.2 數據層 包含醫院多種系統數據源,采用數據同步、結構化、清洗等多個步驟對多源數據進行規范化。
2.1.3 數據匯聚層 對指標定義、業務口徑、技術口徑、指標計算進行嚴格規范,保證數據指標準確性,對結構化、半結構化和非結構化數據進行清洗和轉換,最終使用Hadoop、HDFS、Redis等大數據存儲和計算工具對多源數據進行匯聚。
2.1.4 數據服務層 用于不同主題和場景的數據應用服務搭建,為實現數據中臺各類應用服務的智能化集成與管理,采用面向服務架構(Service Oriented Architecture,SOA)的企業服務總線(Enterprise Services Bus,ESB)集成架構[5],以接口形式對外服務,將計算好的數據根據需要封裝成接口服務于數據產品以及各個產品線使用,其中計算層通過統計分析和算法模型對數據進行深入挖掘分析,為數據服務層產生有價值的中間計算結果。最終在ESB應用集成基礎平臺上經過數據應用服務包裝,實時展現各項大數據分析指標結果,為各部門臨床應用、運營管理、輔助決策提供參考意見。
在數據中臺建設過程中,按照原國家衛計委《醫院信息系統基本功能規范》相關規定,嚴格遵守國標、行業標準及部標數據標準,補充各項業務數據標準,強化數據標準化管理制度,保證數據交換共享的規范性、完整性和可靠性,通過采用本體映射和自然語言處理(Natural Language Processing,NLP)等方式對疾病診斷、實驗室檢查、癥狀體征、病歷形態學、手術與操作、體格檢查、給藥途徑與頻次、單位、藥品名稱等實現數據標準化和結構化。詞法分析能識別出文本串中的基本詞匯(分詞),對這些詞匯進行重組、標注組合后詞匯詞性,進一步識別出命名實體;依存句法分析利用句子中詞與詞之間的依存關系來表示詞語句法結構信息,用樹狀結構來表示整句結構;詞向量表示可查詢詞匯詞向量,實現文本的可計算;詞義與短文本相似度是判斷兩個給定詞語或文本的語義相似度。
2.3.1 概述 數據資產化的本質是要有足夠的顆粒度和維度,直接用于業務場景,如患者、醫院、設備畫像。通過業務反推和基于患者信息聚合衍生的方式,形成疾病數據模型和運營模型。基于患者信息聚合衍生,包括疾病診斷、實驗室檢查、癥狀體征、病歷形態學、手術與操作、體格檢查、給藥途徑與頻次、藥品名稱等。
2.3.2 醫院業務需求 輔助決策支持,基于疾病數據的診療推薦;臨床質量管理,通過患者分類和疾病數據的統計分析;病歷質控/病案首頁,通過患者分類評價疾病數據的全面性和合理性;科研項目,基于疾病數據的展示與搜索;精細化運行,根據疾病數據和醫院運營數據進行描述與分析。
2.3.3 關鍵數據模型 疾病數據模型(專科維度的患者數據及其衍生數據;與疾病關聯的組學數據等);疾病推理數據模型(患者分類;重要事件,如不良反應、并發癥、結局等;表型等);醫院基本信息(地區、等級、床位數、科室、醫生數量等);醫院運營數據模型(預約、門診、住院人次及手術、費用數量等)。
2.4.1 知識庫 包括3部分。一是通用知識,包括常見的藥品知識檢驗、檢查知識;二是模塊化疾病知識,包括篩查診斷手術和操作指引知識;三是疾病知識,包括疾病指南和專家共識。以國際SNOMED、LOINC等為典范,以臨床需求為基礎,以專病為粒度,推進術語庫建設與使用。
2.4.2 指標標準管理體系 包括5部分。一是流行病學數據,建立篩查、并發癥、不良反應、預后指標;二是臨床路徑和指南,設定病種診療流程指標;三是醫院和科室質量標準,醫院對不同病種設立臨床質量管理要求;四是國家對重大疾病的要求,國家根據國民健康要求,設定重大疾病管理要求;五是績效管理與按疾病診斷相關分組(Diagnosis Related Group System,DRGs),設定醫院運營指標。
2.5.1 基本概念 開放應用程序接口(Application Program Interface,API)是通過對API網關的訪問來獲取服務響應結果,即通過API網關代理轉發請求到后端服務。與傳統的服務請求相比,增加新的網關層用于安全校驗、流量控制、應用鑒權等公共服務。
2.5.2 優點 一是簡化管理,對接、排錯更簡單、快速,減少數據治理工作量;二是數據安全,只需提供業務所需最小級,減少不必要的數據暴露,進行統一脫敏轉化,從而更好地保護患者隱私和醫院數據資產。開放API與傳統服務請求相比,可以避免對后端服務的惡意攻擊。
3.1.1 實驗描述 未實行分時段預約時,門診大廳擠滿患者,候診時間較長[6-7]。上海市第一婦嬰保健院于2018年4月實施門診分時段預約診療服務,覆蓋專家門診、普通門診和部分醫技科室,患者根據自身需求選擇不同時間段來院錯峰就診。以專家門診、產前復診、婦科門診、B超檢查為例,現基于數據中臺,利用醫院業務數據對比分析其分時段預約實施前后的患者候診時間。時間取自每日8-17點,分為8個預約區間。分時段預約實施前的時間范圍取2017年5月1日-10月31日,樣本數量172 858個;實施后的時間范圍取2018年5月1日-10月31日,樣本數量176 279個。
3.1.2 結果 實施前后患者候診時間實驗對比結果,見表1。可以看出原本候診時間很長的產前復診在分時段預約實施后候診時間大幅減少,改善患者就醫體驗。其他3個科室類別候診時間也有較大幅度減少,成效顯著。

表1 實施前后患者候診時間變化(分鐘)
實施分時段預約以來,各預約區間患者候診時間顯著減少,患者可根據自身需求有計劃地安排就醫時間,錯峰就診,極大改善就醫體驗,同時為醫院分流患者,解決門診擁擠問題,構建有序的就醫環境[8-9]。
數據中臺基本理念是將所有數據匯聚到數據中臺,每個應用(包括指標、分析、畫像、大數據類)均從數據中臺獲取數據。強調數據全面性以及數據中臺組織、應用組織之間的協作關系。相較于數據倉庫,其具有以下優勢:整體規劃、統一建設;不做重復性數據工作,所有數據在一個整體模型操作;綜合收益最大化,數據應用開發效率更高。在數據中臺逐步擴大數據應用過程中還需要完善方法論與工具支撐、業務認同、管理支撐。
大數據生態的核心是大數據,大數據的核心是數據共享。數據共享可以提供各類數據服務,實現數據高效調用。數據中臺整合醫院系統和業務數據,統一數據質量和口徑,開放API服務數據中臺,提高數據挖掘、更新、使用效率。
通過松耦合的數據服務使業務復用。數據中臺通過重新編排、組合算法可以滿足服務接口響應業務的基本需求,可以較低成本投入來構建新的前端業務,支持快速試錯。
基于數據存儲、數據整合、算法模型、數據應用服務等核心要素構建的數據中臺,打破各業務系統之間的數據壁壘,有效整合和利用醫院業務數據,實現數據共享。本文對基于數據中臺的分時段預約診療服務進行分析,結果顯示分時段預約診療服務有較好的應用成效,改善患者就診環境。未來將繼續利用數據中臺優勢,創新更多服務于患者的數據應用,使患者獲得更好的就醫體驗。