谷靜怡+程建峰

一、檢+療+管理+反饋為一體的慢病管理模式
國內慢病管理的領域內教新的一種慢病管理模式即為慢病管理生態圈的構建,其具有:互動、大數據、人工智能、移動檢測、社群管理、公共服務、公益、資源共享等鮮明的特點,基于這些特色功能,使得慢病可防可控成為可能。在國家慢病防控體系的基礎上,將以各級綜合醫院、社區醫院為主,體檢機構、移動醫療廠商為輔的“檢+療+管理+反饋”的慢病服務體系。結合云服務綜合整理分析各環節醫療數據,與各環節共同構建可持續的慢病管理生態網。本模式的第一特色是“寓樂于醫”的設計理念,旨在讓患者在輕松愉快的狀態下進行自身的健康管理。第二特色是全面系統的健康管理,我們通過對合作醫院方提供的大數據進行縝密分析并且結合專家團隊的意見,制定了針對不同的年齡層健康管理方案,主要包括針對年輕用戶的習慣養成方案和針對中老年用戶的健康管理方案。第三特色是認知計算的切入點,本團隊通過終端平臺收集精準的人體數據,通過選取準確的數據挖掘工具和數據分析方法,對用戶的體征和行為習慣進行分析,并為之匹配相應的服務。本項目的終端目標是打造多種資源聚合,多重服務融合的app:疾病相關資訊+慢病管理+第三方硬件病情監測+醫院干預+公益服務。
二、慢病醫療數據的處理
海量醫療數據服務中存在大量的數據統計以及基于數據統計構建的功能服務,隨著服務需求的不斷提高,對統計的查詢響應時間提出了較高要求。同時,醫療數據數據量大、關聯性強、不同用戶對相同數據的請求不盡相同,這些都對存儲模型提出了很大的挑戰。本文提出了一種基于統計樹的海量醫療數據的快速統計方法,優化存儲模型,提升計算效率,高效的支持多樣化的醫療數據服務。
海量醫療數據挖掘平臺具有以下三個特點:第一,靈活性?;颊叩牟v檔案中新增檢測項,或增加新的醫療服務需求,無需大規模變動原有業務,造成系統重構。第二,可擴展性。平臺基于云計算架構,彈性存儲,綠色節能,具有較強的存儲可擴展性;同時,該架構靈活性強,層與層之間相對獨立,增強了其計算的可擴展性。第三,重用性。該架構將實時數據處理與批量數據處理有機結合,不僅適用于海量醫療數據的挖掘處理,同時可用于海量交通數據處理、海量物流數據處理等行業。
行政數據,主要包括從醫療支付方(醫療保險機構)或者醫療機構獲得的理賠信息等,通常涉及病人所使用的醫療服務、相關診斷信息、提供服務的醫療機構及時間地點、以及費用明細與支付情況。
臨床數據,包括從醫療機構獲得的電子病歷(EMR)、醫療影像數據、處方信息等。
體征數據,例如由檢測儀器測量所得的體重、血壓、血糖水平等信,以及飲食、運動、睡眠等自我跟蹤信息。隨著可穿戴設備及相關手機軟件的廣泛應用,此類數據量越來越大也越來越多元化。
個人及偏好數據,例如性別、年齡、職業等基本信息以及個人偏好、對產品和服務滿意度等主觀信息。
由于數據量大、種類繁雜,不同類型的數據之間會有交叉或者交集。例如處方數據,既可以從醫療機構的信息系統中獲得——即臨床數據的一種,也可以從醫療保險機構的理賠數據庫中找到——即理賠信息的一部分;又如血壓等信息既可以從隨身攜帶的便攜血壓計測量得到(體征數據),也可以在醫療機構的電子病歷中發現(臨床數據)。
綜合所構建的海量醫療數據挖掘平臺的層次模型、平臺系統的服務特點、數據存儲策略、數據處理流程各部分的設計原則,繪制出海量醫療數據挖掘平臺的設計框架如上圖所示。
業務層:業務層位于最上層。通過調用功能層單一服務接口,或多種服務接口組合,形成針對于患者、醫生、醫療機構、管理部門等不同對象的多樣化服務。其包括但不限于報表統計、實時在線查詢、臨床決策、疾控預警、患者行為分析等服務。
功能層:功能層位于服務層下面。其主要作用是作為服務接口層,平臺層通過多種處理方式計算所得的結果形成多樣化的服務接口,供業務層進行調用。其主要包括機器學習、深度挖掘、分析統計、實時查詢等功能。
平臺層:平臺層位于功能層之下,基礎層之上。主要功能是計算處理各種醫療和健康數據。包括原有系統數據的導入,實時數據流處理,批量數據處理系統以及用于數據挖掘的算法庫。能夠高效支撐實時離線多種數據處理需求。
基礎層:基礎層是平臺的最底層,提供海量醫療數據挖掘平臺運行的支撐平臺。其采用云計算架構,彈性存儲,靈活可擴展,便于對海量異構的醫療數據進行分布式存儲。在云平臺上部署有分布式文件系統HDFS,NoSQL 數據庫HBase以及MySQL數據庫等多種類型數據庫,保證復雜多樣的醫療數據存儲。基礎層的主要工作是管理和維護基礎硬件設備及數據存儲,保證平臺的高性能、高可用和高擴展。
異構復雜的海量醫療數據,實時接入Storm流數據處理系統,結合基于統計樹及增量計算的動態統計策略,實現數據融合并匯入基于云計算搭建的海量醫療數據挖掘平臺得到整合信息,通過深度學習、貝葉斯網絡、關聯規則等數據挖掘算法將信息轉化為知識,進而為不同對象提供實時精準的個性化數據服務。
實時數據的存儲和處理過程運用了統計樹的方法,使得后續基于統計的數據挖掘變得更為高效。
經存儲、處理后的數據形成了便于挖掘的整合信息,根據不同的醫療數據服務需求,選取適當的數據挖掘算法,本文選取了貝葉斯網絡及關聯規則算法分別實現了疾病與檢測參數的關聯性挖掘、疾病與疾病之間的關聯性挖掘。