重慶三峽醫藥高等專科學校 向波 鄭代坤
區域健康醫療大數據平臺通過對健康數據進行數據挖掘數據分析,提高健康醫療數據的再利用價值。設計健康醫療大數據平臺的系統架構,探討平臺的環境構建,采用Hadoop架構和軟件生態圈,分析健康醫療大數據平臺的數據采集模式、數據標準,設計大數據分析和應用系統功能。
近年來,健康醫療大數據發展迅速,其應用受到社會各方越來愈多的關注和重視。國家將健康醫療大數據作為重要基礎性戰略資源的定位,根據國家的政策導向和激勵,全國各個地方紛紛建設區域健康醫療大數據平臺或健康醫療大數據中心,為本區域的健康醫療行業提供大數據技術和應用服務。本項目設計在區域“智慧城市”建設大框架下建設區域健康大數據平臺,實現有效采集本區域健康醫療數據,對匯聚數據進行治理和集成,數據共享應用[1,2]。
區域健康醫療大數據平臺的整體系統架構采用當前流行的大數據技術模式,系統框架設計如圖1所示。

圖1 系統架構設計Fig.1 System architecture desig
健康大數據平臺的系統環境的設計,主要包括物理硬件系統和軟件系統兩部分。系統環境設計要考慮大數據平臺的技術、數據存儲模式、數據計算模式,同時要重點關注平臺的易擴充性。綜合技術調研和發展趨勢等各種因素,區域健康醫療大數據平臺的系統環境采用現在流行的Hadoop架構和軟件生態圈[3]。
硬件系統包括大數據服務器集群、數據存儲設備、網絡設備、防火墻等。平臺采用了大數據標準集群模式,一個大數據集群單元采用Hadoop存儲架構,如圖2所示,平臺整體物理系統根據數據存儲量和數據計算處理量,可集成設置多個大數據集群。

圖2 Hadoop存儲集群Fig.2 Hadoop storage cluster
軟件系統包括大數據系統軟件、虛擬化軟件、大數據技術工具軟件、數據庫管理系統和數據庫處理軟件等。軟件系統采用Hadoop生態和Spark生態組件,軟件基于Apache開源社區。主要包括HDFS、HBase、Yarn、MapReduce、Hive、Zookeeper、Flume、Kafka、Redis、Storm、MongoDB等。
健康醫療數據采集來源多樣化。它的采集接口要求能夠實現數據接入、數據采集、數據治理、數據服務和數據安全等功能模塊。
健康醫療數據的結構也是多樣化,例如有結構化數據、非結構化數據等多種形式。在對數據處理前需要對采集的數據進行標準化處理,數據標準要能實現多種結構數據的統一,完成集中式、分布式等多種模式健康醫療數據的統一數據建模。
在匯聚存儲海量數據基礎上構建多個健康醫療大數據的分析系統,包括公共衛生大數據篩查和分析、基于電子病歷的病癥相關度大數據分析、慢病大數據分析、青少年健康大數據分析(學生)、婦幼大數據分析、健康產業大數據分析、基于區域環境因素與居民健康相關度大數據分析等。如圖3所示。重點舉例介紹如下:

圖3 健康醫療大數據分析系統Fig.3 Health care big data analysis system
構建相關專題數據庫,從各個維度進行統計分析專題服務,支撐相關的數據應用提供服務。統計分析系統能實現以下功能:(1)以數據來源于電子健康檔案、電子病歷、醫學影像和檢驗數據等為主的健康醫療服務數據統計分析。(2)數據來源于多種類型的醫療保險數據統計分析。(3)數據來源于突發公共衛生事件監測數據、傳染病報告數據等公共衛生系統數據統計分析。(4)數據來源于居民在各類藥房購買相關藥品等數據統計分析。(5)數據來源于區域相關地域內的空氣污染物、氣候狀況等環境和健康相關聯數據統計分析。
構建區域內的人口基礎信息庫,例如包含居民的性別、年齡、職業等信息[4]。通過統計和數據挖掘算法,構建疾病發生和診療情況的基本規則,與人口基礎信息庫中的基礎信息數據進行關聯比對,通過關聯規則得出相應價值的醫學關系及規律模式。構建疾病風險評估預警指標,以此指標為基礎建立疾病流行預測分析算法模型,能夠實現根據時間、區域、人群特征等進行多維度分析重點病例特征,實現通過慢病、傳染病病例特征分析進行重點疾病的智能預警[5]。
構建業務數據庫,研發多個健康醫療大數據創新應用系統,實現健康醫療數據的挖掘開發利用,達到數據價值的最大化應用。應用系統包括健康醫療大數據科研系統、健康教育大數據AI系統、慢病管理及AI預警系統、公共衛生大數據篩查預測系統、政府健康政策決策系統、醫養結合康養大數據系統、區域健康醫療大數據白皮書、區域醫藥產業發展大數據系統等。如圖4所示。

圖4 健康醫療大數據應用系統Fig.4 Health care big data application system
區域健康大數據白皮書綜合服務系統要實現在區域海量的各種居民健康體檢指標數據、醫療診治數據、醫學影像和檢驗等檢查數據、區域流行病數據、區域的環境數據等基礎上建立區域健康指數,構建區域健康大數據白皮書,為政府、企業、科研機構、居民提供區域健康綜合咨詢指導服務。從例如人群、產業、環境等不同的維度,對不同行業、不同地域等人群,關注區域內的重點人群,進行區域內的重點疾病統計分析,結合區域內的主要健康問題,與區域內的環境狀況等元素進行綜合分析構建區域內的健康全景圖,應用大數據分析思想、方法和工具,從多個方面、多個層級來評估區域的健康整體狀況,以及預測區域內健康的發展趨勢能夠比較真實和全面的反映本地區的健康狀況、環境狀況,以及環境對健康的影響情況。
主要功能是針對區域內的公共衛生領域,對例如艾滋病、結核病等傳染疾病進行數據挖掘、大數據分析,預測發展趨勢。(1)構建公共衛生應急知識庫,包括基礎知識庫和防控應急知識庫,能夠提供相應的知識查詢功能。(2)構建疾病流行分析預警模型。(3)構建公共衛生大數據智能預測模型,對重點的相關癥候群、相關藥品、相關檢驗檢查項目等監測數據進行分析,實現動態、實時地可視化展示。
實現科研和健康教育的功能。構建健康醫療教育知識庫,主要包括例如常見慢病預防治療、運動康復、膳食營養、心理保健、中醫養生、急救處理、醫養咨詢等健康專業知識和常識,表現形式包括文字、圖片、動畫、短視頻等,通過網頁、載體包括網頁、手機App、微信小程序、微博等,或利用手環、平板、可穿戴物聯網終端設備等技術手段,讓教師、學生、醫護人員、社會群眾進行檢索、咨詢、健康知識普及學習,或者利用AI算法進行個性化的精準推送。此系統能發送可能擴大健康醫療大數據平臺的服務人群,增強服務效果,提高健康醫療大數據的社會價值。
醫養結合康養大數據系統是實現本地區居民康養的大數據管理。在社區基層醫院或衛生院等醫療機構建設居民健康檢測點,通過物聯網技術、健康檢測基礎設備和互聯網實現居民健康指標的數據采集,建立居民健康檢測檔案,構建相應的業務數據庫,將居民的健康檢測數據、醫療診治數據、電子病歷數據、日常藥品使用數據等進行大數據比對,建立相應的數據模型,設置健康預警值,及時推送健康指標給居民,指導居民的健康判斷。
區域健康醫療大數據平臺匯聚的海量數據包括健康數據、臨床醫療數據、檢驗檢查數據、藥品使用數據等涉及個人健康醫療信息,是特別敏感的數據,為了保護個人隱私和數據安全,在數據清洗階段就要做脫敏處理,在數據應用階段保障數據安全,需要通過三級等保認證設計,來確定數據安全和大數據平臺的安全性。
應用界面主要設計了以主頁、移動App、微信小程序、物聯網終端為主。主頁是區域健康醫療大數據平臺的門戶網站,主要實現平臺信息的發布和認證用戶的接口。
需要設計開發平臺的移動App、微信小程序,利于平臺各類用戶通過移動設備使用平臺。移動App也可以考慮為用戶主要的接口,主便用戶減小對使用環境的限制。
隨著國家層面大健康發展的政策導向,支持將云計算、大數據技術、人工智能技術、物聯網技術、AR增強現實技術等新一代信息技術應用到健康醫療領域的改革和發展中。健康醫療大數據的研究和應用,是對健康醫療行業的強力補充,能夠提供新的思想、技術和方法。
引用
[1] 國務院.關于促進和規范健康醫療大數據應用發展的指導意見[Z].2016.
[2] 重慶市市委.重慶市以大數據智能化為引領的創新驅動發展戰略行動計劃(2018-2020年) [Z].2018.
[3] 李偉,王士泉,于楠,等.區域健康醫療大數據平臺解決方案策劃與初步設計[J].醫療衛生裝備,2018(7):34-40.
[4] 解明.基于Hadoop的醫療健康檔案大數據平臺構建研究[J].電子世界,2020(10):82-83.
[5] 陳宇翔.智慧城市背景下健康大數據系統搭建探索[J].大眾標準化,2021(12):16-18.